Você está na página 1de 195

UNIVERSIDADE DE BRASLIA

FACULDADE DE ECONOMIA, ADMINISTRAO, CONTABILIDADE E CINCIA


DA INFORMAO E DOCUMENTAO FACE
DEPARTAMENTO DE CINCIA DA INFORMAO E DOCUMENTAO CID

Programa de PsGraduao em Cincia da Informao

Sistemas de Organizao do Conhecimento:


uma reflexo no contexto da
Cincia da Informao

ELIANA CARLAN

Braslia
2010

Sistemas de Organizao do Conhecimento:


uma reflexo no contexto da
Cincia da Informao

Eliana Carlan

Dissertao apresentada banca examinadora


como requisito parcial obteno do Ttulo de
Mestre em Cincia da Informao pelo Programa
de Ps-Graduao em Cincia da Informao do
Departamento de Cincia da Informao e
Documentao.

Orientadora: Prof. Dr. MARISA BRSCHER BASLIO MEDEIROS

Braslia
2010

Carlan, Eliana.
Sistemas de Organizao do Conhecimento: uma reflexo no contexto da Cincia da
Informao / Eliana Carlan. Braslia: UnB / Departamento de Cincia da Informao e
Documentao, 2010.
100 f. : Il. color. ; 30 cm.
Dissertao (Mestrado) Universidade de Braslia / Departamento de Cincia da
Informao e Documentao, 2010
Orientadora: Prof. Dr. Marisa Brscher Baslio Medeiros.
1. Sistemas de Organizao do Conhecimento. 2. Tesauro. 3. Taxonomia. 4.
Ontologia. 5. Teoria do conceito. 6. Teoria da classificao. 7. Terminologia. 8.
Lingustica. I. Ttulo.

Ficha catalogrfica elaborada pela autora. CRB-1: 2.200.

Ttulo: Sistemas de Organizao do Conhecimento: uma reflexo no contexto da Cincia da


Informao
Autor: Eliana Carlan
rea de concentrao: Transferncia da Informao
Linha de pesquisa: Arquitetura da Informao
Dissertao submetida Comisso Examinadora designada pelo Colegiado do Programa de
Ps-Graduao em Cincia da Informao do Departamento de Cincia da Informao e
Documentao da Universidade de Braslia como requisito parcial para obteno do ttulo de
Mestre em Cincia da Informao.

Dissertao aprovada em: 23 de fevereiro de 2010.


Banca Examinadora

_____________________________________________
Prof. Dr. Marisa Brscher Baslio Medeiros
Presidente (UnB/PPGCInf)

_____________________________________________
Prof. Dr. Dulce Maria Baptista
Membro Interno (UnB/PPGCInf)

_____________________________________________
Prof. Dr. Lgia Maria Arruda Caf
Membro Externo (UFSC/Florianpolis)

__________________________________________
Prof. Dr. Sofia Galvo Baptista
Suplente (UnB/PPGCInf)

Agradecimentos
minha famlia: meu marido Joo; meus filhos, Paulo, Pedro e Laura; meus pais Mariano e
Irene; e minhas irms, Kika e Marisa, por tudo que fazem por mim.
Professora Dr. Marisa Brscher, pelo apoio e incentivo, pelas oportunidades em sala de aula,
participaes em eventos, publicaes, pela orientao, pelas dicas valiosas e por todo meu
aprendizado.
Fernanda Moreno e Mariana Brandt, pelas dicas, discusses sobre o tema, trabalhos em grupo
e pela amizade.
A todos os professores do CID que contriburam para a minha formao.
Prof. Dr. Dulce Maria Baptista e Prof. Dr. Lgia Maria Arruda Caf, pelas sugestes e por
integrarem a banca.
Meu primo, Prof. Dr. Cludio Carlan pela fora e apoio.
Aos integrantes do grupo de pesquisa EROIC, especialmente Prof. Dr. Jaime Robredo, Auto
Jnior, Greyciane Lins e Fbio Teixeira .
Biblioteca Central da UnB e Biblioteca do IBICT, pelos servios do COMUT e acessos ao
acervo.
Marta e Jucilene, pelo empenho nos servios da secretaria da ps-graduao.
A todos que de alguma maneira contriburam para a realizao desta pesquisa.
E CAPES, pelo apoio financeiro.
Muito Obrigada, de corao!

What we call the beginning is often the end


And to make an end is to make a beginning.
The end is where we start from.
O que ns chamamos de comeo ,
muitas vezes, o fim
E fazer um fim fazer um comeo.
O fim, de onde ns comeamos.
T.S. Eliot, Little Gidding (1944)

Resumo
A presente pesquisa estuda os sistemas de organizao do conhecimento e a relao com as
bases tericas utilizadas na construo de tesauros, taxonomias, ontologias e sistemas de
classificao encontradas na literatura da rea de Cincia da Informao. Para tal estudo,
utiliza-se a metodologia de reviso de literatura, alm de pesquisa nas bases de dados da rea,
a fim de investigar a produo bibliogrfica sobre o tema, de 1998 at junho de 2009.
realizada reviso bibliogrfica na rea de organizao e representao do conhecimento,
especificamente relacionada com o desenvolvimento de tesauros, taxonomias, ontologias e
sistemas de classificao. Identifica um caminho terico comum para ser percorrido na
construo dos sistemas de organizao do conhecimento passando pela teoria da
classificao, teoria do conceito, os relacionamentos entre conceitos e os princpios da
Lingustica e Terminologia. A partir de amostra representativa da produo bibliogrfica
sobre o tema, faz-se a anlise nas suas caractersticas extrnsecas e intrnsecas. As primeiras,
relativas forma, incluem ano de publicao, autores, ttulo, publicao e palavras-chave. As
caractersticas intrnsecas abrangem a anlise de contedo dos documentos, respeitando a
fundamentao terica abordada na reviso de literatura. Conclui-se que os tesauros e os
sistemas de classificao so os mais citados na literatura sobre sistemas de organizao do
conhecimento, inclusive servindo de referncia terica para o desenvolvimento desses
sistemas. Apesar de contar com essa base terica proveniente dos estudos sobre tesauros e
classificaes com normas e padres relativos a esses dois sistemas reconhecidos
internacionalmente, evidencia-se a necessidade da consolidao de padres comuns para o
desenvolvimento dos diferentes tipos de SOC, na rea de Cincia da Informao. Aponta-se
para a necessidade de congregar os interesses multidisciplinares pela convergncia de
objetivos e, com isso, gerar melhores prticas de organizao e representao do
conhecimento.

Palavras-chave: Sistemas de Organizao do Conhecimento. Tesauros. Taxonomias.


Ontologias. Sistemas de Classificao.

Abstract
This research studies the knowledge organization systems (KOS) related to theories to build
thesaurus, taxonomies, ontologies and classification systems in the literature field of
Information Science. It uses the methodology of literature review and a research on the same
field databases in order to investigate the bibliographic production about the theme, from 1998
up to July 2009. A bibliographic research about knowledge organization and representation is
carried out, specifically related to the development of thesaurus, taxonomies, ontologies and
classification systems. It identifies the same theoretical way to build KOS through the
classification theory, concept theory, the relationship between the concepts and the foundation
of Linguistics and Terminology. Extrinsic and intrinsic characteristics were analysed from the
representative sample of the bibliographic production about KOS. The extrinsic analysis is
relative to form aspects, including the publication year, authors, title, publication and
keywords. The intrinsic analysis relates to content aspects through the subject analysis of the
documents following the theoretical foundations. The last chapter verifies that the thesaurus
and classification systems are the most quoted in the literature about KOS, being a theoretical
reference to the development of these systems based on the international standards and rules.
It highlights the importance of consolidating common standards to build different types of
KOS in the field of Information Science and shows the need of

gathering the

multidisciplinary interests linked by the same goals and also getting better practices in the
knowledge organization and representation.

Keywords: Knowledge Organization System. Thesaurus. Taxonomy. Ontology. Classification


Systems

LISTA DE ILUSTRAES

Lista de Figuras
Figura 1

Viso geral dos SOC de acordo com a estrutura e funo..........................38

Figura 2

Classificao...............................................................................................66

Figura 3

rvore de Porfrio.......................................................................................70

Figura 4

Tringulo conceitual...................................................................................79

Figura 5

Relao hierrquica partitiva......................................................................85

Figura 6

Sistema de conceitos polihierrquicos........................................................88

Lista de Quadros
Quadro 1

Sntese dos sistemas de classificao bibliogrfica....................................64

Quadro 2

Comparao de conceitos do ponto de vista da lgica formal....................83

Quadro 3

Categoria por predicao.............................................................................83

Quadro 4

Denominaes para relaes gnero-espcie e todo-parte..........................85

Quadro 5

Relaes associativas entre termos.............................................................87

Quadro 6

Nmero de registros das bases de dados pesquisadas...............................107

Quadro 7

Registros sem artigos................................................................................108

Quadro 8

Artigos sem autoria...................................................................................109

Quadro 9

Relatos de conferncias.............................................................................109

Quadro 10

Registros da base de dados Wilson e outras bases....................................110

Quadro 11

Documentos no publicados e/ou apresentaes de trabalhos..................111

Quadro 12

Documentos em lngua estrangeira...........................................................113

Quadro 13

Amostra representativa da pesquisa..........................................................115

Quadro 14

Peridicos mais produtivos.......................................................................118

Quadro 15

Produtividade dos autores.........................................................................119

Quadro 16

Quadro resumo de autores e as bases de dados........................................121

Quadro 17

Incidncia de palavras-chave....................................................................122

Quadro 18

Palavras-chave com o termo knowledge...................................................123

Quadro 19

Palavras-chave com o termo information.................................................124

Quadro 20

Palavras-chave com o termo semantic.....................................................124

Quadro 21

Palavras-chave associadas aos SOC.........................................................125

Quadro 22

Nmero de ocorrncia de temas associados aos SOC..............................131

Lista de Grficos
Grfico 1

Nmero de publicaes por ano...............................................................117

Grfico 2

Incidncia em diferentes categorias de publicaes.................................118

Grfico 3

Nmero de publicaes por ano na anlise de contedo..........................127

Grfico 4

Nmero de citao dos tipos de SOC.......................................................128

Grfico 5

Nmero de citao por categorias da base terica....................................129

LISTA DE SIGLAS

ACM

Association for Computering Machinery

AGRIS

Association of Agricultural Information Specialists

ALISS

Association of Librarians and Information Professionals in the Social


Sciences

ANSI

American National Standard Institute

ASIST

American Society for Information Science & Technology

BDTD

Biblioteca Digital Brasileira de Teses e Dissertaes

BRAKOR

Barrington Report on Advanced Knowledge Organization and Retrieval

CC

Colon Classification

CB

Classificao de Bliss

CDD

Classificao Decimal de Dewey

CDU

Classificao Decimal Universal

CEB

Companhia de Energtica de Braslia

CICA

Companhia Industrial de Conservas Alimentcias

E-LIS

E-prints in Library and Information Science

EPC

Editorial Policy Committee

FID

Federao Internacional de Documentao

HTML

HyperText Marckup Language

IBICT

Instituto Brasileiro de Informao em Cincia e Tecnologia

IFLA

International Federation of Library Associations and Institutions

ISTA

Information Science & Technology Abstracts

ISO

International Organization for Standardization

ISKO

International Society for Knowledge Organization

KO

Knowledge Organization

KOS

Knowledge Organization System

LCC

Library of Congress Classification

LISA

Library and Information Science Abstracts

LISTA

Library, Information Science & Technology Abstracts with Full Text

MRF

Master Reference File

NASA
NISO

National Aeronautics and Space Administration


National Information Standards Organization

OC

Organizao do Conhecimento

OWL

Web Ontology Language

RDF

Resource Description Framework

SGML

Standard Generalized Markup Language

SKOS

Simple Knowledge Organization System

SOC

Sistema de Organizao do Conhecimento

SRI

Sistema de Recuperao de Informao

TCT

Teoria Comunicativa da Terminologia

TGT

Teoria Geral da Terminologia

UDCC

Universal Decimal Classification Consortium

UNESCO

United Nations Educational, Scientific and Cultural Organization

XML

eXtensible Markup Language

W3C

World Wide Web Consortium

WWW

World Wide Web

SUMRIO
1 CONTEXTUALIZAO..............................................................................................15
1.1 Introduo......................................................................................................................16
1.2 Definio do Problema..................................................................................................18
1.3 Questo de Pesquisa......................................................................................................19
1.4 Objetivos.......................................................................................................................20
1.4.1 Objetivo Geral............................................................................................................20
1.4.2 Objetivos Especficos.................................................................................................20
1.5 Justificativa....................................................................................................................20
2 REVISO DE LITERATURA......................................................................................23
2.1 Organizao e Representao do Conhecimento.....................................................24
2.2 Sistemas de Organizao do Conhecimento.............................................................28
2.2.1 Sistemas de Organizao do Conhecimento e a Web Semntica..............................35
2.2.2 Simple Knowledge Organization System SKOS....................................................35
2.2.3 Tipos de Sistemas de Organizao do Conhecimento................................................36
2.2.3.1 Lista de Termos.......................................................................................................36
2.2.3.2 Classificao e Categoria........................................................................................32
2.2.3.3 Lista de Relacionamentos.......................................................................................33
2.3 Tesauros........................................................................................................................40
2.4 Taxonomias...................................................................................................................45
2.5 Ontologias.....................................................................................................................51
2.6 Sistemas de Classificao............................................................................................57
2.6.1 Classificao Decimal de Dewey...............................................................................57
2.6.2 Classificao da Biblioteca do Congresso dos Estados Unidos.................................58
2.6.3 Classificao Decimal Universal................................................................................59
2.6.4 Classificao de Dois Pontos......................................................................................61
2.6.5 Classificao de Bliss.................................................................................................63
2.7 Teoria da Classificao................................................................................................66
2.7.1 Princpios de Hierarquia.............................................................................................69
2.7.2 Classificao Facetada...............................................................................................74
2.8 Conceitos e relaes entre conceitos..........................................................................78
2.8.1 Teoria do Conceito.....................................................................................................78

2.8.1.1 Conceito Individual e Conceito Geral....................................................................80


2.8.1.2 Intenso e Extenso do Conceito............................................................................81
2.8.2 Categorizao e Relaes entre Conceitos................................................................82
2.8.3 Sistemas de Conceitos Multidimensionais................................................................87
2.9 Lingustica, Terminologia e Sistemas de Organizao do Conhecimento.............89
2.9.1 Lingustica.................................................................................................................89
2.9.2 Terminologia..............................................................................................................90
2.9.3 Unidade Terminolgica.............................................................................................93
2.10 Consideraes da Reviso de Literatura................................................................97
3 PROCEDIMENTOS METODOLGICOS...............................................................98
3.1 Levantamento Bibliogrfico.......................................................................................100
3.2 Anlise e Interpretao dos Dados.............................................................................101
3.3 Bases de Dados...........................................................................................................103
4 ANLISE DOS DADOS..............................................................................................106
4.1 Definio do Universo da Pesquisa............................................................................107
4.2 Consideraes Acerca dos Resultados Encontrados nas Bases de Dados..................108
4.3 Anlise e Interpretao dos Dados..............................................................................116
4.3.1 Aspectos Extrnsecos ou de Forma..........................................................................116
4.3.1.1 Ano de publicao.................................................................................................117
4.3.1.2 Publicao.............................................................................................................117
4.3.1.3 Autores..................................................................................................................119
4.3.1.4 Palavras-chave......................................................................................................122
4.3.2 Aspectos intrnsecos ou de contedo.......................................................................126
5 CONSIDERAES FINAIS E TRABALHOS FUTUROS....................................133
5.1 Consideraes finais e sugestes de estudos futuros..................................................134
REFERNCIAS..............................................................................................................137
APNDICES...................................................................................................................145

Captulo 1
CONTEXTUALIZAO

16

1.1 Introduo

A ateno de uma gama de disciplinas vem sendo atrada pelos desafios impostos
pelos novos espaos informacionais no sentido de torn-los mais eficientes e efetivos. Dentre
esses desafios encontram-se aqueles relacionados organizao e recuperao de informaes
e s formas de representao e de categorizao do conhecimento.
Este trabalho insere-se nesse contexto, ao abordar como tema central a representao
do conhecimento por meio dos sistemas de organizao do conhecimento (SOC), os quais
abrangem todos os tipos de esquemas que organizam e representam o conhecimento, como
por exemplo, as classificaes, taxonomias, tesauros e ontologias.
Os SOC so sistemas conceituais semanticamente estruturados que contemplam
termos, definies, relacionamentos e propriedades dos conceitos. Na organizao e
recuperao da informao, os SOC cumprem o objetivo de padronizao terminolgica para
facilitar e orientar a indexao e os usurios. Quanto estrutura variam de um esquema
simples at o multidimensional, enquanto que suas funes incluem a eliminao da
ambiguidade, controle de sinnimos ou equivalentes e estabelecimento de relacionamentos
semnticos entre conceitos.
Por esta razo necessrio dialogar com a abordagem terica de algumas reas do
conhecimento na busca pela representao e, algumas vezes, na substituio do documento
em termos de seus aspectos temticos. Essa representao acontece pela identificao de
conceitos, sua expresso terminolgica e os relacionamentos entre os conceitos, o que leva
procura por um referencial terico na Teoria da Classificao, Teoria do Conceito, nos
relacionamentos entre conceitos, nos princpios da Lingustica e da Terminologia.
Esse referencial terico proporciona a fundamentao bsica na estrutura consistente
dos tesauros, taxonomias, ontologias e sistemas de classificao, para que eles possam
cumprir suas funes de organizao, recuperao de informao e obteno de resultados
satisfatrios. A construo destes sistemas feita a partir de escolhas de termos, conceitos,

17
classificao de termos, determinao de categorias, classes, subclasses, identificao de
caractersticas comuns e diferentes, propriedades ou atributos, o que faz disso a
fundamentao comum entre os sistemas.
Esta pesquisa tem a inteno de apontar os princpios tericos na construo de
tesauros, taxonomias, ontologias e sistemas de classificao com base na literatura da rea de
Cincia da Informao e nas opinies e relatos dos diversos autores desse campo do
conhecimento. Procura, ainda, relacionar esses fundamentos com os fundamentos tericos
mencionados em trabalhos tcnico-cientficos que foram publicados sobre o sistemas de
organizao do conhecimento, desde 1998 at 2009. Na tentativa de apontar a relao dos
estudos sobre SOC com a fundamentao terica empregada para o desenvolvimento de
tesauros, taxonomias, ontologias e sistemas de classificao, foram pesquisadas bases de
dados especficas da rea de Cincia da Informao e repositrios multidisciplinares.
O trabalho encontra-se estruturado da seguinte forma: no primeiro captulo, a
contextualizao da pesquisa, Seo 1.1 introduo, apresenta uma viso geral da pesquisa; na
Seo 1.2, definio do problema; na Seo 1.3 a questo de pesquisa; na Seo 1.4 e
subsees 1.4.1 e 1.4.2 os objetivos: geral e especficos e a justificativa na Seo 1.5.
No Captulo 2, reviso de literatura, a Seo 2.1 contempla abordagem sobre a
organizao e representao do conhecimento. A Seo 2.2 e subsees, caracterizam e
tipificam os sistemas de organizao do conhecimento, uma breve explicao dos SOC e o
ambiente da web semntica e dos SKOS. As Seo 2.3, Seo 2.4, Seo 2.5 e a Seo 2.6,
apresentam tesauros, taxonomias, ontologias e os sistemas de classificao, respectivamente.
A Seo 2.7 apresenta a teoria da classificao; na Seo 2.8 e subsees so tratados os
conceitos e relaes entre conceitos; a Seo 2.9 mostra a Lingustica, a Terminologia e os
SOC; e a Seo 2.10 as consideraes da reviso de literatura.
O Captulo 3, procedimentos metodolgicos, enfoca na Seo 3.1 o levantamento
bibliogrfico; Seo 3.2 a anlise e interpretao dos dados; Seo 3.3 as bases de dados
consultadas.

18
O Captulo 4 registra a anlise dos dados, na Seo 4.1 a definio do universo da
pesquisa; na Seo 4.2 as consideraes acerca dos resultados encontrados nas bases de dados
e na Seo 4.3 e subsees, a anlise e interpretao dos dados. E no Captulo 5 so
apresentadas as consideraes finais e sugestes de trabalhos futuros.

1.2 Definio do Problema

Um esquema bem elaborado na construo de SOC pea fundamental na obteno


da eficincia nas suas funes de organizao e recuperao de informao a fim de satisfazer
as necessidades dos usurios. A construo dos sistemas propostos neste trabalho: tesauros,
taxonomias, ontologias e os sistemas de classificao, envolve escolha de termos, conceitos,
classificao de termos, determinao de categorias, classes e subclasses. Para isso, preciso
identificar semelhanas e diferenas entre caractersticas, propriedades ou atributos dos
conceitos.
No entanto, os sistemas de organizao do conhecimento, por constituir-se uma nova
rea de pesquisa, no esto, ainda com os princpios tericos consolidados. Na contramo,
observa-se que a literatura sobre tesauros, taxonomias, ontologias e sistemas de classificao
apresenta princpios tericos para a elaborao desses instrumentos, porm, encontram-se
dispersos e individualizados. Em consequncia, torna-se difcil a realizao de pesquisas e a
formulao desses sistemas, uma vez que no existe uma teoria geral consolidada, nem
padres certificados que orientem os especialistas na construo de sistemas consistentes.
As imprecises terminolgicas, a falta de ferramentas de acesso adequadas para a
viabilizao do controle terminolgico (CAMPOS, 2007; DODEBEI, 2002; LANCASTER,
2004) e tambm, a ausncia de princpios metodolgicos e uma teoria geral para dar suporte
construo dos SOC, seja manual ou automaticamente (HJRLAND, 2007; CORCHO;
FERNNDEZ-LPEZ; GMEZ-PREZ, 2003; BREWSTER; WILKS, 2004), so
problemas apontados na literatura da rea. Com a soluo dessas questes, poderia obter-se
melhor qualidade na preciso e no tratamento das informaes garantindo maior satisfao na

19
recuperao das informaes.
As recentes experincias em construo, manuteno e reuso de ontologias, tesauros e
taxonomias tm demonstrado ser mais eficiente a adoo de um enfoque colaborativo. No
entanto, a comunicao entre os colaboradores, tais como os profissionais em TI,
bibliotecrios, web designers e especialistas em diversas reas do conhecimento difcil e
requer tempo. Isso porque existem vrias estratgias de raciocnio, diferentes lgicas e formas
de representao do conhecimento na elaborao dos SOC para fins da recuperao da
informao. No entanto, a existncia de princpios tericos comuns, na rea de Cincia da
Informao, possibilitaria uma aproximao dessas reas e de profissionais agilizando a
comunicao e a construo dos SOC.
Observa-se, mesmo na rea de Cincia da Informao, a dificuldade de consolidar uma
base terica comum que apoie a construo dos SOC, o que leva proposio da questo de
pesquisa que orienta este trabalho.

1.3 Questo de Pesquisa

Qual a relao dos Sistemas de Organizao do Conhecimento, no contexto da


Cincia da Informao, com as bases tericas utilizadas na construo de tesauros,
taxonomias, ontologias e sistemas de classificao?

20

1.4 Objetivos

1.4.1 Objetivo Geral

Investigar a relao dos Sistemas de Organizao do Conhecimento, no mbito da


Cincia da Informao, com os princpios tericos que orientam a construo de tesauros,
taxonomias, ontologias e sistemas de classificao.

1.4.2 Objetivos Especficos

realizar levantamento bibliogrfico na rea de Cincia da Informao em busca da


fundamentao terica em que os autores se apoiam para a construo de tesauros,
taxonomias, ontologias e sistemas de classificao.;

identificar os autores e publicaes mais produtivos sobre a temtica Sistemas de


Organizao do Conhecimento, e as palavras-chave associadas ao tema, por meio
da anlise quantitativa das caractersticas extrnsecas dos documentos que
compem a amostra representativa de trabalhos na rea;

analisar as caractersticas intrnsecas da amostra representativa de trabalhos e


relacionar com os princpios tericos, mencionados na reviso de literatura, para
elaborao de tesauros, taxonomias, ontologias e sistemas de classificao.

1.5 Justificativa

A literatura aponta a importncia que os SOC tm para a organizao e recuperao da

21
informao. Por outro lado, tambm so conhecidas as dificuldades terminolgicas e
lingusticas na representao de conceitos, bem como a categorizao, quando se est
estruturando representaes de domnios do conhecimento. Nota-se, ainda, a necessidade de
bases metodolgicas apropriadas para a elaborao desses sistemas (HJRLAND, 2003).
Portanto, este trabalho se prope apresentar os aspectos tericos apontados pela literatura da
rea e que fundamentam a construo dos SOC.
Para o desenvolvimento desta investigao, foi realizada reviso de literatura sobre
sistemas de organizao do conhecimento para observao de seus progressos cientficos,
considerando-se os aspectos conceituais e estruturais de desenvolvimento desses sistemas.
Dessa forma, pretende-se fornecer subsdios que possam auxiliar a elaborao dos SOC e de
metodologias para a estrutura destes modelos conceituais. A pesquisa pretende relacionar os
fundamentos tericos indicados na literatura da rea e os princpios tericos encontrados nas
publicaes sobre o tema, desde seu surgimento at a realizao deste trabalho, por meio das
anlises bibliomtrica e de contedo.
Dos diferentes tipos de SOC, esta pesquisa destaca os tesauros, pelo uso ainda
frequente na rea de organizao de informao e por sua existncia consolidada e
padronizada por normas internacionais (ISO, ANSI/NISO); as taxonomias, por sua
importncia na organizao de informaes em empresas e instituies, principalmente, no
desenvolvimento de portais no ambiente web; as ontologias, pelo interesse da comunidade de
pesquisa na rea, em funo das promessas da web semntica e, ainda pelo potencial que
oferecem em relao capacidade de representao do conhecimento de forma complexa e
completa e os sistemas de classificao, pela ampla utilizao na organizao da informao
em bibliotecas, onde so empregadas at hoje. A realizao desta pesquisa brotou da
inquietao da autora a respeito da falta de consolidao, na rea de Cincia da Informao,
da fundamentao terica comum entre estes sistemas capaz de fornecer sustentao para
gerar melhores prticas de representao e recuperao do conhecimento.
Alguns autores1 vm desenvolvendo trabalhos nesta temtica, como o caso de Lara
(2004, p. 233) quando afirma que o campo da informao no exclusivo dos profissionais
1

Anna Maria M. Cintra; Hagar Espanha Gomes; Lgia A. Caf; Maria Luiza de A. Campos; Marilda Lopez G.

de Lara; Marisa Brscher; M. F. G. M. Talamo, Jos A. Guimares, para citar alguns.

22
bibliotecrios e documentalistas, um grande nmero de experincias desenvolvidas com graus
variados de inovao, profundidade e mtodo, so geradas por distintas reas e rene
especialistas da engenharia, filosofia, matemtica, inteligncia artificial e da prpria Cincia
da Informao, na proposio do desenvolvimento de instrumentos como: tesauros,
taxonomias, ontologias, entre outros. Para Lara (2004), o propsito de mencionar esses
instrumentos deve-se s referncias comuns muitas vezes utilizadas por esses sistemas.
Assim, a elucidao das bases que sustentam a construo desses sistemas, pode congregar
vrios interesses pela convergncia de objetivos.
Binwall e Lalhmachhuana (2001) citados, em trabalho recente, por Gomes (2009, p.
78) reconhecem que os fundamentos epistemolgicos so essenciais para o progresso das
linguagens de representao do conhecimento, porm os estudos sobre o tema encontram-se,
ainda, bastante superficiais, no que concerne a conceituaes de conceitos, objetos, relaes,
classificao e herana, disponveis sob a forma de leis bsicas, princpios, postulados e
cnones.
Acredita-se que um estudo da natureza desta pesquisa possa contribuir para apoiar e
instrumentalizar os pesquisadores, no somente da rea de Cincia da Informao, mas de
outras reas que pesquisam e desenvolvem trabalhos sobre Sistemas de Organizao do
Conhecimento na busca de teorias que fundamentam os processos de representao
documentria e estratgias de organizao e recuperao da informao.

Captulo 2

REVISO DE LITERATURA

24

2.1 Organizao e Representao do Conhecimento


Para cada minuto que se gasta organizando as coisas,
ganhamos uma hora
provrbio chins
Para que se possa abordar teoricamente a organizao do conhecimento preciso,
inicialmente, partir do que se entende pelos termos organizao e conhecimento. O termo
organizao definido segundo o dicionrio Aurlio como: organizar, estabelecer as bases de;
pr em ordem, arrumar. Para o termo conhecimento, entre outras definies, encontram-se:
saber, instruo e cabedal cientfico. No sentido filosfico, a apropriao do objeto pelo
pensamento.
O conhecimento est em eterno crescimento, transformando-se e acumulando-se,
portanto no esttico nem isolado. Quando se adquire conhecimento relaciona-se com algo
j existente, e sobre o qual somos capazes de raciocinar e chegar a concluses. A criao de
conhecimento sobre os objetos que nos cercam constitui uma prerrogativa essencial da
racionalidade humana. Desenvolve-se, por instinto, num processo cognitivo que leva a
identificar caractersticas do objeto percebido e comparar com caractersticas identificadas em
outros objetos j conhecidos. A partir desse conhecimento, inicia-se um processo
classificatrio do objeto.
Na teoria geral do conhecimento, Hessen (2003 p.59) aborda o intelectualismo como
mediador entre o racionalismo e o empirismo, sob a orientao epistemolgica, ele ressalta
que [...] se para o racionalismo o pensamento a fonte e o fundamento do conhecimento,
para o empirismo essa fonte e fundamento a experincia e o intelectualismo considera que
ambas participam na formao do conhecimento.
Dessa forma, Kant, citado por Russell (2001, p. 385), sustentou que embora o
conhecimento surja da experincia, no deriva exclusivamente dela. Existe o conhecimento a
priori, isto , conhecimento absolutamente independente da experincia e de todas as
impresses dos sentidos. E o conhecimento a posteriori, que pode ser adquirido por meio da
experincia.

25
Seguindo essas propostas, conclui-se que o estudo terico fortalece e orienta a
pesquisa que se faz nas bases empricas, possibilitando organizar princpios que sustentaro as
proposies. No existe prtica sem uma fundamentao terica, assim como uma teoria no
consegue se fixar sem a prtica. Portanto, esta pesquisa busca nos fundamentos tericos o
aporte para a consolidao das prticas de desenvolvimento dos SOC, os quais se constituem
em representaes do conhecimento.
Para Dahlberg (2006), a organizao do conhecimento a cincia que ordena a
estruturao e sistematizao dos conceitos, de acordo com suas caractersticas, que podem
ser definidas como elementos de herana do objeto, e a aplicao dos conceitos e classes dos
conceitos ordenados pela indicao de valores, dos referentes contedos dos objetos ou
assuntos. A partir dessa organizao do conhecimento criam-se ferramentas que apresentam a
interpretao organizada e estruturada do objeto, chamados de sistemas de organizao do
conhecimento.
De acordo com os tipos de estruturas oferecidas aos usurios, a representao do
conhecimento pode ser classificada, segundo Brachman (1979 apud CAMPOS, 2001), em
quatro nveis: lgico, epistemolgico, ontolgico e conceitual.
O nvel lgico o nvel da formalizao, no existe preocupao com a semntica em
termos dos conceitos e de suas relaes, o foco est direcionado para uma dada
sintaxe;
No nvel epistemolgico a noo genrica de um conceito dada nos fundamentos de
estruturao de conhecimento, ou seja, especifica-se a estrutura dos conceitos e seus
relacionamentos;
O nvel ontolgico tem o objetivo de limitar o nmero de possibilidades de
interpretao do conceito em um determinado contexto, usando-se de um formalismo
para representar o contedo do conceito. Portanto, trata-se do processo de organizao
e classificao de um dado domnio, trabalhando com definies de conceitos que nele
esto inseridos; e
No nvel conceitual, os conceitos possuem a priori uma interpretao definida.

26
Estes nveis nos permitem construir, analisar e representar os conceitos bem como
identificar suas relaes com outros conceitos. Na realidade, quando trabalhamos com a
organizao do conhecimento para a recuperao da informao, trabalhamos, antes de mais
nada, com a organizao de conceitos. Como definem Brscher e Caf (2008, p.8), a
organizao do conhecimento
o processo de modelagem do conhecimento que visa a construo de
representaes do conhecimento. Esse processo tem por base a anlise do
conceito e de suas caractersticas para o estabelecimento da posio que cada
conceito ocupa num determinado domnio, bem como das suas relaes com
os demais conceitos que compem esse sistema nocional.

Para estudar os sistemas de organizao do conhecimento, nos interessam aqueles


nveis em que a estrutura do conhecimento pode ser sistematizada e representada a partir de
contextos especficos. Neste caso, os nveis epistemolgicos e ontolgicos.
Esses nveis encontram-se contemplados nos estudos da Cincia da Informao,
Teoria do Conceito, Terminologia, Teoria da Classificao e dos SOC. Esses estudos
permitem a sistematizao de conhecimentos a partir de definies conceituais, representadas
por signos lingusticos ou no lingusticos.
A primeira forma de se pensar em organizar alguma coisa decidir como se quer
que esta coisa seja encontrada. Quando se trata da organizao da informao, Wyllys
(2000) acredita em cinco maneiras de faz-la. Relembrando o acrnimo do ingls LATCH,
que significa tranca, trinco ou to latch on (to something or somebody), traduz-se2 como captar
algo ou prender algum, respectivamente, e temos: L para Location (Localizao); A para
Alphabet (Alfabeto); T para organized by Time (organizado pelo Tempo), muito comum nas
organizaes de museus; C para Category (Categorias) e H de Hierarchy (Hierarquia), que
pode ser do mais amplo ao mais especfico ou vice versa.
Os termos organizao do conhecimento e organizao da informao so tratados,
muitas vezes, na literatura, com o mesmo sentido. Aqui, adotou-se que a organizao da
informao refere-se a descrio fsica, ou seja, descreve caractersticas fsicas que
2

Traduo segundo o wordnet no endereo: http://www.wordreference.com/enpt/latch

27
identificam um documento (ttulo, autor, editor, ...) e a descrio de contedo que trabalha
com os conceitos contidos nos documentos e a representao desses conceitos de forma
sistemtica e semanticamente estruturada (resumo, indexao, classificao, ...). Brscher e
Caf descrevem que a organizao do conhecimento , tambm, um processo cognitivo
A representao construda no se restringe ao conhecimento expresso por um
autor, ela fruto de um processo de anlise de domnio e procura refletir uma
viso consensual sobre a realidade que se pretende representar [...] feita por
meio de diferentes tipos de sistemas de organizao do conhecimento (SOC)
que so sistemas conceituais que representam determinado domnio por meio
da sistematizao dos conceitos e das relaes semnticas que se estabelecem
entre eles (BRSCHER e CAF, 2008 p.6 e 8).

A preocupao com a organizao do conhecimento no recente, diversos modelos


foram desenvolvidos ao longo dos tempos. O termo organizao do conhecimento foi
estabelecido por volta do ano 1900 com Charles A. Cutter, W. C. Berwick Sayers e Ernest
Cushington Richardson. Em 1929, Henry Bliss, publicou o livro The organization of
knowledge and the system of the sciences que representa uma das principais contribuies
intelectuais nessa rea (HJRLAND, 2007; BROUGHTON et al, 2004, p. 8-9).
No contexto da organizao do conhecimento, as teorias advm de uma postura
epistemolgica pragmtica, como ressalta Smiraglia (2002), baseado nos resultados da
pesquisa emprica. No ambiente da organizao bibliogrfica, destacam-se Cutter (1876),
Dewey (1876), Shera (1950) como desenvolvedores de instrumentos pragmticos,
classificaes e os catlogos bibliogrficos.
A organizao do conhecimento, na viso de Rowley (1992, p. xvii) o caminho para
estabelecer sistemas para organizar documentos e informao, permitindo que os documentos
e as informaes possam ser recuperados pelos usurios sempre que requisitadas.
Segundo Vanda Broughton (2004) a organizao do conhecimento, enquanto
disciplina da Cincia da Informao, aborda assuntos como os sistemas de classificao,
tradicionalmente usados em bibliotecas e bases de dados; a anlise facetada, criada por
Ranganathan e mais tarde desenvolvida pelo the British Classification Research Group; a
recuperao da informao, em que a organizao do conhecimento a base para o bom

28
desempenho deste campo; a viso cognitiva para

anlise de domnio e a abordagem

bibliomtrica.
Assim, pode-se sintetizar que a organizao e a representao do conhecimento esto
sistematizadas em seu prprio nome, formados por dois conceitos fundamentais: a
organizao do conhecimento e a representao do conhecimento que tm como objeto de
estudo o conhecimento e suas atividades. Sendo que uma dessas atividades o
desenvolvimento dos sistemas de organizao do conhecimento.

2.2 Sistemas de Organizao do Conhecimento

O termo Sistema de Organizao do Conhecimento (SOC) uma traduo para o


portugus do original ingls Knowledge Organization System (KOS). O termo foi proposto
pelo Networked Knowledge Organization Systems Working Group na primeira Conferncia da
ACM Digital Libraries em 1998, Pittsburgh, Pennsylvania. Assim como a sigla KOS,
utilizada com frequncia na literatura, adotou-se o correspondente SOC em portugus.
Os SOC ou esquemas de representao do conhecimento, como alguns autores
preferem denominar, so encontrados na literatura das reas de Cincia da Informao,
Biblioteconomia e Documentao para designar instrumentos que fazem a traduo dos
contedos dos documentos originais e completos, para um esquema estruturado
sistematicamente, que representa esse contedo, com a finalidade principal de organizar a
informao e o conhecimento e, consequentemente, facilitar a recuperao das informaes
contidas nos documentos. A infraestrutura que d suporte ao desenvolvimento dos SOC
requer, antes de mais nada, uma anlise das necessidades dos usurios dos sistemas; a
identificao do tipo de SOC apropriado e o desenvolvimento do hardware e do software
adequado arquitetura de rede, sua integrao e manuteno. Portanto, pode-se dizer que
sistema de organizao do conhecimento uma denominao nova para as linguagens
documentrias3 que agregam elementos incorporados nas inovaes tecnolgicas da era
3

Linguagem Documentria (LD) um conjunto de termos, providos ou no de regras sintticas, utilizado para
representar contedos de documentos tcnico-cientficos, com fins de classificao ou busca de informaes.

29
digital.
Segundo Lara (2004), para que a linguagem documentria d forma ao contedo,
propondo-se como um modo de organizao, e ao mesmo tempo, desempenhe o papel de
instrumento de comunicao, preciso reunir algumas qualidades: a) funcionar como cdigo
inteligvel e fonte para a interpretao do sentido e; b) caracterizar-se como metalinguagem e
incorporar o usurio como integrante do processo. Essas caractersticas dependem do rigor
metodolgico utilizado na sua construo, principalmente quanto normalizao semntica.
A autora acrescenta ainda, que para funcionar como metalinguagem e integrar o usurio
como participante do processo, a linguagem documentria deve utilizar referncias de
linguagem - e de significado - que sejam razoavelmente compartilhadas (LARA, 2004, p.
234). Justificando-se um aporte terico nas reas de lingustica e terminologia.
Para Hodge (2000) os SOC englobam todos os tipos de instrumentos usados para
organizar a informao e promover o gerenciamento do conhecimento, incluindo os esquemas
de classificao que organizam materiais em nvel geral e os cabealhos de assunto que
oferecem o acesso mais detalhado, os catlogos de autoridade, que controlam verses
variantes de informao fundamental (como nomes geogrficos ou nomes de pessoas) e
outros esquemas, como as redes semnticas, tesauros, taxonomias e as ontologias. Hodge,
esclarece que os SOC so mecanismos para organizar a informao e constituem o corao
dos Sistemas de Recuperao da Informao (SRI) das bibliotecas, museus e arquivos, no
ambiente fsico, e, principalmente, no ambiente web.
Hjrland (2007) refere-se aos sistemas de organizao do conhecimento como
ferramentas que apresentam a interpretao organizada de estruturas do conhecimento,
tambm chamadas de ferramentas semnticas. Os SOC so estruturas sistemticas que visam
construo de modelos abstratos do mundo real, representando os conceitos de um domnio.
Essas ferramentas semnticas so utilizadas para o tratamento da informao viabilizando a
recuperao da informao, tanto no ambiente informatizado como no tradicional.
A LD deve integrar trs elementos: a) lxico identificado com uma lista de elementos descritores,
devidamente filtrados e depurados; b) rede paradigmtica para traduzir certas relaes essenciais e,
geralmente estveis, entre descritores; e c) rede sintagmtica destinada a expressar as relaes contingentes
entre os descritores, relaes essas que s so vlidas no contexto particular onde aparecem (GARDIN, 1968
apud CINTRA, 2002, p. 25)

30
Nas bibliotecas tradicionais, os esquemas de classificao como: CDD (Classificao
Decimal de Dewey); CDU (Classificao Decimal Universal), LCC (Library of Congress
Classification Classificao da Biblioteca do Congresso Norte Americano), entre outros,
tm a funo de organizar e localizar, nas estantes, um nico item de uma coleo. Assim
como nas bibliotecas tradicionais, as bibliotecas digitais usam um ou mais SOC para
promover uma viso geral do contedo da coleo e a sua recuperao, podendo, tambm, ser
usado para compartilhar informaes entre diferentes sistemas.
Entre as dcadas de 50 e 60 do sculo XX, os tesauros e cabealhos de assunto foram
desenvolvidos a fim de dar suporte aos servios de indexao. Os servios de indexao e
resumos eram tidos como processos usados somente por bibliotecas e editoras. Hoje, a
relevncia e utilidade desses servios tm sido amplamente reconhecidas, pois encontramos
aplicao em todos os tipos de recursos de informao em formato digital (LANCASTER,
2004 p. vii).
Por muitos anos, os SOC relacionaram-se com os servios de indexao usados
somente por catalogadores e indexadores, bibliotecrios e pesquisadores profissionais. Com o
crescimento

de

dados

eletrnicos,

exploso4

de

publicaes

eletrnicas

e,

consequentemente, as dificuldades na organizao e na recuperao das informaes, surgem


novas preocupaes e interesses no desenvolvimento destes sistemas, tanto pelos profissionais
quanto pelos usurios finais. A partir da, nova nfase foi dada na construo das taxonomias,
que, embora tenham surgido nos estudos de Aristteles, vm sendo amplamente aplicadas no
ambiente web, assim como as ontologias e os tesauros.
Na viso de Broughton e co-autores (2004, p. 143), os SOC, no sentido especfico da
expresso, so ferramentas semnticas que consistem em palavras, conceitos e relaes
semnticas, definidas e selecionadas. Os autores enumeram alguns tipos importantes de
relaes semnticas: relao de oposio, relao associativa, relao causal, homonmia,
hiponmia, meronmia, sinonmia e relao temporal.
Estabelecer as bases para a construo dos SOC no tarefa fcil. Do ponto de vista
4

Exploso, aqui no sentido de crescimento muito rpido.

31
da anlise de domnio, nos deparamos com as diferentes vises, abordagens ou paradigmas.
Cada uma dessas vises opera com diferentes teorias, conceitos e relacionamentos e a
organizao do conhecimento deve lidar com essas diferenas. Embora alguns SOC sejam
mais flexveis e de fcil adaptao, sempre vai existir algum tipo de viso parcial ou
tendenciosa. Esta viso parcial na estrutura dos SOC natural, pois reflete os interesses e as
consideraes de uma coleo, dos usurios e de suas prioridades. Para a construo dos
SOC, os profissionais, devem ser capazes de perceber essas tendncias o que possvel
quando o profissional j tem um conhecimento sobre o domnio. Essa perspectiva usada em
colaborao entre os especialistas em organizao do conhecimento e os especialistas da rea
de domnio a ser representado.
Com relao construo desses sistemas, Zeng (2009) afirma que o processo de
seleo de termos e os testes sob os princpios da garantia, so muito importantes no
desenvolvimento de qualquer SOC. Esse aspecto encontra-se contemplado inclusive na norma
ANSI/NISO Z39-19-2005, que identifica trs garantias: a garantia literria, a linguagem
usada para descrever o contedo de objetos, as palavras ou frases escolhidas devem se
aproximar ao mximo das usadas na literatura da rea de domnio; a garantia de usurio, a
linguagem de usurios geralmente identificada pelos termos usados em sistemas de buscas e a
garantia organizacional, as necessidades e prioridades da organizao identificando termos
que devem ser usados em vocabulrios controlados. (ANZI/NISO Z39.19-2005, p.16).
No existe um esquema de classificao do conhecimento sobre o qual todos
concordem. Um SOC pode ser significativo e vantajoso para uma cultura, uma coleo ou um
domnio e para outros pode no ser. Apesar da multiplicidade de maneiras para organizar o
conhecimento, Hodge (2000) aponta algumas caractersticas comuns dos SOC usadas em
organizao de bibliotecas digitais:

os SOC impem uma viso particular do mundo, de uma coleo e de itens;

a mesma entidade pode ser caracterizada de diferentes maneiras, dependendo do SOC


que usado e;

deve haver identificao suficiente entre o conceito expresso no SOC e o objeto do


mundo real, ao qual aquele conceito se refere. Pois assim, quando uma pessoa procura

32
algo sobre determinado objeto, o SOC deve ser capaz de conectar o conceito do objeto
com sua respectiva representao no sistema.
Os SOC tradicionais, como as classificaes e tesauros, tm sido utilizados tambm
para organizar recursos digitais na Internet. Com a web semntica, as ferramentas para
desenvolvimento de SOC esto se popularizando, devido necessidade de compartilhamento
com uso de padres orientados ontologicamente.

2.2.1 Sistemas de Organizao do Conhecimento e a Web Semntica

Tim Berners-Lee expressou a ideia da web semntica, em que metadados com


significado seriam processveis por mquinas, formando a base para uma nova gerao de
servios de recuperao de informao, ajudando tanto os humanos quanto os computadores,
facilitando o acesso a informaes e comunicao (BERNERS-LEE; HENDLER;
LASSILA, 2001).
Veltman (2001, 2002, 2004), citado por Slavic (2005, p. 1), diz que uma consequncia
da web semntica a mudana nas formas de buscas na Internet, em vez da recuperao por
meio de uma simples palavra, teramos uma palavra e seu significado ou significados. Isso,
obviamente, requer interoperabilidade semntica e sinttica de vocabulrio e a descrio de
assunto baseada em conceitos interligados logicamente, alm de computadores com acesso s
colees estruturadas de informaes e conjuntos de regras de inferncias, para que possam
apoiar o raciocnio automatizado com base nas representaes do conhecimento.
Neste contexto, como afirma Soergel (1999 apud SLAVIC, 2005), os SOC so
reconhecidos como fonte importante de vocabulrios estruturados e formalizados que podem
ser explorados para dar suporte ao desenvolvimento da web semntica, a qual contempla,
ainda, dados estruturados ou semiestruturados, metadados como padres de intercmbio e os
modelos de representao para controle da linguagem e organizao na recuperao da

33
informao.
A padronizao um dos primeiros objetivos numa estrutura tecnolgica da web,
seguido de uma linguagem representacional usando codificao XML e XML/RDF (SLAVIC,
2005). A padronizao desenvolvida em domnios especficos que tratam da informao, tais
como: biblioteconomia, bibliotecas digitais, tradues de dicionrios, glossrios, tesauros,
entre outros, esto sendo analisados, validados, testados e transportados para a linguagem
XML.
Isso nos permite refletir que o desenvolvimento da web semntica depende da
infraestrutura de metadados que possam ser entendidos e processveis por mquinas que
veiculam linguagens de indexao. Estas linguagens usadas na descrio dos metadados
devem ser formatadas e codificadas de forma padro, para que se torne fcil de ser processada
e compartilhada por mquinas.

2.2.3 Simple Knowledge Organization System - SKOS

O Simple Knowledge Organization System (SKOS) um modelo e especificao,


criado pelo W3C5, para dar suporte aos tradicionais SOC, como: tesauros, taxonomias,
esquema de cabealho de assunto e sistemas de classificao, de forma que seja entendido
pela mquina. SKOS usa uma sintaxe flexvel de XML/RDF que fornece estrutura para
publicao dos termos usados nos SOC e seus relacionamentos para dar suporte s buscas,
mapeamentos e conexes entre os diferentes SOC. Por no fazer parte do escopo desta
pesquisa, a inteno aqui apresentar uma breve viso sobre o SKOS e sua relao com os
SOC e a web semntica.
A XML - eXtensible Markup Language uma linguagem de marcao muito simples
e flexvel. Flexvel no sentido de que podem ser acrescentadas novas tags (etiquetas ou
marcaes) medida da necessidade, isto , permite a etiquetagem de um documento com a
5

O W3C - World Wide Web Consortium - http://www.w3.org/2004/02/skos/

34
descrio sobre o que trata esse documento e onde encontr-lo. Em alguns aspectos, o XML
assemelha-se ao HTML - HyperText Markup Language, ambas so linguagens derivadas do
SGML - Standard Generalized Markup Language. O XML est desempenhando um papel
importante e crescente de uma grande variedade de dados na web, fornecendo uma sintaxe
bsica para estruturar documentos, sem impor nenhuma restrio semntica a eles.
A RDF - Resource Description Framework uma linguagem, desenvolvida pelo
W3C, para representar informao na web. RDF uma estrutura para processar metadados e
seu principal objetivo facilitar o intercmbio de informaes, que podem ser entendidas por
mquinas, entre os aplicativos via web. Basicamente, RDF define um modelo de dados para
descrever estes dados semanticamente, de maneira que possam ser entendidos por
computadores.
Um dos objetivos da web semntica ter todos os SOC disponveis e acessveis na
web, de maneira que cada termo indexado seja identificado e tambm explicado por meio da
estrutura do sistema ao qual ele pertena.
Normalmente, quando as linguagens de indexao so formatadas para serem
processadas pelas mquinas elas so baseadas na anlise e transparncia de suas prprias
micro-ontologias que consistem de vocabulrios, sintaxe, semntica e regras de inferncia.
Existe uma tendncia de fazer este processo mais padronizado para explorar os SOC no
desenvolvimento da web semntica.

Com relao nova gerao do ambiente web, representada pela web semntica, os
SOC possuem um ponto comum, alm do ambiente digital, a necessidade de serem lidos e
compreendidos por mquinas, favorecendo a interoperabilidade entre os diferentes sistemas.
As ltimas duas subsees no foram destinadas a explorar a relao dos SOC com as novas
tecnologias, como a linguagem XML, o padro SKOS, os esquemas RDF e a linguagem
OWL, mas apontar que essa tendncia inevitvel para o desenvolvimento desses sistemas.

35

2.2.3 Tipos de Sistemas de Organizao do Conhecimento

A literatura das reas de Cincia da Informao e Cincia da Computao mostra


definies especficas para alguns SOC, mas aponta, tambm, seus escopos e aplicaes para
uma variedade de configuraes, principalmente em bibliotecas digitais. Os diversos tipos de
SOC tm suas descries baseadas em algumas caractersticas como: estrutura,
relacionamento entre termos, funo e complexidade. Hodge (2000) agrupou-os em trs
categorias gerais: lista de termos, classificaes e categorias e lista de relacionamentos.

2.2.3.1 Lista de termos

Lista de autoridades lista de termos usada para controlar a variedade de nomes para
entidades. Este tipo de SOC, geralmente, no inclui uma organizao nem uma
estrutura complexa. A apresentao pode ser alfabtica ou organizada por um esquema
de classificao superficial. Por exemplo: nomes de pases, indivduos ou instituies.

Glossrios lista de termos, em geral, com definies. Os termos podem ser de um


assunto especfico ou de um trabalho particular;

Dicionrios listas de palavras em ordem alfabtica e suas definies. Seu escopo


mais geral que os glossrios. Podem prover informaes sobre a origem de uma
palavra, variaes quanto a morfologia e a escrita da palavra, bem como, os mltiplos
significados dentre as disciplinas;

Gazetteers - um dicionrio de nomes de lugares. Os tradicionais so publicados na


forma de livros ou aparecem como ndice nos atlas geogrficos. Cada entrada deve ser
identificada pelo tipo de caracterstica e/ou de aspecto, tais como rios, cidades ou
escola. Geoespacialmente referenciados os gazetteers apresentam as coordenadas para
a localizao de lugares na superfcie da Terra. Ressaltamos que o termo gazetteer
possui vrios significados incluindo publicaes destinadas a informaes jurdicas e
informaes sobres patentes;

36

2.2.3.2 Classificao e categoria

Cabealho de assunto conjunto de termos controlados que representam o assunto


de um item de uma coleo. Pode ser extensivo e cobrir vrios assuntos, embora sua
estrutura seja, geralmente, muito superficial e limitada;

Esquemas de classificao, taxonomias e esquemas de categorizao embora


exista sutil diferena entre esses tipos de SOC, eles oferecem maneiras de separar
entidades em tpicos de nveis mais gerais, como uma cadeia hierrquica numrica e
alfabtica. As categorias de assunto so frequentemente usadas em estruturas
hierrquicas comumente encontradas nos tesauros. As taxonomias so amplamente
usadas em modelo orientado a objeto e em sistemas de gesto do conhecimento, para
indicar grupos de objetos baseados em caractersticas particulares.

2.2.3.3 Lista de relacionamentos

Tesauros conjunto de termos representando conceitos e as relaes hierrquica,


equivalente e associativa entre eles.

Redes semnticas tem tido um significante desenvolvimento aps o advento do


processamento da linguagem natural. Estrutura conceitos e termos em forma de rede
ou teia, os conceitos so ns e os relacionamentos expandem-se a partir dos ns. Uma
das redes semnticas usada em mecanismos de busca a Princeton University's
WordNet;

Ontologia o mais novo nome incorporado aos SOC, representa relacionamentos


complexos entre objetos, incluindo regras de inferncia e axiomas, no includos em
nenhum outro tipo de SOC.
Hjrland (2007) complementa que os SOC podem ser representados pelos mapas

bibliomtricos que so tcnicas bibliomtricas usadas, por exemplo, para fazer a anlise de
citao ou mtodos de construo e manuteno semi-automtica de tesauros; mapas
conceituais permitem visualizar as relaes entre conceitos de forma a estabelecer um
diagrama e utilizar setas para conectar-se com os conceitos. As relaes entre conceitos so

37
articuladas com interligaes etiquetadas, por exemplo: parte de; um(a); etc.; hipertextos
mtodo de apresentao de textos em formato digital, ao qual agregam-se outras informaes
na forma de blocos de textos ou imagens que permite a acessibilidade de documentos de
hipertextos por meio da World Wide Web (www) e intranets; topic maps6 - um padro ISO
para descrever estruturas de conhecimento associadas com fontes de informao. Podem
representar a informao utilizando tpicos que representem conceitos (pessoas, pases,
arquivos, eventos, etc.), associaes entre conceitos e ocorrncias (relaes entre tpicos).
um modelo rico em semntica e bem estruturado para dar suporte na recuperao de
informao em geral, e folksonomias indexao colaborativa de contedo (stios, msicas,
filmes, textos, etc.) com palavras-chave ou etiquetas de livre escolha, permitem que
internautas usem palavras de vocabulrios prprios de cada comunidade, fazendo com que
outros usurios interessados no mesmo assunto encontrem o contedo mais facilmente.
Os SOC podem ser descritos de acordo com suas estruturas e principais funes. Zeng
(2009, p. 160) apresenta a viso geral de alguns tipos de SOC agrupados de acordo com a
complexidade de suas estruturas e principais funes, como mostra a Figura 1. O
entendimento da autora baseado no esquema originrio de Hodge (2000), sobre o tema, e
adotado pela Networked Knowledge Organization Systems Group (NKOS). A classe dos SOC
mostrada de acordo com os grupos, do mais simples ao mais complexo: lista de termos,
modelos como metadados, classificao e categorizao, e modelos relacionais. O ltimo
grupo no mutuamente exclusivo.

Topic maps ou mapas de tpicos, traduzido por Robredo (2005, p. 326).

38

Figura 1. Viso geral dos SOC de acordo com a estrutura e funo


Fonte: Zeng (2009, p. 161) com adaptao

A Figura 1 mostra algumas das funes fundamentais dos diferentes tipos de SOC,
observando que algumas estruturas permitem aos sistemas cumprirem mltiplas funes que
podem evitar problemas causados pela falta de controle terminolgico quando se organiza

39
informaes.
A ambiguidade ocorre em linguagem natural quando uma palavra tem mais de um
significado, que sem controle apropriado desse termo, resulta na falta de preciso na
recuperao da informao. Existem diferentes maneiras de eliminar a ambiguidade, uma
delas adicionar um qualificador ao termo, muito usado em cabealho de assunto e tesauros.

Quando um conceito representado por um ou mais sinnimos ou termos que so


considerados como quase sinnimos, h necessidade de controle de vocabulrio. O uso de
sinnimos ou equivalentes um problema que afeta a recuperao da informao, pois um
assunto pesquisado pode ficar disperso no espao informacional ou em bases de dados se no
houver controle de vocabulrio.
O uso de relacionamento hierrquico o aspecto que diferencia uma taxonomia ou um
tesauro de outros sistemas, como uma lista simples ou um glossrio. As relaes hierrquicas
so baseadas nos graus ou nveis de superordenao e subordinao. Alm das relaes
hierrquicas, existem as relaes associativas, relacionamento que ocorre entre termos que
no so nem hierrquicos nem equivalentes, porm nos quais existe uma ligao semntica ou
conceitual que deve ser tornada explcita no sistema. As relaes hierrquicas e associativas
esto apresentadas com detalhes na seo 2.8.2.
Quanto apresentao de propriedades dos conceitos, as ontologias abarcam essa
caracterstica. So estruturas classificatrias que usam taxonomias e tesauros, e que se
diferenciam por apresentarem exaustivas propriedades para cada classe. Possuem um
vocabulrio conceitual e um modelo de trabalho que permite armazenagem, busca e inferncia
baseados em instncias e regras.
Os diversos tipos de SOC e suas estruturas podem variar de uma simples lista de
termos

para

estruturas

de

duas

dimenses

que

empregam

hierarquias

at

as

multidimensionais, como no caso das redes semnticas com estruturas e relacionamentos mais
complexos e completos.

40

2.3 Tesauro

A palavra tesauro vem do latim thesaurus e do grego thesaurs e quer dizer


tesouro, armazenamento, repositrio. O termo teve origem no dicionrio anlogo Thesaurus
of English words and phrases de Peter Mark Roget, publicado em Londres em 1852. A
partir da denominao de Roget, o emprego da palavra thesaurus ficou na rea de
documentao, associada organizao e recuperao da informao.
No final da dcada de 50 do sculo XX, inicia-se o desenvolvimento e utilizao dos
sistemas de indexao e classificao por meio de palavras chave. Currs (2005 p. 80) e
outros autores como Brian, Vickery e Alan Gilchrist concordam que Helen Brown foi
pioneira no uso da palavra thesaurus na forma escrita, durante a Dorking Conference on
Classification, em 1957, quando escreveu que o problema da recuperao da informao
transformar conceitos e suas relaes, como se expressam na linguagem dos documentos, em
uma linguagem mais regularizada, com os sinnimos controlados e suas estruturas sintticas
simplificadas (BROWN apud CURRS, p. 80).

J na dcada de 1970, dois autores se destacam, Alan Gilchrist, do Reino Unido e


Gernot Wersig, da Repblica Federal da Alemanha. Esses autores concentram suas obras na
construo de tesauros, com destaque aos princpios tericos que serviram de base para
muitos estudos posteriores. Ainda, nessa poca, foi publicado o manual de construo de
tesauros da UNESCO (1976).
Cavalcanti (1978, p. 27) define tesauro como uma lista estruturada de termos
associados empregada por analistas de informao e indexadores, para descrever um
documento com a desejada especificidade, a nvel de entrada, e para permitir aos
pesquisadores a recuperao da informao que procuram.
No contexto da Documentao, o tesauro considerado um instrumento de controle
terminolgico eficaz para a organizao do conhecimento e importante ferramenta no
tratamento e recuperao da informao. Para Guinchat e Menou (1994), o tesauro representa

41
uma forma de organizao das linguagens documentrias, sendo um conjunto de termos
controlados, estabelecidos por relaes hierrquicas e de vizinhana. Os autores supra citados
apontam que as vantagens do tesauro so sua especificidade, maleabilidade e capacidade de
descrever as informaes de forma completa (GUINCHAT; MENOU, 1994, p. 146).
Um dos aspectos que envolve a descrio, organizao e recuperao de informao
est relacionado com o desenvolvimento de uma linguagem padronizada e consensual. Deste
modo, o emprego dos tesauros como instrumentos que relacionam os termos ou descritores de
forma consistente apresenta uma estrutura sinttica simplificada e forma uma rede de
referncias cruzadas num relacionamento lgico e hierrquico dos descritores. Assim, Toutain
(2006, p. 22) define o termo tesauro como vocabulrio controlado, compreendido como
estruturas terminolgicas, que visa padronizar a linguagem, em servios de informao,
cobrindo um domnio especfico do conhecimento, traduzido de uma linguagem natural para
uma linguagem de mquina.
O tesauro geralmente temtico e atende uma rea especfica do conhecimento, mas
pode, tambm ser multidisciplinar. Segundo Gomes (1990, p. 16), os tesauros podem ser
classificados quanto a tipologia em: a) Monolngues e multilngues; b) Macrotesauros
(representam conceitos mais amplos) e Microtesauros (representam conceitos especficos) e;
c) Multidisciplinares e de Disciplina Especfica.
Quanto funo e estrutura, Robredo (2005, p. 147) considera tesauro como um
instrumento de controle terminolgico que utiliza as linguagens documentrias para a
traduo da linguagem natural dos documentos. Para o autor, o tesauro um vocabulrio
controlado em que os termos so relacionados semntica e genericamente, cobrindo um
campo especfico do conhecimento.
De acordo com o IBICT (1984, p. 1-2), as principais finalidades de um tesauro so: a)
controlar os termos usados na indexao mediante um instrumento que traduza a linguagem
natural dos autores, usurios e indexadores, para uma linguagem mais controlada; b)
uniformizar, mediante esta linguagem documentria, os procedimentos de indexao de
profissionais em uma instituio ou numa rede cooperativa; c) limitar o nmero de termos

42
necessrios explicitao dos conceitos expostos pelos autores de uma rea; d) auxiliar a
tarefa de recuperao da informao, fornecendo termos adequados para a estratgia de busca.
Os tesauros so estruturas consolidadas e padronizadas por normas internacionais,
como a ISO 2788 (1986), a ISO 5964 (1985) e a ANSI/NISO Z39.19-2003 que tratam da
construo, formatao e manuteno de tesauros monolngues e multilngues. Com base
nessas normas pode-se sintetizar a estrutura de tesauros em duas partes: base terica e base
tcnico-operacional.
Base terica a essncia e a fundamentao terica para a construo de tesauros, da qual
destacam-se quatro aspectos:
a) Conceito - valendo-se da Teoria do Conceito (Dahlberg, 1978), para a qual os
conceitos so unidades de conhecimento, identificadas por meio de enunciados verdadeiros de
determinado objeto e representadas na forma verbal. Interpretando o tringulo conceitual de
Dahlberg temos no pice o referente (objeto), as caractersticas (predicao verdadeira
sobre o referente) e a forma verbal (denominao do objeto) representado por um termo.
Cada elemento compe um vrtice do tringulo;
b) Termo - signo lingustico que representa um conceito num domnio do
conhecimento, a designao do conceito em forma de cdigo, frmula ou outro smbolo. Por
isso, na elaborao de tesauro o termo um elemento fundamental e precisa ser
cuidadosamente trabalhado. Os termos so apresentados por um descritor - termo
escolhido para representar um conceito que ser utilizado na indexao e na recuperao de
determinado assunto. No descritor o termo que, embora possa descrever os mesmos
conceitos que o descritor, no pode ser utilizado na indexao e na recuperao, evitando-se
assim, a proliferao de sinnimos e perda de informao;
c) Categorias - so propriedades gerais dos conceitos, utilizadas para agrup-los
segundo caractersticas comuns e;
d) Facetas - caractersticas sob a qual um grupo de conceito analisado e so vistos
como tendo algo em comum. a fragmentao de um assunto em diversas partes

43
constituintes.
Base tcnico-operacional consiste numa abordagem mais prtica de desenvolvimento de
tesauro. Divide-se em quatro etapas:
a) Planejamento - nessa etapa inicial ocorrem a delimitao da rea do conhecimento
a ser representada; a identificao de tesauros existentes e do pblico alvo; o levantamento
das fontes de pesquisa; a definio da metodologia e do tipo de sistema; as formas de
apresentao (ndice sistemtico ou ndice alfabtico); a especificao dos recursos humanos,
financeiros e materiais e como ser feita a manuteno do tesauro;
b) Coleta de termos - existem dois mtodos de coleta: o mtodo dedutivo, de cima
para baixo, ou seja, identificam-se primeiro as categorias conceituais que sero utilizadas para
agrupar os termos e o mtodo indutivo, de baixo para cima, em que primeiro so coletados os
termos e depois agrupados em categorias segundo suas caractersticas. Nessa etapa deve-se
observar a garantia literria, onde s se justifica a incluso de um termo se este ocorrer na
literatura da rea. Os termos so, geralmente, substantivos no singular, as siglas e abreviaes
devem seguir um padro estabelecido, podendo ocorrer casos isolados, de acordo com o
contexto do tesauro. Importante manter a consistncia na deciso. Outras formas que devem
ser tratadas: emprstimo lingustico, grias, nomes populares e a grafia;
c) Controle terminolgico - pela natureza lingustica dos termos no tesauro, deve-se
observar alguns fenmenos que ocorrem na linguagem natural como: sinonmia um mesmo
conceito representado por diferentes termos; homografia um mesmo termo representa
mais de um conceito e no h relao semntica entre eles e a polissemia um mesmo termo
representa mais de um conceito e existe relao semntica entre eles e;
d) Estabelecimento de relaes entre conceitos - o relacionamento entre os termos
de um tesauro acontece por meio de: relao de equivalncia termos em relao de
sinonmia ou quase sinonmia, identificados por meio de cdigos remissivos USE (Used) e
UP Usado Para (UF Used For); relao hierrquica rene conceitos que tm uma ou
mais caracterstica em comum, pode ser relao hierrquica de gnero-espcie que exprime
os graus de superordenao e representa o conceito mais abrangente, utiliza o cdigo - TG -

44
Termo Genrico (BT - Broader Term) e a subordinao com o cdigo - TE - Termo
Especfico (NT - Narrow Term) que representa o conceito mais especfico e herda as
caractersticas da classe superior com uma caracterstica a mais. As relaes hierrquicas
tambm podem ser relao hierrquica partitiva, formada entre o todo e suas partes,
representado por TGP - Termo Genrico Partitivo e suas partes por TEP - Termo Especfico
Partitivo. Outro tipo de relacionamento a relao associativa ou funcional, a qual ocorre
entre conceitos, em que pelo menos um deles envolve um processo ou operao. Essa relao
usada em todos os casos em que no se aplica a relao de equivalncia ou a hierrquica,
mas onde os termos esto relacionados semntica, conceitualmente ou por alguma associao
mental.
A contextualizao dos conceitos feita pelas Notas Explicativa NE (ou Nota de
Escopo), que indicam os pontos pelos quais o conceito foi hierarquizado, podendo ampliar ou
reduzir o campo conceitual, servindo de orientao para o indexador na melhor
correspondncia entre conceito e descritor.
e) Formas de divulgao e publicao - a divulgao pode ser feita de forma
impressa e/ou eletrnica, em CD-ROM ou disponibilizada em linha. Periodicamente,
necessrio atualizar a publicao independente da forma de divulgao.
A construo de tesauros uma tarefa difcil, que exige um esforo coletivo, pois as
linguagens construdas so nicas em cada domnio do conhecimento e, portanto, sofrem
constantes modificaes medida que as lnguas evoluem. Observa-se que das primeiras
iniciativas, como a de Mark Roget, at os dias atuais, os tesauros evoluram em sua definio,
construes tericas e metodolgicas, resultante de novos modelos cognitivos e da abordagem
centrada no usurio.

45

2.4 Taxonomia

Etimologicamente, o termo taxonomia deriva do grego com o significado de: txis


ordenao, grupo e nomos - lei, norma, regra. A palavra taxonomia foi introduzida por A. de
Candolle em 1813 para designar as normas e leis utilizadas em sistemtica. Desde ento, vem
sendo amplamente usada na Biologia e na Lgica (CURRS, 2005 p. 53-54). De acordo com
a Encyclopedia of library and information science (KENT; LANCOUR, 1968, v. XX, p.187)
taxonomia um mtodo de classificar coisas reais, estabelecendo categorias de similaridades
e diferenas.
A taxonomia no campo da biologia, por exemplo, tem a espcie como categoria bsica
assim definido por Amabis e Martho (1994)
Espcies semelhantes so reunidas em categorias taxonmicas maiores, os
gneros. Gneros com caractersticas semelhantes so agrupados em
categorias maiores, as famlias. Estas, por sua vez, so agrupadas em
categorias ainda mais abrangentes, as ordens. Ordens so reunidas em classes,
classes so reunidas em filos, e filos so reunidos em reinos. (AMABIS;
MARTHO, 1994, p. 07)

Observa-se que o ponto de partida das taxonomias a classificao, por semelhanas e


diferenas entre caractersticas do objeto num dado domnio. Reitz (2004), no Online
Dictionary for Library and Information Science, define taxonomia como a cincia de
classificar, incluindo princpios gerais pelos quais objetos e fenmenos so divididos em
classes, as quais esto subdivididas em subclasses, e essas em sub-subclasses e assim
sucessivamente.
Currs (2005, p. 60, traduo nossa) apresenta algumas definies para taxonomia:
[...] uma linguagem controlada. Uma lista organizada de palavras e frases, ou sistemas de
notaes que se usa para iniciar um processo de indexao e recuperao da informao.
Tambm

pode

ser

considerado

como

um

esquema

de

navegao

ordenado

hierarquicamente, essa definio a autora qualifica como muito restrita, ao contrrio da


prxima, que considera significativa [...] que trata de estruturas conceituais adequadas para o

46
seu uso nas Webs Semnticas.
Embora as taxonomias tenham suas razes nos trabalhos de Aristteles, Linnaeus e
Darwin (CONWAY e SLIGAR, 2002; TERRA, 2005), o significado do termo taxonomia tem
sido amplamente usado para outras propostas, principalmente empresariais, visando a
organizao, armazenagem e recuperao de informao. O conceito de taxonomia sofreu
uma transformao nos tempos da informtica, chegando ao mbito da Cincia da Informao
e da Documentao, no que se refere aos sistemas de classificao. No domnio das
representaes do conhecimento, as taxonomias podem ser consideradas instrumentos que
organizam logicamente os contedos informacionais.
Em perodos mais recentes, as taxonomias vm sendo usadas para a criao de
metadados ou termos comuns para descrever um objeto, com foco na recuperao da
informao. Tambm so usadas na categorizao, como suporte de navegao e, ainda, como
esquemas que organizam contedos das pginas na web e lista de controle de dados usados para
suporte de minerao de dados.

Segundo Currs (2005, p. 58), os administradores de empresas foram os primeiros a


buscar ajuda nas taxonomias para organizar a vasta quantidade de documentos. Os
profissionais da informtica tambm foram pioneiros, ao estudarem as estruturas e
caractersticas das taxonomias para aplic-las e adequ-las s necessidades de organizao e
informatizao de documentos.
O prprio conceito de organizao remete para um procedimento classificatrio,
permitindo um agrupamento categorizado, isto , a partir de um assunto formam-se categorias
que se dividem em classes e subclasses hierarquicamente, formando uma lista de categorias
de assunto estruturada. Daconta, Obrst e Smith (2003, p. 147) definem taxonomia como uma
hierarquia semntica em que a entidade de informao est relacionada pela subclassificao
de relao ou a subclasse de relao, podendo distinguir entre taxonomia fraca ou forte. Os
autores supra citados consideram as taxonomias semanticamente fracas por no terem a
riqueza necessria para expressar significados complexos.
Jean Graef (apud EDOLS, 2006) apresenta as taxonomias como esquemas que
classificam coisas organismos vivos, produtos, livros em uma srie de grupos hierrquicos

47
para serem mais fceis de identificar, estudar e localizar. So compostas de duas partes
estruturas e aplicaes. As estruturas consistem em categorias e os relacionamentos e as
aplicaes so as ferramentas de navegao disponveis para ajudar os usurios a encontrarem
as informaes que desejam.
Uma taxonomia bem definida e bem construda racionaliza o processo de busca. Os
resultados das buscas so mais relevantes quando a categorizao construda por
especialistas e testada com preciso. Os processos de organizao, geralmente, requerem uma
sofisticada estrutura para se obter um melhor resultado. Documentos e assuntos diferentes
normalmente requerem diferentes estratgias de busca. A busca que recupera um determinado
contedo para uma pessoa pode no ter a mesma relevncia para outra. Para obter xito as
taxonomias, geralmente, tm como objetivos:

estabelecer categorias gerais;

coletar e representar os conceitos por meio de termos;

agilizar a comunicao entre especialistas e outros pblicos;

encontrar o consenso;

controlar a diversidade de significao;

construir relacionamento semntico entre os termos, atravs de relaes hierrquicas;

oferecer um mapa da rea que servir como guia em processos de conhecimento.


Para o desenvolvimento da taxonomia utilizada pela NASA (National Aeronautics

and Space Administration), por exemplo, os autores Dutra e Bush (2003) descrevem que o
objetivo fundamental foi a elaborao de uma metodologia consistente que pudesse manejar,
ou seja, tratar o contedo informacional eletrnico. Os documentos esto descritos com um
esquema de classificao padro que segue uma hierarquia pr-definida, o que permite ao
usurio descobrir e ver correlaes entre reas de assunto, bem como, tornar a recuperao da
informao mais precisa e relevante.
As taxonomias no so documentos estticos que ficam guardados em um lugar
seguro. Muito pelo contrrio, adaptam-se s influncias do contedo e conhecimento dos
trabalhadores que as utilizam, so, portanto, interativas (CONWAY; SLIGAR, 2002). Quanto
estrutura, devem ser objetivas e estratgicas. O ponto de partida a busca pela existncia de
taxonomias do mesmo domnio, a reutilizao de taxonomias resulta em economia de tempo e

48
esforos. Assim, outros documentos j existentes devem ser pesquisados tais como: lista de
palavras-chave ou de assunto; lista de autoridade e tesauros; dicionrios e glossrios
existentes na rea. Conway e Sligar (2002) afirmam que uma taxonomia bem formada no s
reflete a necessidade de seus usurios como o contedo que ela organiza.
Com relao terminologia, a estrutura da taxonomia pode ser simples ou complexa.
Simples se for uma lista em ordem alfabtica de termos autorizados, chamados tambm de
lista simples (flat list). Complexa quando estabelece relacionamentos hierrquico e
associativo entre os termos. Conway e Sligar (2002) recomendam que sejam consultados os
padres da ANSI e NISO para construo de tesauros, tamanha a semelhana em suas
estruturas.
As taxonomias permitem que se estabeleam padres de classificao e ordenao de
informaes por meio de herana. Para as mquinas torna-se fcil compreender corretamente
o relacionamento gnero/espcie entre as entidades atribuindo propriedades s classes gerais
e, ento, assumindo que as subclasses herdam estas propriedades (CAMPOS; CAMPOS;
CAMPOS, 2006 p. 59).
Ao contrrio do princpio dicotmico adotado por Aristteles, pode-se, atualmente,
construir taxonomias policotmicas, ou seja, um termo associado a tantas classes, e
subclasses quantas se fizerem necessrias, dentro de um domnio especializado. Com isso,
evidencia-se a grandeza do problema de mapeamento multidimensional de qualquer rea
especializada. (CAMPOS e GOMES, 2007).
Na descrio de Conway e Sligar (2002), existem trs tipos de taxonomias: taxonomia
descritiva, construda nos modelos de tesauros ou vocabulrios controlados. Aqui, observa-se
dois dos objetivos apontados por Svenonious (2000): encontrar e selecionar documentos.
Svenonious indica, ainda, que a construo de tesauros envolve considervel dificuldade.
Como por exemplo, o controle da homonmia e polissemia; taxonomia navegacional,
inerente neste conceito a ideia da relao gnero/espcie entre vrios documentos. Esta
relao deve ser exaustiva e mutuamente exclusiva; e taxonomia para gerenciamento de
dados, que contm um pequeno conjunto de termos controlados rigidamente e tem particular
significncia enumerativa. Segundo Campos e Gomes (2007), as taxonomias se caracterizam

49
por:

conter uma lista estruturada de conceitos/ termos de um domnio;

incluir termos sem definio, somente com relaes hierrquicas;

possibilitar a organizao e recuperao de informao atravs de navegao;

permitir agregao de dados, diferentemente das taxonomias seminais, alm de


evidenciar um modelo conceitual do domnio;

ser um instrumento de organizao intelectual, atuando como um mapa conceitual dos


tpicos explorados em um SRI;

ser um novo mecanismo de consulta em portais institucionais, atravs de navegao.


Em uma taxonomia corporativa, os conceitos e termos que uma empresa deve

administrar so determinados pela necessidade dos negcios da empresa. O alvo no


trabalhar todos os termos, mas sim identificar quais os termos que devem ser includos e
tratados no escopo da taxonomia. Para isso, Terra e co-autores (2005, p.3), sugerem alguns
critrios que devem ser observados na construo de taxonomias corporativas:
a) Comunicabilidade - termos utilizados devem transparecer os conceitos carregados
de acordo com a linguagem utilizada pelos usurios do sistema, por exemplo, cloreto de
sdio, terminologia usada por especialistas e sal, usada por leigos;
b) Utilidade - apresentar somente os termos necessrios, por exemplo, frutas, sem
especificar cada uma como maa, pra;
c) Estmulo - uso de termos que induzem o usurio a continuar a navegao pelo
sistema;
d) Compatibilidade - conter somente estruturas do campo que se est ordenando e
que faam parte das atividades ou funes da organizao.
No contexto das taxonomias navegacionais, Bryar (2001) menciona a importncia da
organizao da informao para o sucesso da recuperao da informao dentro das empresas.
O autor, ressalta que os gestores da informao esto convencidos de que a melhor soluo
para a eficincia nas buscas empacotar todas as formas de todos os documentos
eletrnicos dentro de um formato comum, para que os contedos ali guardados sejam mais
facilmente encontrados e usados por diferentes aplicaes. Esse processo j vem sendo usado
no tratamento da informao em muitas organizaes por meio da linguagem XML.

50

Em tempos de sistemas computacionais, globalizados e competitivos, Bryar (2001),


assim como Conway e Sligar (2002) e Svenonious (2000), acrescentam que um dos aspectos
mais importantes na construo de taxonomias facilitar a navegao. Para taxonomias de
assuntos de negcios esse aspecto torna-se complexo, principalmente no que se refere
categorizao. As atividades de negcios envolvem uma gama de assuntos que nem sempre
permitem um agrupamento lgico. Ocorre ainda, que um mesmo assunto pode ser tratado em
diferentes categorias. Nesses casos, em particular, os esquemas de categorizaes automticas
so inadequados para administrar tal complexidade. Na medida em que o nmero de termos
cresce, mais difcil e complexo se torna o processo de indexao (Bryar, 2001 p. 11). Apesar
da crescente importncia das taxonomias no contexto de ambientes web, a literatura da rea
rara em reflexes exaustivas sobre o processo de construo.
Svenonious (2000) revisando as ideias de Charles Cutter e da IFLA (International
Federation of Library Associations), estabeleceu cinco metas centrais para a classificao de
documentos em um sistema de informao: encontrar; identificar; selecionar; obter e
navegar no acervo documental. Quando se trata de uma taxonomia para empresas os
objetivos so semelhantes como aponta Conway e Sligar (2002, traduo nossa).
O objetivo de uma taxonomia corporativa no somente prover uma lista de
termos autorizados para usar em redao e busca de informao, mas tambm
para criar mapas entre conceitos, para conectar funcionrios com o
conhecimento certo na hora certa. As taxonomias criam uma rede semntica
comum que est baseada na necessidade dos negcios e leva em considerao
os bens intelectuais (o contedo) e a maneira pela qual os funcionrios
procuram pela informao. Essa rede semntica prov uma ferramenta
essencial para gerenciar bens intelectuais e conectar o conhecimento dos
funcionrios (CONWAY e SLIGAR, 2002).

Nesta poca de sobrecarga informacional, para que seja possvel controlar, preciso
filtrar, categorizar e etiquetar

o montante de informao. Os bibliotecrios j possuem

familiaridade com esta problemtica. No entanto, no ambiente digital, os profissionais tm


procurado solues que se originaram no tratamento da informao nas bibliotecas. As
corporaes esto envolvidas na reestruturao dos stios, Intranets e portais, a fim de
tornarem seus servios mais eficientes no que tange, principalmente, gesto e recuperao
da informao. H, portanto, envolvimento no uso de conceitos baseados nos princpios de
catalogao, classificao, indexao e vocabulrios controlados (EDOLS, 2001).

51

2.5 Ontologia

O desenvolvimento de ontologias vem crescendo e ganhando papel especfico em


diversas comunidades cientficas, como a Cincia da Computao, Cincia da Informao,
Lingustica Computacional, Medicina, para citar algumas. O termo ontologia, que vem do
grego ontos (ser) e logos (palavra), foi adaptado da tradio filosfica, mais especificamente,
da metafsica ramo da Filosofia - que tem como objeto de estudo o ser ou o que existe
na natureza, ao passo que a ontologia da Cincia da Computao e da Cincia da Informao
estudada no contexto da representao do conhecimento.
Uma ontologia define os termos usados para descrever e representar uma rea do
conhecimento. Pode ser usada por pessoas, bancos de dados, em tcnicas e aplicaes de
raciocnio indutivo e inferncias que necessitam compartilhar informaes dentro de um
domnio. Assim, Robredo (2005, p. 321) define uma ontologia como o resultado da
formulao, to rigorosa e completa quanto possvel, de um esquema conceitual sobre um
domnio. A definio de ontologia com grande aceitao e citao na literatura da rea a
apresentada por Gruber (1993)
ontologia uma especificao formal e explcita de uma conceitualizao, o
que existe aquilo que pode ser representado [...] Quando o conhecimento de
um domnio representado num formalismo declarado, o conjunto de objetos
que podem ser representados chamado de universo do discurso. Esse
conjunto de objetos, e os relacionamentos descritivos entre eles, so refletidos
no vocabulrio representativo com o qual um programa de base de
conhecimento representa o conhecimento. Mas, no contexto de Inteligncia
Artificial, ns podemos descrever ontologia como um conjunto de termos
representacionais. Nesse tipo de ontologia, definies so associadas aos
nomes de entidades no universo do discurso (por exemplo, classes, relaes,
funes ou outros objetos) com textos legveis descrevendo o significado dos
nomes e axiomas formais que confirmam a interpretao e o uso desses
termos. Formalmente, uma ontologia uma indicao de uma teoria lgica
(GRUBER, 1993, p. 1, traduo nossa).

Borst (1997 p. 12) complementa a definio de Grber sugerindo que formal


significa legvel para computadores; especificao explcita diz respeito a conceitos,
propriedades, relaes, funes, restries e axiomas explicitamente definidos e manipulados

52
por computadores; conceitualizao diz respeito a um modelo abstrato de algum fenmeno
do mundo real. Borst acrescenta o termo compartilhado, no sentido de conhecimento
consensual. Vrias definies surgiram na literatura que enriquecem as citadas ou sugerem
outras.
natural que haja uma multiplicidade de acepes e de definies variadas que
refletem em diferentes tipos de ontologias, pois as ontologias, so objetos de estudo de
diferentes reas do conhecimento (Filosofia, Cincias Cognitivas, Cincia da Computao,
Lingustica, Cincia da Informao). O fato que no existe consenso entre autores, cada um
apresenta uma definio de ontologia mais adequada ao seu contexto de pesquisa e de
aplicao.
A palavra ontologia tem sido empregada para descrever artefatos com diferentes graus
de estrutura, variando de uma simples taxonomia ou um esquema de metadados at as teorias
da lgica formal. Almeida e Bax (2003), propondo dar uma viso geral sobre o estado-da-arte
no estudo de ontologias, apresentam diversos tipos, propostas para construo e aplicao de
ontologias (metodologias, ferramentas e linguagens). Segundo os autores, as ontologias
podem ser utilizadas em projetos de gesto do conhecimento, comrcio eletrnico,
processamento de linguagem natural e recuperao de informao na web.
As ontologias apresentam-se como modelo de relacionamento de entidades em um
domnio particular do conhecimento. O objetivo de sua construo suprir a necessidade de
um vocabulrio compartilhado pelo qual as informaes possam ser trocadas e tambm
reutilizadas pelos usurios de uma comunidade, sejam eles humanos ou agentes inteligentes.
A construo de ontologias vem crescendo rapidamente em diversas reas do conhecimento
usando diferentes mtodos, ferramentas e verses. Com isso, Corcho e colaboradores (2003)
apontam que, apesar de existirem diversas tcnicas e linguagens para a elaborao

de

ontologias, ainda faltam critrios comuns para a criao de bases tericas consistentes que
facilitem o seu desenvolvimento.
As diversas reas de aplicao foram apontadas por Guarino (1998), quando menciona
que no final da dcada de 1990 as ontologias j estavam sendo estudadas pela Inteligncia
Artificial, Lingustica Computacional e pelas reas de pesquisas em engenharia do

53
conhecimento, engenharia da lngua, informao modelar, integrao da informao,
integrao de empresa, medicina, mecnica projetada, padronizao do conhecimento e de
produto, sistema de informao geogrfica, sistema de informao legal e sistema de
informao biolgica. No contexto da web semntica, fundamental investigar padres de
intercmbio, controle de linguagem e modelos de representao por meio de metadados como
as ontologias, taxonomias e tesauros (CAMPOS et al, 2006).
Noy e McGuinness (2001) apresentam cinco motivos pelos quais o desenvolvimento
de ontologias torna-se algo importante e considervel: a) compartilhamento de conhecimento
comum em estruturas de informao entre outros povos ou para os agentes de software; b)
permite o reuso do conhecimento; c) realiza inferncias em um domnio de conhecimento; d)
separa o conhecimento de domnio do conhecimento operacional; e e) realiza a anlise do
conhecimento estruturado tendo como resultado respostas mais relevantes.
As ontologias promovem e facilitam a interoperabilidade entre sistemas de
informao. Por meio de um processo inteligente dos agentes (computadores), possvel
compartilhar e reutilizar o conhecimento entre os sistemas. As ontologias, fornecem, ainda,
um entendimento comum de um domnio entre pessoas de determinada comunidade, entre
computadores e pessoas e entre um ou mais computadores. Do ponto de vista de
representao do conhecimento, Feitosa (2006) afirma que
uma ontologia no deve ser concebida apenas como um vocabulrio informal,
ou mesmo como uma linguagem de termos estruturados como um tesauro,
por exemplo - , mas requer uma possibilidade de interpretao algortmica dos
seus significados e, por conseguinte, uma representao em uma linguagem
formal, cujo processamento dos significados pode ser realizado por mquinas.
Dito de outro modo: uma ontologia requer a explicitao lgico-formal de
significados e palavras, que devem ser expressos por meio de construtos
matemticos (FEITOSA, 2006, p. 73).

Na literatura alguns autores definem ontologias como linguagens documentrias pelos


seus elementos de formao: termos, definies e relaes. Porm, apesar de possurem
elementos comuns, as ontologias so mais que linguagens documentrias, elas possuem
funcionalidades que permitem que mquinas possam processar o raciocnio automatizado
por meio de regras e inferncias (SALES, CAMPOS e GOMES, 2008 p. 63).

54

Apesar de terem estruturas diferentes, as ontologias so compostas, basicamente, dos


mesmos componentes que outros SOC. Segundo Noy e McGuinness (2001), o
desenvolvimento de uma ontologia inclui a definio de classes, atributos7 e a descrio dos
valores permitidos para esses atributos. Assim, as autoras apresentam os seguintes
componentes de uma ontologia:
a) Classes ou conceitos - descrevem conceitos do domnio, so muitas vezes o foco
das ontologias. As classes esto, geralmente, organizadas em uma taxonomia;
b) Relaes representam as diversas formas de associao entre conceitos de um
domnio;
c) Atributos -

descrevem as

caractersticas que compem os conceitos e as

instncias;
d) Instncias so usadas para representar os elementos de uma ontologia, podem ser
as ocorrncias dos conceitos at sua individualizao. Uma instncia um conceito que
pertence a uma classe e possui determinadas propriedades;
e) Axiomas so expresses verdadeiras que usam linguagens de lgica para
descrever os construtos na ontologia;
f) Regras so geralmente usadas para inferir conhecimento na ontologia.
Durante os ltimos anos, as atenes tm se voltado para a metodologia de construo
de ontologias, as quais podem ser construdas a partir de um esboo ou reuso de outras
ontologias disponveis. Diferentes processos de construo de ontologias tendem a estar
associados com diferentes tipos de ontologias. Guarino (1998), numa ampla viso, apresenta
quatro tipos de ontologia, que so:
a) Ontologias de alto nvel ou genricas descrevem conceitos de forma bem geral,
tais como, espao, tempo, material, evento, etc., os quais so independentes de um problema
ou domnio particular;
b) Ontologias de domnio expressam conceituaes de domnios particulares,
descrevendo o vocabulrio relacionado a um domnio genrico, como Medicina;
c) Ontologias de tarefa expressam conceituaes sobre a soluo de problemas, no
7

Alm de atributos, encontramos tambm, na literatura sobre ontologias, os termos slots, propriedades, papis
ou caractersticas com a mesma significao.

55
dependem do domnio, descrevem o vocabulrio relacionado a uma atividade ou tarefa
genrica, como venda de produtos;
d) Ontologias de aplicao descrevem conceitos dependendo de um domnio e de
uma tarefa particular. Os conceitos, geralmente, correspondem aos papis desempenhados
pelas entidades do domnio quando realizam alguma atividade.
De acordo com Daconta, Obrst, Smith (2003, p. 181), as ontologias dizem respeito a
vocabulrios e seus significados, com semntica expressiva, explcita e bem-definida,
possivelmente interpretvel por mquina. As ontologias so o elemento da web semntica que
possibilita o nvel de representao semntico. Para isso, necessrio descrever e representar
modelos mentais sobre domnios especficos, de maneira utilizvel pelo computador, ou seja,
preciso que parte da interpretao semntica possa ser automatizada. As ontologias
permitem que isso seja feito, e, por meio delas os softwares usados na web semntica, como
agentes inteligentes e web services, so capazes de utilizar o conhecimento codificado para,
ao menos parcialmente, entender, isto , interpretar semanticamente, os documentos e objetos.
No raro, encontram-se na literatura autores que, ao dissertarem sobre tesauros,
ontologias, ou outros modelos de representao do conhecimento, se ancoram na Teoria do
Conceito e na Classificao Facetada de Ranganathan. Alvarenga (2001) um exemplo e
afirma que a superao de limitaes no que se refere anlise documentria, depende da
criao de linguagens que possam ser entendidas por homens e mquinas, s assim a
codificao de conceitos, grficos e som seria compreendida por ambos. No h dvida de
que as ontologias so ferramentas que vm colaborar para isso. Por conseguinte, existe cada
vez mais a necessidade de incentivar esforos intelectuais que favoream a construo e a
aplicao desses instrumentos. Alvarenga (2001) reflete a respeito das inovaes que, apesar
de surgirem na atualidade, podem ser vistas com olhos no passado,
mudam-se os meios, sofisticam-se os instrumentos e surgem nomes novos
para designar coisas velhas. Entretanto, a essncia das coisas permanece. Os
tempos digitais acenam para a concretizao de sonhos: da grande biblioteca
universal, do conhecimento sem fronteiras, da extenso infinita dos limites da
memria, do processamento eletrnico de dados complexos, coisas que
embora profetizadas, h anos, dcadas, sculos, somente agora encontram as
condies para se tornarem realidade (ALVARENGA, 2001 p. 20).

Na viso da web semntica, as ontologias proporcionam termos com significados

56
explcitos de maneira a possibilitar que as mquinas processem, automaticamente, as
informaes encontradas na web. Para isso, as ontologias so usadas com linguagens OWL,
XML e XML Scheme, RDF e RDF scheme, que so tecnologias capazes de pesquisar e/ou
captar informaes de diferentes comunidades. Isso, porque o mesmo termo pode ser usado
em diferentes contextos com diferentes significados (polissemia), e o mesmo significado pode
ser representado por diferentes termos em diferentes contextos.

A partir do exposto sobre tesauros, taxonomias e ontologias pode-se afirmar que so


modelos de representao do conhecimento que estruturam, classificam, modelam e
representam conceitos e seus relacionamentos pertinentes num domnio do conhecimento. So
vocabulrios controlados com base em princpios lingusticos e terminolgicos e utilizados
para organizar e recuperar informaes. Dentre esses sistemas, as ontologias se diferenciam
por terem surgido aps o surgimento da web e usam linguagens formais para sua construo
permitindo inferncias automticas atravs de regras. Esses sistemas colaboram na descrio
dos diferentes recursos de informao e na sua posterior recuperao, inclusive na web,
proporcionando um resultado mais efetivo.

57

2.6 Sistemas de Classificao

Os sistemas de classificao bibliogrfica foram desenvolvidos com o objetivo de


organizar os acervos de bibliotecas facilitando o acesso s informaes pelos usurios. A
Classificao Decimal de Dewey foi o primeiro sistema de classificao elaborado e
influenciou a construo de muitos outros sistemas. Surgiu em um determinado contexto
histrico-cientfico de muitas dcadas atrs, e vem sendo atualizado desde ento.
Em tempos mais recentes, se levar em considerao que um acervo uma grande base
de dados, pode-se dizer que o sistema de classificao adotado a interface que coloca o
usurio em contato com aquilo que busca. Alguns dos sistemas de classificao mais citados
na literatura e usados em muitas bibliotecas de todo o mundo so: Classificao Decimal de
Dewey, Classificao da Biblioteca do Congresso dos Estados Unidos, Classificao Decimal
Universal, Classificao de dois pontos e Classificao de Bliss. Tais sistemas so
comentados, brevemente, a seguir.

2.6.1 Classificao Decimal de Dewey (CDD)

Elaborada em 1876 por Mevil Dewey (1851-1931) sob influncia da classificao de


Bacon. Francis Bacon foi um filsofo britnico que, em meados do sculo XIX, quebrou
paradigmas nas classificaes bibliogrficas dando nfase nos assuntos das colees e no
mais nas colees propriamente ditas. O sistema era baseado em anlise do comportamento
humano e agrupado em Histria, Poesia e Filosofia. J a CDD agrupa de forma invertida,
Cincias, Artes e Histria, baseada no conhecimento e estruturada hierarquicamente. Consiste
de uma srie de dez classes principais, que correspondem a disciplinas tradicionais ou reas
de estudo. uma das classificaes mais utilizadas em bibliotecas pelo mundo todo. A partir
da 22 edio de 2003, as notaes numricas ficaram assim:

58
000 Cincia da Computao, Informao e Trabalhos Gerais
100 Filosofia e Psicologia
200 Religio
300 Cincias Sociais
400 Lnguas
500 Cincias
600 Tecnologias
700 Artes. Recreao. Entretenimento. Esportes
800 Lngua. Lingustica. Literatura
900 Geografia. Biografia. Histria.
A notao decimal possibilitou a subdiviso de assuntos do geral at o mais especfico,
por meio de uma perspectiva hierrquica. Quanto mais longa for a notao, maior ser a
especificidade do assunto representado. O desenvolvimento ilimitado e os princpios de
diviso parecem provir da lgica, da tradio e da prtica.
A manuteno formal e a reviso da classificao responsabilidade do comit
editorial da CDD (Editorial Policy Committee EPC) localizado na Biblioteca do Congresso
dos Estados Unidos desde 1972, permitindo o monitoramento da incluso de novos tpicos e
consequentemente a manuteno da garantia literria8. A CDD atualizada a cada sete anos e
a sua verso impressa est agora na 22 edio. A On line Computer Library Center OCLC9,
tambm oferece servios, treinamentos e verses atualizadas da CDD. A classificao de
Dewey continua muito popular graas a sua facilidade e simplicidade de emprego.

2.6.2 Classificao da biblioteca do congresso dos Estados Unidos

A Classificao da Biblioteca do Congresso dos Estados Unidos, ou simplesmente,


8

Garantia literria (literary warrant) conceito introduzido por Wyndam Hume, que defendia que a
determinao de classes usadas na indexao deveria originar-se das classes existentes na literatura. O
princpio requer que as classes, nos sistemas de classificao bibliogrfica, sejam embasadas em assuntos da
literatura publicada, de preferncia que derive de uma viso filosfica do conhecimento.
http://www.oclc.org/dewey/

59
Library of Congress Classification (LCC), foi desenvolvida em 1901, a partir da CDD e da
Classificao Expansiva de Cutter10. Os assuntos esto distribudos em vinte uma classes
principais, representadas por letras maisculas, que vo de A a Z, seguidas de nmeros
arbicos nas subdivises. Ela pouco sistemtica e o seu esquema enumerativo resulta em
rigidez e falta de hospitalidade. Por ter sido elaborada especialmente para atender as
necessidades organizacionais da prpria Biblioteca do Congresso, no possui explicaes
sobre seu uso e suas atualizaes costumam ser lentas. De acordo com Piedade (1977, p. 119),
as alteraes passaram a depender de preocupaes mais gerais, sendo originrio do
conhecimento como apresentado nos livros da Biblioteca do Congresso, baseia-se, pois, na
garantia literria.
A manuteno e a administrao geral da classificao de responsabilidade da
Cataloging Services Division da Biblioteca do Congresso dos Estados Unidos. Em 2002,
surgiu a Classweb, verso online da LCC, que convive com a verso impressa
(http://www.loc.gov).

2.6.3 Classificao Decimal Universal (CDU)

Foi idealizada pelos advogados belgas, Paul Otlet (1868-1944), respeitado na rea de
Cincia da Informao como pioneiro na recuperao da informao e aclamado como um
antecipador da teoria do hipertexto e seu colega Henri La Fontaine (1854-1943), ganhador do
Prmio Nobel da Paz em 1913 (ANJOS, 2008, p. 175). Otlet e La Fontaine conceberam a
idia de organizar um repertrio bibliogrfico universal, ou seja, uma bibliografia de todos os
trabalhos publicados em qualquer lugar do mundo, desde a inveno da imprensa. A idia
inicial de construir essa bibliografia partiu de experincias que Otlet e La Fontaine tinham
sobre a literatura em Cincias Sociais, mas para tanto, necessitavam de uma ferramenta
eficiente de recuperao de informao, no disponvel na poca.
10

O norte americano Charles Ammi Cutter (1837-1903), famoso pela classificao de autoria, desenvolveu
uma classificao bibliogrfica chamada de Expansive Classification, representava os assuntos por meio de
letras. O sistema consistia em sete sistemas classificatrios aplicados do mais simples ao mais complexo
conforme o crescimento do acervo bibliogrfico.

60

Na busca de um sistema para a organizao de entrada de assuntos da sua bibliografia,


tomaram conhecimento da CDD (em sua quinta edio). Estudando o sistema, no
encontraram na CDD exatamente o que procuravam, ento realizaram alteraes e adies,
como o uso de um enfoque facetado para possibilitar a anlise de assunto mais detalhada. E
assim criaram a 1 edio da CDU em 1905.
um sistema de conceitos hierarquicamente estruturados em grandes classes. As dez
classes principais e as subdivises derivam da CDD. As notaes da CDU podem ser
formadas por nmeros, letras, smbolos gregos, marcas de pontuao ou uma combinao
desses. Embora a classe 4 tenha ficado vaga, atualmente encontra-se em desenvolvimento
para futuras expanses. As classes principais da CDU so:
0 Generalidades
1 Filosofia. Psicologia
2 Religio. Teologia
3 Cincias Sociais
4 Vago (em desenvolvimento)
5 Matemticas e Cincias Naturais
6 Cincias Aplicadas. Medicina. Tecnologia
7 Artes. Recreao. Entretenimento. Esporte
8 Lngua. Lingustica. Literatura
9 Geografia. Biografia. Histria.
Hoje, as edies e tradues do esquema so controladas pelo Universal Decimal
Classification Consortium11 (UDCC), com sede na Holanda. A CDU est estruturada de
acordo com as tradicionais disciplinas de estudo, e ao mesmo tempo altamente flexvel
permitindo constantes revises a fim de acompanhar o desenvolvimento do conhecimento. A
verso autorizada da classificao, conhecida como Master Reference File (MRF), possui
mais de 67.000 subdivises, est disponvel no formato de base de dados.
Desde 1992, o consrcio da CDU responsvel por manter a qualidade da estrutura do
11

O stio oficial da UDCC http://udcc.org/

61
sistema, bem como a reviso do seu contedo e da sua extenso. Os resultados so
publicados, anualmente, no jornal Extensions and Corrections to the UDC.

2.6.4 Classificao de Dois Pontos

A Colon Classification (CC) ou Classificao de dois pontos, desenvolvida por Shiyali


Ramamrita Ranganathan (1892-1972), matemtico e bem sucedido bibliotecrio das
universidades de Madras e Benares, foi tambm professor de Cincia da Informao na Delhi
University. Participou de estudos e treinamentos com Berwick Sayers em Londres, sobre os
fundamentos da Teoria da Classificao, que tinha como aporte terico a lgica aristotlica.
Ranganathan retorna ndia aps esse perodo de estudos e elabora o primeiro sistema de
classificao bibliogrfica com bases no princpio analtico-sinttico (esquema de anlises por
facetas12), o que significou uma revoluo na construo de sistemas de classificao. A
primeira edio foi publicada em 1933, na biblioteca da Universidade de Madras. Desde
ento, foram publicadas mais seis edies, sendo a ltima edio (CC7) publicada em 1987.
E, segundo Foskett (1996, p. 323) citado por Anjos (2008, p. 207) a CC tem crescido em
complexidade, o que dificulta sua aceitao por parte das grandes bibliotecas, bem como suas
atualizaes.
A classificao de dois pontos, no era um esquema hierrquico, mas um conjunto de
tabelas independentes, que podiam ser usadas em combinao para subdividir os assuntos. A
ideia era dividir os assuntos em facetas, reunindo grupos por um mesmo princpios de diviso.
Ranganathan dividiu o conhecimento humano em classes principais, s quais foram aplicadas
anlises de facetas. A anlise de facetas coordena conceitos, isto , um assunto por mais
complexo que seja, pode ser representado pela sntese de mais de uma faceta, cada uma
indicando conceitos diferentes. A unidade semntica de base o conceito (chamado de
isolado na linguagem da CC). As tabelas dessa classificao esto em listas de conceitos e
cada conceito expresso por um termo lingustico e por um cdigo alfanumrico.

12

Ver classificao facetada pgina 74

62
Na tentativa de encontrar uma base terica para a escolha e sequncia de facetas,
Ranganathan relacionou o termo facetas a um conjunto de noes abstratas fundamentais
que denominou de categorias - PMEST Personality, Matter, Energy, Space e Time. A
classificao de dois pontos publicada em um volume contendo listas de isolados comuns,
classes principais e suas subdivises e um ndice.
De acordo com Anjos (2008, p. 203), a estrutura dessa classificao uma tabela de
reas principais que inclui as disciplinas tradicionais que podem ser divididas em facetas por
meio das categorias. A notao compreende 26 letras maisculas e 23 letras minsculas do
alfabeto latino, nmeros arbicos de 0 a 9, sinais grficos e as letras gregas delta, para
Misticismo, e sigma, para Cincias Sociais. O plano geral do esquema adota um formato
tripartite:
Cincias Naturais

Humanidades

Cincias Sociais

A. Cincias

. Misticismo e Experincia Espiritual

. Cincias Sociais

B. Matemtica

N. Belas Artes

T. Educao

C. Fsica

O. Literatura

U. Geografia

D. Engenharia

P. Lingustica

V. Histria

E. Qumica

Q. Religio

W. Cincia Poltica

F. Tecnologia

R. Filosofia

X. Economia

G. Biologia

S. Psicologia

Y. Sociologia

H. Geologia

Z. Direito

I. Botnica
J. Agricultura
K. Zoologia
L. Medicina
M. Artes teis ou aplicadas
As subdivises das classes principais so formuladas com notao alfanumrica, por
exemplo:
L Medicina
L2

Sistema digestivo

63
L2:4
L2:42

Doenas do sistema digestivo


Doenas infecciosas do sistemas digestivo

Assim que o assunto de um documento localizado na tabela das classes principais


pode-se delimit-lo mediante a combinao de categorias, que assinalam as facetas. A
metodologia analtico-sinttica permite a incluso de novos temas e maior autonomia ao
classificador, proporcionando grande flexibilidade e hospitalidade.

2.6.5 Classificao de Bliss

Henry Evelyn Bliss (1870-1955), bibliotecrio do College of the City of New York,
que dedicou 25 anos de sua vida aos estudos de classificao e ao desenvolvimento dos
esquemas de classificao bibliogrfica. O importante aspecto desse esquema sua erudio,
manifestada no meticuloso cuidado para que todos os agrupamentos fossem aceitos at
mesmo pelos usurios mais especializados e sua adaptabilidade manifestada num grande
nmero de alternativas sem risco de confuso (PHILLIPS, 1955, p. 164).
Bliss foi o primeiro a dizer que um esquema de classificao representava a
organizao do conhecimento por isso teve o respeito dos cientistas e especialistas no
ramo. No desenvolvimento da classificao bibliogrfica, Bliss estabeleceu sua base filosfica
e terica tendo os seguintes princpios bsicos:
a) consenso - implica que no existe unanimidade em relao localizao das
classes, que pode variar segundo o consenso cientfico-educacional e a concepo de cincia
nos vrios mbitos, supondo-se cada um em uma sistematizao prpria;
b) arranjo de assuntos correlatos - manter juntos os assuntos que tm um
relacionamento forte um com outro, ordenando todas as classes segundo um critrio de
proximidade temtica;
c) gradao em especificidade - listar assuntos do geral ao especfico em um dado
contexto, refere-se a uma espcie de progresso de dependncia, que cada nova disciplina
derive tanto quanto possvel da disciplina precedente; e relatividade das classes e a da

64
classificao;
d) localizao alternativa - pretende conferir flexibilidade ao sistema permitindo
colocar um tema em dois lugares;
e) brevidade da notao - a notao deve ser sinttica, expressiva e sistemtica.
A classificao de materiais bibliogrficos uma classificao de assuntos
bibliogrficos, que faz parte de uma estrutura de organizao do conhecimento e pensamento.
Uma organizao lgica do conhecimento aplicvel, com adaptaes, a sistemas de
classificao bibliogrficos.
Os sistemas gerais de classificao existentes, desenvolvidos de alguma maneira para
atender as necessidades de uma poca e de uma determinada cultura esto representados a
seguir de uma forma sinttica no Quadro 1.
Quadro 1.
Ano

Sntese dos sistemas de classificao bibliogrfica


Classificao

Princpios Gerais

1876

Classificao Decimal de
Dewey - CDD

Hierrquica geral;
racionalismo baconiano rege a diviso;
notao decimal pura;
integridade dos nmeros;
diviso do conhecimento em 9 classes principais (campos do
saber - disciplinas bsicas) e 1 classe generalidades;
subdiviso das classes principais em matrias;
nfase na prtica.

1902

Classificao da Biblioteca do Primazia dos livros sobre os assuntos;


Congresso LCC
primazia da prtica sobre a sistematizao;
primazia das palavras (excesso de ordem alfabtica);
primazia da garantia literria;
primazia da demanda potencial.

19051907

Classificao Decimal
Universal - CDU

1933

Classificao dos Dois Pontos Esquema facetado segue uma ordem lgica consistente de
de Ranganathan
cinco facetas ou categorias: Personality, Matter, Energy,
Space, Time (PMEST), que a base para a construo de

Hierrquica universal;
notao no rigorosamente decimal, mas mista, praticada em
funo da necessidade;
integridade dos nmeros;
diviso do conhecimento em classes principais (9 campos do
saber - disciplinas bsicas - e 1 classe reservada para
generalidades;
subdivises mais avanadas das classes principais que as da
CDD, permitindo uma anlise mais detalhada dos assuntos;
importncia da sintaxe - uso de procedimentos sintticos que
multiplicam as possibilidades de combinaes.

65
todo o esquema;
sintaxe rigorosa composta de frmulas de classificao dos
temas utilizando: a classe principal da matria ou disciplina, a
sequncia PMEST e, as vezes, os ciclos e os nveis;
notao liberada do esquema decimal, a CC utiliza as
possibilidades dos smbolos alfanumricos e smbolos de
conexo para indicar os conceitos de cada faceta.
1935

Classificao Bibliogrfica de Enfoque facetado que trabalha no quadro filosficoBliss - BC


cientfico- positivista do incio do sculo XX;
a ordem das coisas e, portanto, das classes principais, pode
ser estabelecida;
a ordem das coisas a base da classificao do conhecimento
(a ordem das classes principais segue a gradao por
especialidade);
a ordem das coisas determinada pelo uso e pela utilidade
que tem para os pesquisadores nos vrios ramos do
conhecimento (consenso dos especialistas-base da ordenao
por disciplinas);
nveis integrativos;
brevidade da notao.

Fonte: Anjos, 2008, p.226, com adaptao.


Essa seo apresentou alguns princpios das classificaes bibliogrficas clssicas para
obter-se uma classificao consistente. importante entender os princpios e as propriedades
dos vrios sistemas de classificao para explorar seus pontos fortes e trabalhar em suas
fraquezas. No futuro, espera-se que a classificao continue melhorando com novos mtodos,
padres, estruturas de conhecimento e novas formas de visualizao.

66

2.7 Teoria da Classificao

Estudos voltados para classificao no so novos nas reas de Biblioteconomia,


Documentao e Cincia da Informao. Esses estudos apresentam aspectos que
fundamentam a elaborao de sistemas de organizao do conhecimento. Portanto, esta seo
destina-se a apresentar uma base terica que se apoia nas classificaes bibliogrficas e do
conhecimento de maneira que possa auxiliar e fortalecer o desenvolvimento dos SOC.

Dividir em grupos ou
classe, segundo as
diferenas e
semelhanas.
Instrumentos para
represe ntao do

conhecimento

Organiza e
recupe ra
a
informao

Classificao
Arbitrria
Sistemtica
Cdigos de
representao
ndice alfabtico

Figura 2.

Ge rais,
Especializadas,
Facetada ...

Classificao

Como mostra a figura 2, o termo classificao, num sentido geral, aplica-se ao


processo de agrupar ou separar objetos ou ideias individuais, em grupos, de acordo com seus
graus de semelhanas e diferenas, combinando esses grupos em grupos mais amplos
(PHILLIPS, 1955 p. 9). A definio de classificao, ainda que possa variar de acordo com
outros autores, tem elementos essenciais que caracterizam o processo de classificar, que a
formao metdica e sistemtica de grupos onde se estabelecem critrios para a diviso.

67
A classificao , provavelmente, o mtodo mais simples de descobrir ordem na
mltipla e confusa diversidade da natureza. usada como instrumento de representao do
conhecimento com a finalidade de organizar e recuperar informaes. Phillips (1955) nos
conta que Jevons avaliou a relao entre cincia e classificao nas seguintes palavras:
Cincia ... a deteno de identidade, a classificao colocada junto, em
pensamento ou em real proximidade de espao, entre os objetos, os quais as
identidades tenham sido detectadas. Segundo o valor da classificao, coextensivo com o valor da cincia em argumentao geral. Toda vez que
formamos uma classe, ns reduzimos a multiplicidade em unidade, e
detectamos, como Plato disse, um entre muitos (Jevons apud Phillips, 1955,
p. 9, traduo e grifo nosso).

A classificao uma processo mental que est incorporado ao nosso cotidiano, desde
quando temos conscincia e armazenamos algum conhecimento. Enquanto fenmeno social,
as pessoas classificam intuitivamente as coisas, o tempo todo. Com isso, a proposta inicial da
classificao facilitar as operaes da mente quando se percebe e guarda na memria as
caractersticas dos objetos em questo.
Assim, Langridge (2006, p.11) apresenta que o fato de que a maioria das pessoas no
percebe o quanto classifica meramente um indcio da natureza fundamental do processo de
classificao. E no campo das relaes informais do dia a dia que esto as bases para os
outros sistemas de classificao mais formais e complexos.
A classificao feita a partir dos conhecimentos e das experincias do classificador.
De acordo com Piedade (1977, p. 9) classificar [...] dispor os conceitos, segundo suas
semelhanas e diferenas, em certo nmero de grupos metodicamente distribudos. Ento, o
ponto de partida do ato de classificar identificar as semelhanas e diferenas do objeto
observado. Lara (2001) apresenta uma situao que demonstra a importncia das
caractersticas e propriedades no seguinte exemplo
Quando Marco Polo se defronta, em Java, com animais nunca vistos (hoje,
rinocerontes), realiza um esforo para identific-los (e nome-los) consultando
seu estoque de conhecimentos anterior: lanando mo de caractersticas de
animais que j conhece e a partir das descries disponveis em sua cultura,
tenta estabelecer relaes e, por aproximao, classifica o novo a partir de
referncias existentes. Se de imediato identifica-os aos unicrnios - seu corpo,

68
as quatro patas, um chifre acima do nariz, etc., - rapidamente verifica que a
classificao feita no inteiramente prpria, uma vez que, nessa comparao,
constata a existncia de diferenas relativamente ao modelo anterior. (LARA,
2001).

No sentido biblioteconmico, classificao o arranjo dos livros em classes de


assuntos, ao mesmo tempo em que se lhes destinam lugares nas estantes, de acordo com esses
assuntos (SOUZA, 1943, p. 21). Ainda no sentido biblioteconmico, existe a classificao do
conhecimento e no dos livros ou suporte fsico, onde esto registrados os conhecimentos.
Souza tambm descreve que os livros renem os conhecimentos humanos, mas uma coisa
classificar os conhecimentos teoricamente, e outra coisa classificar os portadores desses
conhecimentos.
O processo de classificao est presente na construo de teorias, na acumulao do
conhecimento e sua consequente representao. Segundo Burke (2003, p. 12 apud LIMA,
2004, p. 19), conhecimento tudo aquilo que processado ou sistematizado pelo
pensamento, ainda que a passagem da intuio para o estudo organizado e sistemtico, em
qualquer rea do saber seja, muitas vezes, um movimento difcil que pode levar sculos para
se consumar. Uma vez que os conceitos e suas relaes so entendidos, a classificao pode
ser usada como uma rica representao do que conhecido e, assim, se torna til na
comunicao e no ciclo de explorao, comparao e teorizao.
Uma boa classificao funciona, muitas vezes, da mesma forma que uma teoria,
conectando conceitos em uma estrutura til. Se bem sucedida, como uma teoria, descritiva,
exploratria, heurstica13, proveitosa e at elegante, parcimoniosa e robusta. No entendimento
de Mann (apud SOUZA, 1943, p. 31) uma boa classificao precisa observar as seguintes
caractersticas:

13

ser sistemtica;

ser to completa quanto possvel;

Heurstica, palavra derivada do grego e que significa encontrar, designa uma vertente da Histria que estuda
os documentos, de forma a apurar a verdade neles contida. De igual forma, esta cincia pretende criar uma
metodologia eficaz para o prosseguimento da investigao e da descoberta cientficas. Desta forma, socorrese de todo e qualquer meio e instrumento de trabalho para conseguir o mximo de informao sobre o tema
em questo, partindo do suporte fsico at chegar considerao de elementos como a crtica psicolgica, no
descuidando de pequenos e insignificantes detalhes no processo. Referncia: heurstica. In Infopdia [Em
linha].
Porto:
Porto
Editora,
2003-2009.
[Consulta
2009-03-13].
Disponvel
em:
<URL:http://www.infopedia.pt/$heuristica>.

69

ser minuciosa;

permitir a combinao de opinies e classificar de acordo com os pontos de vista, ou


seja, um consenso entre os especialistas;

ser lgica;

ser explcita;

ter notao fcil de se escrever e de memorizar;

ser flexvel e expansiva, tanto no seu plano como na sua notao;

ter uma classe para obras gerais, e precisa poder classificar qualquer assunto em uma
classe, diviso ou subdiviso, de um modo geral;

ter um ndice alfabtico para facilitar o seu uso e ser documentada de tal forma que
permita a ideia do campo que o sistema abrange.
O ponto de referncia desta seo o artigo de Barbara H. Kwasnik The Role of

Classification in Knowledge Representation and Discovery 1

14

que descreve a relao

entre as classificaes e a representao do conhecimento. O trabalho parte da anlise de


quatro abordagens de estruturas de classificao: hierrquica, em rvore ou arborescente,
paradigmtica e anlise facetada. Existem muitas abordagens no processo de classificao, na
construo e fundamentao dos sistemas de classificao. Cada tipo de processo de
classificao tem objetivos diferentes e cada tipo de sistema de classificao possui
propriedades estruturais diferentes, assim como pontos fortes e fracos no sentido de
representao do conhecimento. No caso desta pesquisa destacam-se a abordagem hierrquica
e a anlise facetada, presentes nos estudos e na literatura dos SOC.

2.7.1 Princpios de hierarquia

O entendimento que temos das classificaes hierrquicas nos foi herdado de


Aristteles, posicionando que toda a natureza unificada compreende um todo e o todo pode
ser dividido em partes: classes naturais, subclasses, sub-subclasses e assim por diante. Esta
14

O papel da classificao nos processos de representao e descoberta de conhecimento. Kwasnik, Barbara H.


The Role of Classification in Knowledge Representation and Discovery -1, 1999. Disponvel em:
http://findarticles.com/p/articles/mi_m1387/is_1_48/ai_57046525

70
contribuio da lgica aristotlica diz respeito diviso dicotmica dos objetos em gnero e
espcie (figura 3). Trata-se de uma hierarquia conceitual que divide um tema em espcies a
partir da aplicao de uma caracterstica classificatria que serve para reunir os grupos
segundo as suas semelhanas.

Figura 3. rvore de Porfrio


Fonte: Dodebei, 2002, p.81, com adaptao

Este processo segue uma srie de regras de associao e distino ordenadas e


sistematizadas. De acordo com Aristteles, somente uma observao exaustiva pode revelar
cada atributo verdadeiro de uma entidade e somente a filosofia pode nos guiar em determinar
os atributos necessrios e suficientes para os membros de uma classe. Somente quando a
entidade classificada corretamente e suas propriedades essenciais so identificadas que
podemos dizer que a conhecemos verdadeiramente.
O alvo da cincia classificar todos os fenmenos de forma no ambgua pelas suas
qualidades essenciais e verdadeiras. Kwasnik (1999) acrescenta que o legado de Aristteles
sobrevive no esprito das modernas aplicaes de classificao, mas a maioria reconhece que
uma hierarquia pura e completa s possvel no ideal. No entanto, em domnios do
conhecimento que tem fundamentos tericos (como a teoria da evoluo na biologia) as

71
hierarquias so as estruturas preferidas para representao do conhecimento. Kwasnik (1999)
sugere alguns requisitos para uma estrutura hierrquica adequada, acrescidos de opinies de
autores citados na literatura:
a) Inclusividade - a hierarquia superior a classe mais inclusiva e descreve o domnio
da classificao. Inclui as subclasses e sub-subclasses. Em Os princpios fundamentais da
classificao, Bliss (1985, p. 78) descreve a inclusividade e totalidade de classes como uma
classe formada de todas as coisas que so consideradas como semelhantes, que correspondem
ao conceito da classe, que so definidas pela classe e denominada por seu termo ou termos;
b) Gnero / espcie - uma hierarquia verdadeira possui somente um tipo de
relacionamento entre suas superclasses e subclasses que o relacionamento gnero / espcie,
tambm chamado de um tipo de;
c) Herana - tudo que verdadeiro para entidades em uma dada classe tambm
verdadeiro para suas subclasses e sub-subclasses, ou seja, os atributos so herdados;
d) Transitividade - como os atributos so herdados, todas as sub-subclasses so
membros, no s de sua superclasse imediata, mas tambm das superclasses acima desta;
e) Regras sistemticas e predeterminadas para associao e distino - as regras
para agrupar entidades em uma classe so determinadas previamente, assim como as regras
para criar subclasses. Assim, todas as entidades em uma dada classe so como as outras em
alguma forma previsvel ou pr-determinada, e essas entidades diferem de outras entidades
em classes irms de alguma forma previsvel ou pr-determinada. Por exemplo, doena
conjuntiva e doena da crnea so associadas por serem tipos de doenas dos olhos, mas se
diferenciam por um critrio sistematicamente pr-determinado de distino no caso, parte
do olho afetada;
f) Mtua exclusividade - uma dada entidade pertence a somente uma classe. Dodebei
(2002, p. 83) interpreta que a diviso deve estar fundamentada no mesmo princpio e para
cada derivao conceitual deve-se usar apenas uma caracterstica do conceito;
g) Critrio necessrio e suficiente - em uma hierarquia, um membro de uma classe

72
determinado por regras de incluso conhecidas como critrio necessrio e suficiente. Para
pertencer a uma classe, uma entidade deve ter os atributos prescritos necessrios. Caso os
tenha, isso constitui garantia suficiente e a entidade deve pertencer classe;
h) Informao completa e compreensvel - uma classificao hierrquica
usualmente bem compreensvel j que todas as regras de agregao e distino devem ser
feitas a priori. Isso significa que, antes da estrutura ser estabelecida, o designer deve conhecer
bastante sobre a extenso das entidades, seus atributos, e o critrio em que se baseia para ditar
as similaridades e diferenas;
i) Herana e economia nas notaes: o formalismo da hierarquia permite
representaes econmicas dos mais complexos atributos. Cada atributo no precisa ser
repetido em cada nvel, pois herdado como parte do esquema. Muita informao pode ser
carregada numa estrutura hierrquica;
j) Inferncia - uma hierarquia permite raciocnio a partir de evidncias incompletas.
Por exemplo, se um paciente tem sintomas de conjuntivite, possvel saber que, como um
tipo de doena dos olhos, a conjuntivite compartilha propriedades com outras doenas dos
olhos. Isso particularmente til se o critrio compartilhado no bvio ou facilmente
observvel;
l) Definies reais - classificaes hierrquicas permitem definies reais, as quais
so consideradas por muitos, como sendo superiores a outros tipos de definies. Isso porque
elas fornecem uma forma de expresso como uma entidade , tal qual alguma coisa e como se
diferencia de algum modo importante. Por exemplo, a definio: um solteiro no um
homem casado; um solteiro um homem; ento ele compartilha todas as caractersticas dos
homens. Homens podem ser solteiros ou casados. Um solteiro um tipo de homem no
casado. O ponto forte desta definio baseia-se na habilidade de descrever sucintamente uma
complexidade de atributos de afinidades e um aspecto importante de distino. Uma definio
real frequentemente uma forma mais eficiente de descrever a natureza das entidades e os
limites de quando, por definio, essa entidade termina;
m) Viso de nvel elevado e perspectiva holstica - se os critrios, pelos quais a
estrutura classificatria construda so tericos no sentido em que revelam distines

73
fundamentais e significantes, ento o sistema de classificao como um todo fornece a
visualizao do fenmeno que est representando. Tal perspectiva, birdeye perspective15,
permite o reconhecimento de padres e anomalias gerais e de relacionamentos de interesse ou
problemticos. Uma viso holstica16, de nvel elevado, geralmente oferece o gatilho para
gerao de conhecimento, permitindo ao pesquisador ir alm das instncias individuais para
ver como esto posicionadas num contexto mais amplo.
Na viso de Kwasnick (1999), as hierarquias so consideradas boas uma vez que
possibilitam economia de notao, riqueza de descrio e incorporao de conhecimento
sobre os relacionamentos. Porm nem todos os domnios podem ser representados em uma
classificao hierrquica, com isso apresentam alguns problemas como: a) mltiplas
hierarquias: muitos fenmenos so entendidos por vrios atributos e relacionamentos,
dependendo do contexto e objetivos da representao; b) critrio mltiplo e diverso: se uma
hierarquia dividida em muitas perspectivas e regras dspares para agrupamento e
diferenciao, ela perde seu poder de ser uma representao clara; c) falta de conhecimento
completo e compreensvel: as hierarquias requerem, previamente, o conhecimento completo
do domnio; d) diferenas de escala: para se manterem os princpios de transitividade e
herana, todas as entidades da hierarquia devem estar no mesmo nvel conceitual de
granularidade. f) regras para incluso de classe so muito restritas: na hierarquia, as
entidades devem pertencer sem ambiguidade a uma classe.
Em resumo, hierarquias so excelentes representaes para o conhecimento de
domnios em que a natureza das entidades e a natureza do significado dos relacionamentos
conhecida. Hierarquias so teis para entidades que so bem definidas e possuem classes com
limites claros. Em geral, algumas teorias ou modelos so necessrios para guiar a
identificao de entidades, as regras de associao e distino e a ordem na qual estas regras
so requeridas.

15

16

Expresso inglesa para: uma viso geral - de acordo com Dictionary of English Idioms de Daphnem M.
Gulland e David G. Hinds-Howell, 1986.
No sentido de totalidade, o todo levando em considerao as partes e suas inter-relaes.

74

2.7.2 Classificao facetada

A teoria da classificao facetada, surgiu na primeira metade do sculo XX e foi


desenvolvida por Shiyali Ramamrita Ranganathan, a partir da Collon Classification, tabela de
classificao elaborada para a organizao do acervo da Biblioteca da Universidade de
Madras, na ndia. Ranganathan conseguiu determinar princpios para uma nova teoria da
classificao bibliogrfica e o fez tendo como base o prprio conhecimento. As facetas no
so uma estrutura de representao diferente, mas uma abordagem diferente do processo de
classificao. Ao longo de muitos anos, o sistema de facetas tem sido reinterpretado em
muitos contextos e surpreendente a variedade de aplicaes: classificao de objetos, em
programas de computador, livros, pginas da internet, objetos de arte, e-comrcio entre
outros.
As facetas se constituem em manifestaes das categorias fundamentais e demarcam a
primeira classificao de assuntos dentro de um grande universo. Langridge (2006) entende as
categorias fundamentais como uma estrutura mais abrangente da classificao e as facetas
como manifestaes das categorias em diferentes classes.

O sistema facetado passou a

permitir que mais de uma categoria fosse utilizada por vez como caracterstica de
classificao. Ranganathan (1962) instituiu cinco categorias fundamentais, tambm
conhecidas pela sigla PMEST, originalmente do ingls:

Personalidade (Personality) facetas de um assunto que representa a sua essncia,


por exemplo: biblioteca (classe principal) e biblioteca universitria (personalidade);

Matria (Matter) - matrias e substncias que constituem as coisas, por exemplo:


livros, peridicos;

Energia (Energy) processos, operaes, aes, tcnicas, mtodos, fenmenos, por


exemplo: processamento tcnico, emprstimo;

Espao (Space) diviso geogrfica;

Tempo (Time) diviso cronolgica.


Para Srivastava (1964, p. 15), a anlise facetada consiste em todo o processo de

75
determinao das facetas de um domnio do conhecimento, comeando pela diviso de um
assunto quebrando-o em diferentes facetas e mencionando todas as possveis entidades a que
pertencem na classificao do conhecimento. As classificaes so vistas como estveis,
provisrias e dinmicas, no entanto, o grande desafio construir classificaes que sejam
flexveis e que possam acomodar novos fenmenos com mais facilidade e rapidez .
Um conjunto de informaes pode ser organizado de vrias formas, seguindo
diferentes esquemas de organizao. As notcias de um jornal, por exemplo, podem ser
organizadas pelo seu assunto (poltica, economia, esportes, etc.), cronologicamente pela data
em que foram publicadas ou alfabeticamente pelo nome do reprter. A classificao desse
conjunto de informaes em diferentes esquemas chamado de classificao facetada ou
multidimensional (faceted classification). Cada esquema representa uma dimenso na
estrutura que organiza a informao. A web, por ser um ambiente virtual, permite facilmente
apresentar a mesma informao organizada de vrias formas. No mundo fsico, ao contrrio,
isso praticamente impossvel. As longas notaes criadas em esquemas multidimensionais
no so fceis de usar para fazer o arranjo de pacotes de informao fsica em prateleiras.
Entretanto, em catlogos elas so muito teis, uma vez que cada dimenso pode ser buscada
independentemente (TAYLOR, 1999).
Uma das vantagens da classificao facetada que ela oferece ao usurio diversas
maneiras de buscar a mesma informao, acomodando diferentes estratgias de busca e
modelos conceituais. Kwasnik (1999) aponta que para a criao de facetas deve-se observar
a) escolha das facetas: decidir, previamente, os critrio para descrever o domnio, os
quais determinam as categorias fundamentais das facetas, por exemplo: perodo, lugar,
processo, material e objeto e
b) anlise das entidades usando facetas: escolher a faceta apropriada para descrever
a entidade. O processo de anlise a viso do objeto de todos os ngulos, isto , olhar o
mesmo objeto sob perspectivas diferentes. Na anlise facetada, Kwasnik (1999) tambm
apresenta vantagens e limitaes.
Vantagens da anlise facetada:

76
a) no requer conhecimento completo do domnio - no preciso conhecer a
extenso total das entidades nem todos os seus relacionamentos. Isso particularmente til
em campos novos e emergentes, que ainda sofrem mudanas;
b) hospitalidade - podem acomodar novas entidades;
c) flexibilidade - abordagem Lego descreve cada objeto por um nmero
independente de atributos, os quais podem ser invocados com uma flexibilidade interminvel.
Essa flexibilidade pode ser usada para descobrir novas e interessantes associaes: abordagem
ps-coordenada e os atributos podem ser combinados na hora da recuperao. Em contraste
com a pr-coordenao, que usada na maioria das hierarquias, em que inclui a regra da
incluso de classes, a entidade est classificada e permanece fixa para sempre;
d) expressividade - a abordagem facetada mais expressiva, pois cada faceta livre
para incorporar o vocabulrio e a estrutura mais conveniente para representar o conhecimento
pela faceta;
e) podem acomodar uma variedade de estruturas tericas e modelos - possibilitam
a representao de uma variedade de perspectivas;
f) mltiplas perspectivas - permitem que as entidades sejam vistas de uma variedade
de perspectivas. possvel descrever um cachorro como um animal, como um bicho de
estimao, como comida, etc.
Limitaes da anlise facetada:
a) dificuldade de estabelecer facetas apropriadas - ponto forte da classificao
facetada est nas categorias fundamentais, que devem expressar atributos importantes das
entidades que esto sendo classificadas. Sem conhecimento do domnio e dos usurios
potenciais, isso torna-se mais difcil;
b) falta de relacionamento entre as facetas - a maioria das classificaes facetadas
no fazem um bom trabalho de conectar as vrias facetas de forma significante. Cada faceta
funciona como um reino separado, no conecta explicitamente as descries;
c) dificuldade de visualizao - os relacionamentos no ficam evidentes, em cada
faceta h uma lgica interna diferente. Como resultado, cada esquema de faceta pode ser visto
por uma ou duas dimenses de cada vez.
Os esquemas de facetas continuam florescendo, principalmente no ambiente digital,

77
pois permitem uma forma sistemtica de ver o mundo. A tecnologia da informao tem
promovido novas formas de visualizao multidimensional e o desenvolvimento de formas
assistidas por computador, bem como descoberta de novos padres que facilitam a
organizao e a recuperao da informao.

78

2.8 Conceito e Relaes entre Conceitos

How we see the world is how we understand it. Things are seen in
relationship to other things and actions. Connections are made, naming
takes place and meaning is formulated. We all engage with the world
around us in diverse ways, both actively and passively.
The meanings and names given to things are not fixed, but instead fluid.
We classify and catalogue but over time these categories and attendant
meanings change, as does the importance they hold for us. The medieval
world view, or cosmology, bears little relationship to the way we
understand our place in the world today.17

A forma que se v o mundo como o compreendemos. As coisas so vistas em


relao as outras coisas e aes. A partir da as conexes so feitas, e os objetos recebem
nomes e definies. No universo tudo est conectado a nossa volta de diversas maneiras.
Assim, a relao de entendimento do mundo e representado sob os olhos da Cincia da
Informao e da Teoria do Conceito est descrito nesta seo.

2.8.1 Teoria do conceito

A Teoria do Conceito foi desenvolvida por Ingertraut Dahlberg na dcada de 1970 na


Alemanha. Dahlberg foi uma das pioneiras na organizao do conhecimento e iniciou sua
carreira no Instituto Gmelin. Fundou a Society for Classification em 1977, e o peridico
International Classification em 1974, que a partir de 1993 passou a chamar-se Knowledge
Organization (KO). Dahlberg foi, tambm, a fundadora, em 1993, da International Society for
Knowledge Organization (ISKO).
17

Ns vemos o mundo como ns o entendemos. Coisas so vistas em relao a outras coisa e aes. Conexes
so feitas, denominaes ganham lugar e significados so formulados. Ns todos nos envolvemos com o
mundo ao nosso redor de diversas maneiras, tanto ativa quanto passivamente. Os significados e os nomes
dados para as coisas no so fixos, mas flexveis. Ns classificamos e catalogamos mas com o tempo essas
categorias os significados mudam, assim como a importncia que tm para ns. A viso do mundo medieval,
ou a cosmologia, tem pouco a ver com o jeito que entendemos nosso lugar no mundo hoje. (Abertura da
exposio Classified: Contemporary Art at Tate Britain, curadoras: Clarrie Wallis and Andrew Wilson, no
museu Tate Britain, Londres Inglaterra, julho 2009. traduo nossa)

79

A Teoria do Conceito viabiliza uma fundamentao slida para a determinao e o


entendimento dos conceitos, assim denominados, com a finalidade de representao e
recuperao da informao. Inicialmente, Dahlberg, visava empregar princpios para a
elaborao de terminologias no mbito das Cincias Sociais. Posteriormente, utiliza a Teoria
do Conceito tambm para a construo de linguagens documentrias, especialmente na
elaborao de tesauros, com o objetivo de fornecer bases seguras, tanto para estabelecer
relacionamentos quanto para a determinao do termo (CAMPOS, 2001, p. 92).
Dahlberg (1978) define conceito como unidades do conhecimento, identificadas por
meio de enunciados verdadeiros de um determinado objeto representados na forma verbal.
Interpretando o tringulo conceitual de Dahlberg, figura 4, temos no pice o referente
(aquilo que se quer conceituar), as caractersticas (predicao verdadeira sobre o referente) e
a forma verbal (denominao do referente) representado por um termo.

Figura 4.

Tringulo conceitual

Fonte: Dahlberg (1978, p. 13), com adaptao.

80

2.8.1.1 Conceito individual e conceito geral

O processo de conhecimento acontece basicamente por meio de analogia. Quando nos


deparamos com algo desconhecido reagimos por aproximao, procuramos aquele recorte de
contedo, j presente na nossa enciclopdia (ECO, 1998 apud LARA, 2001). Para Eco,
enciclopdia refere-se ao conhecimento prvio que se tem das coisas, ou seja, nossa
enciclopdia particular.
Portanto, o homem foi capaz de relacionar-se com os objetos que o cercam e de
construir enunciados sobre eles. Para Dahlberg (1978), conceito individual aquele que se
refere a algo nico, diferente dos demais, constituindo uma unidade inconfundvel e
caracterizado pela presena de tempo e espao, por exemplo, uma pessoa, uma organizao,
um acontecimento nico (primeira guerra mundial).
Enquanto que o conceito geral se situa fora do tempo e do espao e se refere a uma
multiplicidade de coisas (pessoas, organizaes, notcias em geral), podendo tambm ser
alguma coisa abstrata, como por exemplo, imaginao, leitura, emoo. Para cada referente
ou item de referncia so elaborados enunciados verdadeiros que formaro o conceito desse
objeto, representado por um signo lingustico (termo). A partir disso, atribuem-se predicados
ao referente denominados de caractersticas, que so propriedades dos objetos e, no nvel do
conceito, passam a ser caractersticas do conceito. Essas caractersticas podem ser de dois
tipos: as essenciais (necessrias) e as acidentais (adicionais ou possveis e permitem a criao
de sub-classes). As caractersticas essenciais definem os conceitos gerais e os conceitos
individuais so determinados a partir das caractersticas essenciais acrescentando as
acidentais.
As caractersticas acidentais podem ser gerais (ter determinada forma, ter alguma
falha, ter uma certa cor), ou individualizantes (ter um determinado local, ter um certo tempo,
algo particular que caracteriza o objeto como nico).

81

2.8.1.2 Intenso e extenso do conceito

Para Dahlberg (1978, p. 24-25), a intenso de um conceito a soma total de suas


caractersticas, bem como a soma total de seus conceitos genricos e das caractersticas
especificadoras. Numa definio, nem todos os conceitos genricos precisam ser
mencionados, para representar a intenso do conceito. Apenas o mais prximo suficiente,
uma vez que este necessariamente contm os demais. Por exemplo: a intenso do conceito
casa a seguinte:

construo;

feita de tijolo ou madeira;

contm sala e dormitrios;

contm portas e janelas;

contm teto e piso; etc.


A extenso do conceito pode ser entendida como a soma dos conceitos mais

especficos para os quais a intenso verdadeira. Isto , a classe dos conceitos de tais objetos
dos quais se pode dizer que possuem aquelas caractersticas em comum que se encontram na
intenso do mesmo conceito. A extenso do conceito pode ser de dois tipos:

extenso de um conceito genrico em relao com os conceitos especficos. Por


exemplo:
Casa
casa de pedra
casa de madeira

extenso dos possveis conceitos individuais. Compreende os indivduos para os quais


vlida a predicao genrica do conceito. Por exemplo:
Casa
casa do Presidente da Repblica
casa do vizinho
O conhecimento da formao de um conceito, bem como de seus possveis

82
relacionamentos de fundamental importncia na comparao e na construo de sistemas de
conceitos, e tambm, na forma de organizao dos conceitos pertencentes a um campo de
estudo ou uma disciplina. Pode-se ter em mente que no campo da organizao e representao
do

conhecimento

torna-se

possvel

construir

melhores

definies

conceituais

e,

consequentemente aumentam as possibilidades de se fazer uma representao consistente do


universo referente.

2.8.2 Categorizao e relaes entre conceitos

Com a evoluo tecnolgica e a demanda por formas de organizao e recuperao de


informaes mais complexas, a categorizao e as relaes entre conceitos so fundamentais e
encontram-se cada vez mais detalhadas em sistemas de organizao do conhecimento. Por
isso, esta seo tentar esclarecer alguns cuidados para se fazer uma melhor categorizao e
relacionamentos, partindo de tcnicas e princpios usados na Cincia da Informao.
Considerando que o conceito, geral ou individual, uma sntese de caractersticas,
Dahlberg (1978, p. 18) afirma que h relao entre conceitos quando conceitos diferentes
possuem uma ou mais caractersticas em comum. Para tal comparao pode-se valer de dois
tipos de abordagem: quantitativa (ponto de vista da lgica formal) e qualitativa (aspectos
formais e materiais).
As relaes quantitativas medem as similaridades das caractersticas de diferentes
conceitos, utilizando-se de uma viso de lgica para tal comparao. Conforme mostra o
Quadro 2. Na relao de identidade conceitual as caractersticas de dois conceitos so as
mesmas; na relao de incluso conceitual as caractersticas de um conceito A esto contidas
em um conceito B, acrescida de uma ou mais caracterstica; na relao de interseo
conceitual as caractersticas de dois conceitos se sobrepem; e na disjuno conceitual as
caractersticas de dois conceitos no tm nada em comum.

83
Quadro 2.

Comparao de conceitos do ponto de vista da lgica formal


Tipos de Relao

Conceito A

Conceito B

Identidade de Caractersticas

( X, X, X )

( X, X, X )

( X, X )

( X, X, O )

Interseo de Caractersticas

( X, O, Y )

( O, Z, W )

Disjuno de Caractersticas

( X, O, Y )

( Z, W, K )

Incluso de Caractersticas

Fonte: Dahlberg (1978, p. 18), com adaptao

As relaes qualitativas consideram os aspectos formais e materiais e est


subdividida em: relaes formal / categorial; relaes material / paradigmtica; e relaes
funcional / sintagmtica.
A relao formal / categorial acontece entre o tipo de item de referncia (referente),
que est sendo analisado e uma categoria. As caractersticas podem, s vezes, corresponder a
uma hierarquia de caractersticas, sendo que o predicado de um enunciado pode tornar-se
sujeito de um novo enunciado, e assim sucessivamente at atingir uma caracterstica to geral,
na sua mais ampla extenso, tornando-se uma categoria. Partindo de uma declarao sobre o
referente / objeto, possvel chegar categoria desse objeto, aplicando a predicao.
Conforme o Quadro 3.
Quadro 3.

Categoria por predicao

Como categoriz ar um peridico?


Um peridico semanal um peridico
Um peridico um documento publicado em intervalos regulares
Um documento publicado em intervalos regulares um documento
Um documento um veculo de informao
Um veculo de informao um objeto material

Fonte: Dahlberg (1978, p. 19) apud Campos (2001, p. 96)

84
A relao material / paradigmtica acontece entre conceitos que tm caractersticas
da mesma natureza no interior de uma categoria. Pode ser de trs tipos: hierrquica,
hierrquica partitiva e de oposio.

A relao hierrquica baseia-se na relao lgica de implicao. Quando o conceito


mais especfico possui caractersticas adicionais em relao ao conceito mais genrico diz-se
que a relao hierrquica de gnero-espcie (ou relao de abstrao ou de subordinao).
Quando dois conceitos diferem em uma caracterstica, e so especializaes de um mesmo
conceito mais genrico, a relao hierrquica dita relao lateral (ou relao em renques ou
de coordenao). Por exemplo:
Relao de gnero-espcie

Relao Lateral

1 rvore

rvore

1.1 rvore Frutfera

rvore Frutfera

rvore de nozes

1.1.1 Pereira

Pereira

Amendoeira

1.1.1 Pessegueiro

Macieira

Nogueira

A relao partitiva existe entre o todo e suas partes, sendo que as partes tambm
podem estar relacionadas entre si. As relaes partitivas podem ocorrer em:

sistema natural, por exemplo: um organismo vivo - animal ou vegetal (todo) e as


partes desse organismo (partes);

sistema artificial, por exemplo: uma mquina (todo) e a partes da mquina (partes);

organizao humana, por exemplo: um pas (todo) e os estados, municpios (partes);

assunto ou rea do conhecimento, por exemplo: uma disciplina (todo) e os diferentes


sub-campos (partes).
A figura 5 apresenta um esquema de relao hierrquica partitiva.

85

Figura 5.

Relao hierrquica partitiva

Fonte: Cintra e co-autores (2000, p. 39)


De acordo com Veltman (2004, p. 20), as relaes de gnero-espcie e as todo-parte,
devido importncia para as diversas disciplinas, receberam denominaes diferentes. Isso se
deve ao problema da especializao das disciplinas, que leva a uma terminologia redundante
(LIMA, 2008, p. 74). O Quadro 4 apresenta os autores / disciplinas e as denominaes
correspondentes.
Quadro 4.

Denominaes para relaes gnero-espcie e todo-parte

Autor/Disciplina

Gnero/
Espcie

Partitiva

Lgica

Divisio

Partitio

Wster

Subordinao Lgica

Partitiva

Dahlberg

Abstrao-Especificao
Gnero-Espcie

Partio
Todo-Parte

Perreault

Tipo-Kind

Todo-Parte

Shreider, Bean

Hiponmia/Hiperonmia

Meronmia

Tversky, Pribbenow

Taxonomia

Partonmia

Smith, Mlopolous

Generalizao

Agregao

Biblioteconomia

Hierrquica
GeralEspecfico

Hierrquica
Geral PartitivoEspecfico Partitivo

um (isA)
Herana (pai-filho)

Parte / Tem Parte


Composio

Cincia da Informao
Cincia da Computao

Fonte: Veltman (2004, p. 21) adaptada e traduzida por Lima (2008, p. 75)

86

A relao de oposio pode ser de trs tipos: relao de oposio contraditria


(numrico - no numrico), relao de oposio contrria (preto branco), relao de
oposio positivo neutro negativo (favorvel neutro desfavorvel).
As relaes funcionais / sintagmticas ocorrem entre conceitos de diferentes
categorias. As relaes funcionais aplicam-se, sobretudo, a conceitos que expressam processo
ou operao. No plano da linguagem, os conceitos podem ser expressos por verbos ou pela
derivao de verbos. Num primeiro nvel de relacionamento pode-se trabalhar com a
perguntas Quem? Fez o que? Num segundo nvel as relaes envolvem tambm, proposta,
condio, tempo, lugar, pessoa, objeto e correspondem s questes: Porque? Como? Quando?
Onde? Quem? e O que? por exemplo: o conceito medio (verbo medir), relaciona-se com
objeto medido, propsito da medio, instrumento de medio, unidade de medio,
etc.
A grande dificuldade de definir as relaes funcionais / sintagmticas deve-se ao fato
de que as relaes entre os conceitos ocorrem em diferentes categorias e podem se relacionar
entre si em algum momento. Isso, porque as associaes dependem, em larga escala, do
universo de referncia considerado e da organizao dos domnios de especificidade. O
Quadro 5 rene exemplos passveis de esclarecer as complexas relaes entre termos.
Sobre as relaes associativas Saussure (1977, p. 145) aponta que os grupos formados
por associao mental, no se limitam a aproximar os termos que apresentam algo em
comum, mas o esprito capta a natureza das relaes que os unem em cada caso e cria, com
isso, tantas sries associativas quantas relaes diversas existam.

87
Quadro 5.

Relaes associativas entre termos


Relao

Exemplos

Atributiva

economia / nvel de atividade econmica

Disciplina ou campo de estudo /


Objeto ou fenmeno estudado

entomologia / insetos
esttica / beleza

Processo ou operao /
Seu agente ou instrumento

iluminao / lmpadas
automao / computadores

Influncia

poltica monetria / inflao

Matria-prima / produto

bauxita / alumnio

Coisa / aplicao

abastecimento de gua / irrigao

Ao / resultado da ao

tecelagem / tecido

Causalidade ou causa / consequncia

crescimento econmico /
desenvolvimento econmico

Efeito / causa

medicamento / cura da doena

Dependncia causal

doenas patognicas / agentes

Atividade / agente

tabagismo / fumo

Produto / propriedade

veneno / toxidade

Atividades complementares

compra / venda

Opostos

vida / morte

Ao / seu paciente

priso / criminoso

Coisa / seu contra-agente

insetos / inseticidas

Atividade / produto

tecelagem / tecido

Pessoas ou coisas / suas origens


brasileiro / Brasil
Fonte: Cintra e co-auores, 2000, p. 48-51, com adaptao

2.8.3 Sistema de conceitos multidimensionais

A multidimensionalidade ou polihierarquia significa que um assunto pode ser


classificado em hierarquias diferentes. Campos (2001, p. 88) afirma que nesse tipo de sistema
no pode haver simplificao, a maneira de representao reflete que a realidade pode ser
percebida e concebida em diferentes contextos conceituais. Contudo, quando as
polihierarquias so complexas, sugere-se que sejam divididas em vrias monohierarquias,

88
com referncias cruzadas entre elas. A polihierarquia permite que um mesmo termo especfico
possa estar subordinado a mais de um termo genrico, podendo ser representadas nos
diagramas em linha e diagramas em linha bidirecional, chamados de rvore de Busca.
Para Campos (2001, p. 89) as rvores de Busca so teis para representar
polihierarquias por possibilitarem um entendimento melhor do conceito, que muitas vezes,
somente por meio de um plano grfico o especialista pode evidenciar as relaes que no
esto claras. Por exemplo:
Reao

Reao de partcula

Fisso ativa

Atrao

Fisso

Atrao alfa

Fisso beta
Atrao

Figura 6.

Sistema de conceitos polihierrquicos

Fonte: ISO-DIS-704. Princples and methods of terminology (1993, apud Campos, 2001, p.
89)

Os relacionamentos polihierrquicos so comumente utilizados na construo de


taxonomias navegacionais, pois oferecem ao usurio mais de um caminho para a localizao
de um mesmo produto, considerando que esse produto tenha carter multidimensional. Com
isso, facilitando a recuperao da informao.

89

2.9 Lingustica, Terminologia e os SOC

Esta seo tem como objetivo buscar subsdios tericos que fundamentam a reflexo
sobre linguagens e termos e apontar caractersticas expressivas para a elaborao dos SOC
que se destacam nas reas de Lingustica e Terminologia. Porm, o escopo deste trabalho no
permite nenhum tipo de estudo exaustivo, nem mesmo, ir alm da colaborao desses dois
campos do conhecimento para a construo e o desenvolvimento de sistemas de organizao
do conhecimento.

2.9.1 Lingustica

Na rea de Cincia da Informao, a contribuio da Lingustica reconhecida pela


Documentao, principalmente no que diz respeito utilizao de parmetros para

elaborao de linguagens documentrias e, consequentemente, para a construo de SOC.


Os SOC so constitudos de elementos que delimitam uma determinada rea do
conhecimento, sendo o termo, um dos elementos. Esses termos so subordinados a uma
terminologia contextualizada pelo contedo informacional dentro de um domnio especfico
do conhecimento. No obstante, a noo semitica de signo, significado e significante,
postulada por Ferdinand de Saussure so fatores relevantes na elaborao dos SOC.
O signo lingustico dito por Saussure (1977, p. 80-87) no une uma coisa e uma
palavra, mas um conceito e uma imagem acstica18. Esta imagem acstica no o som
material (puramente fsico) e sim a representao deste na nossa mente e nos nossos sentidos.
O conceito e a imagem acstica podem ser substitudos por significado e significante,
respectivamente. Sendo ento, o signo o total resultante da associao de um significante com
um significado. Da, utilizou-se a palavra smbolo para designar o signo lingustico ou o que
chamamos de significante que possui uma relao racional com o significado.
18

A imagem acstica , por sua excelncia, a representao natural da palavra enquanto fato de lngua virtual,
fora de toda realizao pela fala (Saussure, 1977 p. 80)

90

Quando se fala em significado, no contexto da organizao e representao do


conhecimento, logo pensamos em semntica. Em Lingustica, semntica o estudo dos
significados. Sem entrar em questes filosficas, nem discutir, alm do que j foi exposto no
pargrafo acima, as diversas conceituaes sobre o o que significado, mesmo porque foge
do objetivo desta pesquisa, toma-se como definio para significado a descrita por Lyons
(1987, p. 133) onde diz que os significados so idias ou conceitos que se podem transferir
da mente do falante para a do ouvinte por encarnar-se, por assim dizer, nas formas de uma ou
outra lngua.
Ainda no mbito da semntica, Lyons (1987, p. 136) alerta para a distino entre o
significado das palavras (lexemas) e o significado das sentenas19. O significado de uma
sentena depende do significado de seus lexemas constituintes, e o significado dos lexemas
depender do significado da sentena em que aparecem. Da mesma forma, a estrutura
gramatical das sentenas relevante para a determinao de seu significado. Portanto, o
significado de sentena, o gramatical e o lexical fazem parte do escopo da semntica
lingustica.
Os SOC so ferramentas semnticas e so constitudos de termos, conceitos e relaes
semnticas. Uma teoria para os SOC deve explicar como os termos, conceitos e os
relacionamentos semnticos devem ser selecionados. A seguir so descritos alguns
relacionamentos semnticos:

antnimo - onde o termo A o oposto de B, por exemplo: frio o oposto de calor;

sinnimo o termo A denota o mesmo que B; A equivalente com B, por exemplo:


professor equivalente a docente ;

homonmia dois termos A e B so expressos pelo mesmo smbolo. Podem ser de


identidade fnica (homfono) e de identidade grfica (homgrafo), por exemplo:
sesso (cinema, teatro) seo (parte de um todo, segmento) e registro (ato de
registrar) - registro (chave de torneira), respectivamente;

hiponmia relao gnero-espcie: relao hierrquica subordinada (A um tipo de


B, A subordinado de B), por exemplo: flor e margarida, margarida um tipo de flor,

19

Significado lexical e significado de sentena hoje consenso entre linguistas no sentido de que no se pode
dar conta de um sem notar o outro (Lyon, 1987 p. 136)

91
existe uma relao de subordinao;

hiperonmia relao gnero-espcie em que B o gnero de A, por exemplo:


margarida uma espcie de flor, flor gnero de margarida;

meronmia relao entre o todo e suas partes (A parte de B), meronmia o nome
de uma constituinte de, a substncia de ou um membro de alguma coisa, por exemplo:
corpo humano (todo); cabea, tronco, membros (partes).
Assim, os signos, tanto para linguagens documentrias como para os SOC, so

descritores resultantes de uma construo pertinente para a significao, ou seja, formas


lingusticas que expressam conceitos que representam o contedo de documentos. Portanto, a
Lingustica fornece o aporte terico que possibilita o desenvolvimento desses instrumentos e
permite que se estabelea uma ponte entre, pelo menos, duas linguagens: a linguagem do
sistema e a linguagem do usurio.

2.9.2 Terminologia

A Terminologia nasceu na dcada de 1930 com Eugne Wster, a quem se atribui o


papel de fundador da Teoria Geral da Terminologia ou TGT. Wster tem o foco na preciso
da linguagem, com a criao de uma teoria e de uma metodologia da terminologia a fim de
conseguir uma comunicao inequvoca e sem ambiguidade sobre os assuntos especializados.
O prprio termo terminologia polissmico, refere-se tanto Terminologia 20 terica
quanto terminologia concreta. Na primeira acepo, a Terminologia trata de uma rea do
conhecimento, que denomina conceitos, ou seja, conjunto de metodologias e diretrizes que
regem a descrio, formao dos termos e estruturao de campos conceituais. Na segunda
acepo, refere-se a um conjunto de termos de um campo especfico do conhecimento
relacionados com uma lngua de especialidade, so produtos gerados pela prtica. Nesse
contexto, os termos esto relacionados e definidos rigorosamente para designar os conceitos
que lhe so teis, usados na construo de linguagens especializadas, linguagens
20

Para distinguir, optou-se pela grafia de Terminologia, com T maisculo, para a Terminologia tericometodolgica, e com t minsculo, a terminologia concreta ou produto.

92
documentrias e na elaborao dos SOC. A Terminologia como campo inter e transdisciplinar
trabalha com a descrio e ordenamento do conhecimento no nvel cognitivo, com a
transferncia do conhecimento em nvel comunicacional e com os elementos centrais,
conceitos, termos e reas de experincias no nvel de normas internacionais (ISO).
De fato, a transferncia de informao, requer um sistema de significao claro e
explcito, pois um sistema de comunicao no existe sem um repertrio de signos e sem um
corpo de regras que definam como se selecionam e se combinam esses signos para formar as
mensagens transmissveis. Como qualquer outra unidade significativa de um sistema
lingustico, os termos compe um sistema estruturado, e em determinado nvel se relacionam,
com as outras unidades do mesmo nvel e com as unidades dos demais nveis, participando
com a construo do discurso (CABR, 1993, p. 170). A terminologia de uma rea especfica,
como se sabe, constituda pelo conjunto de palavras especializadas de uma determinada
disciplina. Os termos, que so as unidades de base da terminologia, designam os conceitos
prprios de cada disciplina especializada (CABR, 1993, p. 169). Com isso, proporcionando
um maior entendimento entre pesquisadores e demais usurio dos sistemas de comunicao
nas cincias.
Um princpio fundamental da comunicao relaciona-se entre o entendimento da
mensagem e o receptor, ou seja, no ser possvel estabelecer comunicao sem a
compreenso mtua. A Cincia da Informao manifesta esta preocupao quando toma a
informao como objeto de estudo em seus aspectos de construo, comunicao e uso da
informao. Nos contextos tcnico-cientficos, a terminologia assume papel fundamental pelo
fato de trabalhar com as lnguas de especialidades, responsveis por garantir a comunicao
rpida e precisa entre os interlocutores (pesquisadores,

profissionais ou estudantes). A

informao deve ser objetiva em qualquer forma de representao, no seu uso para a
comunicao e tambm na adaptao de conhecimentos ou pensamentos.
Lara (2004, p. 234) diz que o dilogo com a Terminologia nasce quando um pblico
heterogneo acessa o sistema (um site, por exemplo) deve reconhecer ou ter condies de
conhecer o que est sendo veiculado, o que diz respeito eminentemente linguagem. Quando
os domnios do saber so reas especializadas, o papel da Terminologia bem claro,

93
fornecendo referencial concreto para a interpretao dos termos, assim como so definidos em
suas terminologias. Porm, mesmo quando o universo no especializado e a delimitao no
est bem definida, os princpios terminolgicos so essenciais para referir o processo de
organizao dos elementos que esto em questo.
A Terminologia visa o uso da unidade lexical termo, como elemento de um processo
de significao e representao de conceitos, seja de um campo especfico ou de um conjunto
de campos especializados. Como tal, visa a representao de um nico conceito para cada
denominao. Por exemplo: os dicionrios de lngua geral (produto da lexicografia), que para
cada entrada, ou seja, cada palavra, descreve inmeros significados, conforme os possveis
empregos da palavra. No entanto, os dicionrios especializados (produto da terminologia),
cada entrada ou termo, descreve apenas um conceito.
Os estudos mais recentes na organizao e representao do conhecimento,
recomendam a escolha de uma das teorias da Terminologia para a construo de SOC, de
acordo com o campo do conhecimento que ser trabalhado. Algumas teorias da Terminologia
merecem destaque como: a TGT, pioneira e responsvel pela base do trabalho terminolgico,
possui uma perspectiva prescritiva e normativa que visa rotular e padronizar definitivamente o
uso de termos e conceitos, sem considerar as inmeras variaes possveis em um contexto
comunicacional. A Teoria da Socioterminologia de Franois Gaudin, sob uma perspectiva
descritiva com nfase ao uso social da lngua, aceita a variao e a flexibilidade lexical e
conceitual, proporcionando uma aproximao entre mecanismos de informao e usurios. E
a Teoria Comunicativa da Terminologia (TCT) de Maria Teresa Cabr que se fundamenta em
aspectos comunicativos das lnguas naturais para melhor conduzir a comunicao entre
especialistas (SALES, 2008, p. 80)

2.9.2.1 Unidade Terminolgica

De acordo com a forma, Cabr (1993, p. 178-181) apresenta uma classificao para as
unidades terminolgicas, que contribui para a construo dos SOC, e seguem alguns critrios:

94
a) quanto ao nmero de fonemas simples (cido) e complexas (acidificao);
b) quanto ao tipo de morfema derivados, formados pela agregao de afixos bases
lxicas (ulceroso; terminologia) e compostos, formado pela combinao de bases
lxicas, (toca-discos, microfilme);
c) quanto estrutura sinttica combinao de palavras que seguem uma estrutura
sinttica ou sintagmas terminolgicos, (guerra fria);
d) unidades terminolgicas de origem complexa siglas ou iniciais de palavras (CEB
Companhia Energtica de Braslia); acrnimos ou palavras formadas por segmentos
de outras que podem ser pronunciadas como palavras (Petrobrs Petrleo Brasileiro;
CICA Companhia Industrial de Conservas Alimentcias); abreviaturas ou formas
fixadas por consenso, que reproduzem o segmento inicial de uma palavra (etc. - et
cetera); e formas abreviadas, utilizao de uma parte da palavra, normalmente para
economizar o discurso, (auto automvel / moto motocicleta).
De acordo com a funo que desempenham no discurso, os termos podem se
classificar em: substantivos, adjetivos, verbos e advrbios21. E quanto a sua significao, os
termos podem se classificar segundo a classe de conceitos que denominam. Assim, podem
formar classes e subclasses em funo das caractersticas, de acordo com as relaes que
estabelecem entre si. Da interao entre os conceitos derivam os diferentes tipos de relaes,
processos e estados. Conforme essa idia pode-se estabelecer quatro grandes classes
conceituais expressas por uma classe funcional.

objeto ou entidade

- substantivo

processo, operao ou ao - verbos

propriedade, estado, qualidade -

relao - adjetivo, verbo.

adjetivo

Os conceitos se organizam dentro de uma determinada rea de especialidade em


conjuntos estruturados, denominados sistemas conceituais, que refletem a viso da realidade
da rea de atividade. Cada sistema conceitual uma estrutura que pode compreender distintas
21

Observa-se que em terminologia a funo dos termos a mesma que o lxico comum, porm as preposies,
conjunes, artigos e pronomes no tem carter terminolgico.

95
subclasses de conceitos: objetos (automveis, avies, etc.), processo (soldar, dissolver, etc.),
propriedade (visual, auditivo, etc.) e relao (equivalncia, hierrquica, etc.).
Por ltimo, quanto a procedncia lingustica, caso do emprstimo lingustico, palavras
estrangeiras que so encorporadas s regras da lngua que foi emprestada, como por exemplo:
mouse (componente de computador).
Assim como para a TGT, para a TCT, a Terminologia se ocupa de termos que
representam conceitos e esses se relacionam mutuamente dentro de um mesmo domnio do
conhecimento, so passveis de serem organizados em uma estrutura, formando um conjunto
sistematizado. As relaes entre conceitos podem ser de dois tipos: relaes hierrquicas que
podem ser relaes lgicas (gnero-espcie) ou relaes ontolgicas (todo-parte) e as relaes
associativas ou funcionais.
Nas relaes entre denominao e conceito, Cabr (1993, p. 213) enfatiza que se
analisarmos a relao entre a forma escrita e o contedo de um lexema (especializado ou no),
observa-se que a correspondncia entre ambas partes no unvoca, mas mltipla. Assim,
uma forma escrita pode ser portadora de vrios significados ou polissemia, um conceito pode
ser denominado por vrias formas escritas ou sinonmia, e quando dois ou mais termos tem a
mesma forma escrita, porm representam conceitos totalmente diferentes denominado
homonmia. Esses fenmenos acontecem, normalmente, na linguagem natural, sendo mais
restritos em um vocabulrio especializado.

Estabelecer as bases para a construo dos SOC no tarefa fcil. Do ponto de vista
da anlise de domnio encontra-se em cada campo do conhecimento diferentes vises,
abordagens, paradigmas ou qualquer outro tipo de denominao. Cada uma dessas vises
opera com diferentes teorias, conceitos e relaes semnticas, porm para a organizao do
conhecimento estas implicaes, as quais se deparam os diferentes domnios que devem ser
organizados, so frequentes. Os profissionais da organizao do conhecimento devem estar
habilitados a interpretar as tendncias na deciso de qual tipo de SOC utilizar quando se est
organizando determinado domnio. Esta deciso pode ser feita em colaborao entre
especialistas da rea a ser organizada e os prprios especialistas em organizao do

96
conhecimento.
Para tanto questes ligadas lingustica, terminologia e suas influncias para a
elaborao de linguagens documentrias e, consequentemente para a construo dos SOC,
vm sendo discutidas, estudadas e divulgadas por diversos profissionais da rea de
informao no Brasil, como: Anna Maria M. Cintra; J. Guimares, Lgia Caf; Maria da
Graa Krieger; Maria Luiza de A. Campos; Marilda Lopez G. de Lara; Marisa Brscher; U.
G. Baranow; M. F. G. M. Talamo, para citar alguns.

97

2.10 Consideraes da Reviso de Literatura

A partir da delimitao do tema no qual esta pesquisa se props trabalhar e da


apresentao do aporte terico na reviso de literatura, pode-se observar que os sistemas de
organizao do conhecimento, embora tenham iniciado seus estudos na Biblioteconomia,
Documentao e Cincia da Informao, o que se encontra hoje um quadro diferente.
Diversas reas do conhecimento desenvolvem estudos e pesquisas sobre SOC, como o caso
da Cincia da Computao e suas ramificaes; Web Semntica; Medicina; Engenharia, ecomrcio, entre outras, o que caracteriza o tema como multidisciplinar.
Os SOC so sistemas conceituais que representam um domnio por meio da
sistematizao dos conceitos e das relaes entre eles. Incluem uma variedade de esquemas
que podem ser desde uma simples lista de autoridade at um sistema mais complexo como os
tesauros e as ontologias, com o objetivo de organizar, gerenciar e recuperar informaes em
bibliotecas e outras instituies que gerenciam informaes, principalmente no ambiente web.
Acrescentando sua funo primria, de prover o acesso a materiais para uma comunidade
especfica ou para o pblico em geral, os SOC desempenham um importante papel em
bibliotecas digitais, museus e arquivos.
A representao do conhecimento uma rea de estudo muito prxima da organizao
do conhecimento, principalmente, quando se trata de redes semnticas, que representam o
contedo dos documentos na forma de ns entre os conceitos e seus relacionamentos. Tanto
os tesauros como as taxonomias e as ontologias so redes semnticas que utilizam termos para
representar os conceitos e mantm na classificao uma base comum. Nas palavras de
Campos e Gomes (2008), o reconhecimento do mtodo facetado generalizado e est na base
do desenvolvimento dos tesauros, taxonomias, ontologias e sistemas de classificao em
meios convencionais ou na internet, seja para organizao e representao de documentos
textuais, imagticos, sonoros. Mas, embora esses sistemas de organizao do conhecimento
guardem princpios semelhantes, cada um desses instrumentos apresenta suas particularidades
e possui diferentes funes para determinado contexto, o que refora a ideia da consolidao
de uma base comum fundamentada em princpios tericos para a construo desses sistemas.

Captulo 3

PROCEDIMENTOS METODOLGICOS

99

3 Procedimentos Metodolgicos

Nessa pesquisa buscou-se atender ao objetivo geral de investigar a relao dos estudos
sobre sistemas de organizao do conhecimento com os princpios tericos abordados na
reviso de literatura e utilizados na construo desses sistemas, no contexto da Cincia da
Informao .
Para o processo de anlise, valeu-se de mtodos quantitativos e qualitativos. O perodo
definido entre 1998, ano em que foi sugerida a adoo da expresso sistema de organizao
do conhecimento (HODGES, 2000) e o ms de julho de 2009, perodo em que foi feita a
coleta dos dados para a realizao deste trabalho, num total de 11 anos.
Como caminho metodolgico para atender o objetivo especfico de buscar a
fundamentao terica em que os autores se apoiam para a construo de tesauros,
taxonomias e ontologias, o estudo teve incio com uma reviso bibliogrfica fundamentada
nos conhecimentos de Biblioteconomia, Documentao e Cincia da Informao. Essa reviso
abordou, mais precisamente as reas de organizao e representao da informao e do
conhecimento, por meio de pesquisa nas diversas fontes de informao. Procurou-se
identificar a fundamentao terica em que os principais autores sustentam suas ideias na
construo de sistemas de organizao do conhecimento, e, ainda, apoiar a fundamentao
terica que subsidia a anlise de contedo, ou seja, as caractersticas intrnsecas dos
documentos, o que caracteriza a pesquisa como qualitativa.
Num segundo momento, delineia-se como uma pesquisa quantitativa, relativa forma,
em que avaliam-se as caractersticas extrnsecas dos documentos, na qual so aplicadas
tcnicas da bibliometria para quantificar os dados. De acordo com a definio de MaciasChapula (1998, p. 134) citado por Nascimento e co-autores (2007, p.13) a bibliometria o
estudo dos aspectos quantitativos da produo, disseminao e uso da informao registrada,
podendo assim, caracterizar como um estudo bibliomtrico. Os aspectos quantitativos so o
ponto de partida e de apoio para a anlise dos dados enquanto que os aspectos qualitativos
fornecem uma melhor compreenso dos dados obtidos.

100

A organizao da anlise visa operacionalizar e sistematizar as primeiras ideias e a


construo das etapas da pesquisa, que est dividida em duas fases: a) levantamento
bibliogrfico e b) anlise e interpretao dos dados.

3.1 Levantamento bibliogrfico

A primeira etapa visa organizar a anlise, operacionalizar e sistematizar as primeiras


ideias para a construo e delimitao do universo da pesquisa. Nesse trabalho, essa etapa
teve incio com o levantamento bibliogrfico realizado nas bases de dados no perodo de
junho e julho de 2009. Dentre as diversas bases de dados da Cincia da Informao, optou-se
por quatro bases especficas da rea de Cincia da Informao: LISA, LISTA, ISTA e
WILSON22. Alm das bases de dados, foi includo um repositrio de acesso livre, na rea de
Cincia da Informao: o E-LIS e a base de dados de trabalhos acadmicos: BDTD.
Para a determinao da estratgia de busca, nas bases de dados internacionais, pensouse inicialmente em Sistema de Organizao do Conhecimento, mas restringiria a busca
somente para documentos em lngua portuguesa. Depois decidiu-se por Knowledge
Organization System e Knowledge Organization Systems, em lngua inglesa, no singular e
no plural, por tratar-se de buscas em bases de dados multilngues. O uso da expresso no
singular e plural deveu-se ao fato de ser prtica da indexao o uso de singular, e o plural
deveu-se ao fato de a pesquisa se tratar de mais de um sistema. Portanto, as duas tentativas
foram utilizadas e optando sempre pela forma que trouxesse o nmero maior no resultado da
busca. Optou-se por buscas simples em qualquer campo, visando maior abrangncia na
recuperao. O sinal grfico de aspas foi para recuperar a expresso Knowledge
Organization Systems evitando, com isso, a recuperao dos termos Knowledge;
Organization e Systems separadamente.
Na base de dados de teses e dissertaes (BDTD) decidiu-se pela expresso Sistema
22

LISA Library and Information Science Abstracts; H. W. WILSON Library Literature and Information
Science Full Text; LISTA Library, Information Science & Technology Abstracts with Full Text; ISTA
Information Science & Technology Abstracts.

101
de Organizao do Conhecimento, no singular, plural e em lngua portuguesa para privilegiar
os documentos acadmicos produzidos no Brasil. Com o resultado no satisfatrio da busca,
decidiu-se associar expresso Sistema de Organizao do Conhecimento a expresso
Cincia da Informao. Apenas para obteno de dados complementares ou busca de textos
completos, no includos nas bases supra citadas, optou-se por consultar o google acadmico.
A delimitao das bases de dados, o perodo da busca, as estratgias de busca, a
seleo dos indicadores para a anlise bibliomtrica e de contedo e a determinao das
inconsistncias nos registros, constituram os elementos que estabeleceram os critrios para a
definio do escopo das amostras representativas.

3.2 Anlise e interpretao dos dados

O universo da pesquisa foi delimitado a partir do levantamento bibliogrfico e da prseleo, as amostras foram determinadas aps serem descartados os registros considerados
inconsistentes conforme foram descritos na seo 4.2.
Para a anlise dos dados, atendendo ao segundo e terceiro objetivos especficos, foram
observados dois conjuntos de dados: o primeiro relativo aos aspectos de forma ou extrnsecos
numa anlise bibliomtrica, caracterizando uma pesquisa quantitativa. O segundo relativo
aos aspectos de contedo ou intrnsecos, numa anlise de contedo, caracterizando uma
pesquisa qualitativa.
A bibliometria tem a finalidade de medir, por meio de anlises estatsticas a produo
de pesquisa cientfica e tecnolgica na forma de artigos, publicaes, citaes, patentes e
outros indicadores, possibilitando avaliar diversas atividades de pesquisas e auxiliando nas
tomadas de decises. Para alcanar os objetivos especficos esta pesquisa privilegiou os
indicadores: ano de publicao, autoria, ttulo do documento, publicao, idioma, pas de
publicao, palavra-chave e resumo. As anlises bibliomtricas e de contedo so realizadas a
partir de levantamento estatstico e frequncia.

102

O procedimento da anlise de contedo tem por finalidade bsica a busca do


significado de materiais textuais de qualquer natureza, assim definido por Appolinrio (2006,
p. 161). Rocha e Deusdar (2005, p. 305) complementam dizendo ser a sistematizao da
tentativa de conferir maior objetividade a uma atitude que conta com exemplos dispersos, mas
variados, de pesquisa com texto. A escolha do mtodo da anlise de contedo se deve a dois
motivos principais: a) os procedimentos possibilitam uma anlise com base em interpretaes
dos indicadores; e b) por ser uma anlise para observar a relao entre a produo tcnicocientfica sobre SOC e os princpios tericos para a construo dos SOC, em que os
documentos tm caractersticas semelhantes e homogneas. Portanto, o mtodo empregado
parece ser o mais indicado, uma vez que trata do contedo dos documentos. A anlise foi feita
em trs etapas:

pr-anlise contempla a escolha dos documentos que consiste na delimitao da


amostra significativa para a anlise de contedo. Foram considerados passveis de
anlise, todos os documentos recuperados nas bases de dados definidas e que
mencionaram no ttulo, resumo e/ou palavras-chave um ou mais fundamentos tericos
apresentados na reviso de literatura, ou seja, uma ou mais categorias que integram a
anlise;

Especulao e anlise do material estabelece as categorias que forneceram


subsdios para a anlise de contedo dos documentos. A partir da determinao da
amostra significativa para anlise de contedo, inicia-se a leitura na ntegra dos
documentos relevantes, identificando e agrupando-os segundo os diferentes tipos de
SOC - tesauros, taxonomias, ontologias, sistemas de classificao e outros tipos de
SOC - e segundo as categorias. Respeitando a fundamentao terica da pesquisa,
selecionaram-se as seguintes categorias para integrar a anlise: 1) Princpios da
classificao identificao dos princpios de diviso de classes, de facetas e da
hierarquia e as influncias na construo dos SOC; 2) Teoria do conceito e relaes
entre conceitos busca as funes e descries da teoria do conceito e os nveis e
tipos de relacionamentos entre conceitos; 3) Lingustica identifica a base da
lingustica na elaborao dos SOC; e 4) Terminologia reconhecer a relao da
terminologia, controle terminolgico de estruturas sintticas e semnticas e o

103
desenvolvimento dos SOC;
Tratamento dos resultados obtidos e interpretaes os resultados foram tratados
com o intuito de viabilizar a etapa final da anlise de contedo, ou seja a interpretao
dos dados.
A unidade de registro escolhida para descrever o documento como um todo, em sua
forma e contedo, identificando a produo bibliogrfica para as anlises a referncia
bibliogrfica dos documentos. Para a anlise bibliomtrica foram considerados os dados
descritivos do documento como ano de publicao, autor, ttulo, publicao, palavras-chave,
idioma e pas de publicao. Para a anlise de contedo foram includos: o ano de publicao,
autor, ttulo, indicao de qual ou quais os tipos de SOC o documento trata, resumo do
contedo do documento e registro de elementos que possibilitaram identificar as categorias
abordadas nos documentos (mantendo a linguagem natural usada pelo autor para evitar
interpretaes) e; outras observaes do texto completo, como registro de informaes
relevantes, tais como: identificao de outras teorias e outros princpios utilizados na
construo dos SOC que no os abordadas na fundamentao terica.

3.3 Bases de dados


Esta seo destina-se a fazer uma breve apresentao sobre as bases de dados
utilizadas para o desenvolvimento da investigao e realizao da pesquisa.
LISA - Library and Information Science Abstracts
http://www.csa.com/factsheets/lisa-set-c.php
uma base de dados internacional de resumos e indexao projetada para os profissionais de
bibliotecas e outros especialistas da informao. Atualmente, indexa mais de 440 peridicos
publicados em 68 pases em 20 lnguas diferentes. Est disponvel em linha do perodo de
1969 at os dias atuais, com 321.245 registros apurados em agosto de 2009. As atualizaes
so feitas a cada duas semanas com a adio de mais de 500 registros por atualizao,
cobrindo diversos assuntos na grande rea da Cincia da Informao. O provedor a Proquest
CSA Social Sciences, com sede em San Diego, Califrnia, Estados Unidos. Encontra-se

104
acesso, por meio da Internet, no endereo eletrnico acima, em CD-ROM ou entrando em
contato com as instituies consorciadas CAPES. No caso desta pesquisa, o contato foi por
meio da Biblioteca Central da UnB.
ISTA Information Science & Technology Abstracts
http://www.lsuhsc.edu/no/library/ss&d/data/ista.html
uma base de dados de referncia na rea de Cincia da Informao. A abrangncia de
assuntos permite acesso ao passado, presente e o que est sendo desenvolvido nas reas de
Biblioteconomia, Cincia da Informao, Recuperao da Informao em linha, novas
tecnologias da informao e novas publicaes. A indexa documentos desde 1964 e
disponibiliza dados pela citao, resumo e links com o texto completo. A atualizao feita a
cada dois meses e as bases relacionadas com as Cincia de Biblioteca e a Cincia da
Computao.
LISTA Library, Information Science & Technology Abstracts with Full Text
http://web.ebscohost.com/ehost/search?vid=22&hid=5&sid=9fa1ef95-5d27-4989-a1a2688122a48637%40sessionmgr11
Indexa mais de 500 peridicos cientficos, alm de relatrios de pesquisas e livros, sendo 240
peridicos cientficos com texto completo. A abrangncia de assuntos inclui biblioteconomia,
classificao, catalogao, bibliometria, recuperao de informao em linha e gesto de
informao. A cobertura da base de dados remonta a meados dos anos 1960.
H. W. WILSON Library Literature and Information Science Full Text
http://www.hwwilson.com/databases/liblit.htm
Indexa 400 peridicos desde 198423, artigos completos de 155 jornais desde 1997. uma base
de dados criada por bibliotecrios para bibliotecrios cobrindo os assuntos de: automao,
cuidados e restaurao de livros, catalogao, procedimentos de emprstimos, classificao,
direitos autorais , educao para bibliotecrios, busca eletrnica, indexao, profissional da
informao, softwares para a Internet, associaes e conferncias em Bibliotecas, servios de
referncias, preservao de materiais e web sites.
23

Muitos deles com com reviso de especialistas (peer-reviewed)

105

E-LIS E-prints in Library and Information Science


http://eprints.rclis.org/
Criada em 2003 a partir do resultado de dois projetos de pesquisa 24 e de esforos voluntrios.
um repositrio de acesso livre de documentos cientficos e tcnicos, publicados ou no
publicados nos domnios de Biblioteconomia, Cincia da Informao, Tecnologia e reas
correlatas. uma base de dados no-comercial, possui atualmente 10.127 registros.

BDTD Biblioteca Digital Brasileira de Teses e Dissertaes


http://bdtd2.ibict.br/
Integra em um s portal, os sistemas de informao de teses e dissertaes existentes no pas.
Nessa rede, as instituies de ensino e pesquisa atuam como provedores de dados e o IBICT
opera como agregador, coletando metadados de teses e dissertaes dos provedores.

Google Acadmico
http://scholar.google.com.br/intl/pt-BR/scholar/about.html
Base multidisciplinar de acesso livre na web. Indexa artigos revisados por especialistas, teses,
livros, resumos e artigos de editoras acadmicas, organizaes profissionais, bibliotecas de
pr-publicaes, universidades e outras entidades acadmicas. A classificao dos resultados
de pesquisa do Google se d segundo a relevncia e leva em conta o texto integral de cada
artigo, o autor, a publicao em que o artigo saiu e a frequncia com que foi citado em outras
publicaes acadmicas. No h dados sobre os nmeros de artigos ou documentos
indexados.

24

RCLIS Project (Research in Computing, Library and Information Science) e o DoIS (Documents in
Information Science), promividos pelo Ministrio da Cultura Espanhola e hospedados pela equipe da AEPIC nos
equipamentos da italiana CILEA (Consorzio Interuniversitario Lombardo per Elaborazione Automatica).

Captulo 4
ANLISE DOS DADOS

107

4.1 Definio do Universo da Pesquisa

A coleta de dados nas bases LISA, ISTA, LISTA e H. W. Wilson foram feitas por
meio do portal da Biblioteca Central da UnB, valendo-se da expresso Knowledge
Organization System e Knowledge Organization Systems, delimitando o perodo entre
1998 e 2009 para todas as bases consultadas.
A pesquisa no repositrio de acesso livre e temtico de Cincia da Informao, E-LIS,
foi realizada por meio de acesso internet, valendo-se das mesmas palavras-chave. A busca
na base de dados BDTD ocorreu pelas expresses Sistema de Organizao do
Conhecimento e Cincia da Informao, juntas, separadas, singular e plural, por tratar-se
de uma base de dados multidisciplinar de trabalhos acadmicos que indexa teses e
dissertaes de diversas reas do conhecimento de vrias universidades do Brasil. No decorrer
desta primeira etapa da pesquisa, observou-se a ausncia de uma base de dados que indexe e
recupere os artigos de peridicos brasileiros na rea de Cincia da Informao. O nmero de
registros encontrados em cada base de dados e o universo da pesquisa pode ser verificado no
quadro abaixo:
Quadro 6.

Nmero de registros das bases de dados pesquisadas


BASES DE DADOS

N DE REGISTROS

LISA

30

ISTA

33

LISTA

49

WILSON

13

E-LIS

70

BDTD

--

TOTAL- UNIVERSO

195

Do resultado obtido da busca nas bases de dados verificou-se baixa revocao25.


oportuno ressaltar que a expresso usada na estratgia de busca, knowledge organization
25

Habilidade de recuperar informaes relevantes para um assunto especfico, quando uma solicitao sobre
esse assunto feita ao sistema. (LANCASTER, 1977) (GLOSSRIO GERAL DE CINCIA DA
INFORMAO, 2006).

108
system, no consta no tesauro das base LISA, LISTA nem na Wilson. Na base ISTA no foi
localizado tesauro, somente ndice e no consta a expresso. A base BDTD possui glossrio
que no consta a expresso sistema de organizao do conhecimento. O repositrio E-LIS
tem somente um campo de assunto na busca avanada com algumas sugestes de temas, que
no inclui a expresso de busca. Por outro lado, o repositrio E-LIS obteve o maior nmero
de documentos recuperados, pode-se atribuir o fato de ser um repositrio livre. Mas o
resultado mais surpreendente foi a busca vazia da base BDTD.

4.2 Consideraes acerca dos resultados encontrados nas bases de dados

A partir da primeira anlise para a seleo da amostra significativa observou-se


algumas inconsistncias relatadas a seguir.
4.2.1 Dos registros recuperados na base LISA, trs constam apenas o nome do autor, a
filiao e pas, conforme mostra o quadro a seguir. Pela falta de elementos, esses itens no
foram computados.
Quadro 7.
Autor
Keith C.
Clarke

Registros sem artigos


Filiao

Pas

Department of Geography, University of California, Santa Barbara Professor,


Estados
1996 Current Chair, 2001 Current Professor, Center for Film, Television and
Unidos
New Media, University of California, Santa Barbara Environmental Media
Initiative, University of California, Santa Barbara

Michael
Frank
Goodchild

Professor, Department of Geography, University of California, Santa Barbara

Estados
Unidos

Mara Jos
LpezHuertas
Prez

Departamento de Biblioteconomia y Documentacion, University of Granada


Departamento de Biblioteconomia y Documentacion, University of Granada
Instituto de Estudios de la Mujer, University of Granada

Espanha

4.2.2 Das bases de dados consultadas, foram identificados quatro artigos sem autoria, os
registros destacados no foram considerados para anlise.

109
Quadro 8.
Ano /
Base
Dados

Artigos sem autoria


Peridico

2005
Online Information
ISTA, Review; 2005, Vol. 29
LISTA Issue 6, p604-620, 17p.

Ttulo do Artigo

Interfaces to knowledge
organization systems in
Canadian digital library
collections.

Palavras-chave

Internet searching;
Digital libraries ;
Libraries search engines

2005
Bulletin of the American SIG/CR Classification Research
ISTA, Society for Information Workshop.
LISTA Science & Technology;
Apr/May2005, Vol. 31
Issue 4, p5-5,

Informaion science;
Information technology
Seminars Associations; institutions,
etc.
Knowledge management

2008
Library Hi Tech News;
LISTA Jan/Feb2008, Vol. 25
Issue 1, p39-39

Digital libraries; Information


resources management;
Information storage & retrieval
systems;
Congresses conventions.

Program Material from NKOS


Workshop at ECDL 2007.

2007
Library Hi Tech News; Semantic Web Deployment
LISTA Jul2007, Vol. 24 Issue 6, Working Group Requests
p48-49,
Comments.

Information organization;
Semantic Web;
World Wide Web;
Semantic networks (Information
theory)
Access to information Teams in the
workplace.

4.2.3 Os relatos de eventos recuperados nas bases de dados onde constam a programao de
conferncias e temas apresentados nas sesses dos eventos, no foram considerados, por no
conter dados suficientes para anlise.
Quadro 9.

Relatos de conferncias

Ano / Base
Dados

Autor

Ttulo

2008
Nielsen,
LISA, ISTA, Marianne
LISTA,
Lykke
Wilson

2003
LISA,
LISTA,
Wilson

Mai, Jens-Erik Organization of knowledge in a


Knowledge Organization;
networked environment: a report of the 30 (1) 2003, pp.36-37
6th Networked Knowledge Organization
Systems (NKOS) Workshop

2005
ISTA,
LISTA,
Wilson

Tudhope,
Doug

Networked knowledge Organization


Systems/Service (NKOS):ECDL 2008
Conference Report

Report on the 4th European Networked


Knowledge Organization
Systems/Services (NKOS) Workshop.

Referncia
D-Lib Magazine, vol. 14,
no. 11-12, Nov-Dec 2008

D-Lib Magazine;
Nov2005, Vol. 11 Issue
11, p16-16,

110
4

2004
ISTA,
LISTA,
Wilson

Nielsen,
Marianne
Lykke

ECDL 2004 Workshop Report:


D-Lib Magazine;
Networked Organization
Oct2004, Vol. 10 Issue
Systems/Services (NKOS): User-centred 10, p1-1,
approaches to Networked Knowledge
Organization

2006
ISTA,
LISTA,
Wilson

Traugott Koch Report on the 5th European Networked


Knowledge Organization
Systems/Services (NKOS) Workshop.

D-Lib Magazine;
Oct2006, Vol. 12 Issue
10, p12-12,

2000
LISTA

Hedberg, Jane

DLF report

College & Research


Libraries News;
Jul/Aug2000, Vol. 61
Issue 7, p 612,

2003
Wilson

Tudhope,
Douglas

ECDL 2003 Workshop Report:


Networked Knowledge Organization
Systems/Services (NKOS): Evolving
Standards

D-Lib Magazine v. 9 no.


9 (September 2003)

4.2.4 Na base de dados Wilson, foram recuperados 13 registros, sendo que 11 j haviam sido
computados pelas bases de dados LISA, LISTA e/ou ISTA. Como possvel observar nos
registros nmeros 1, 2, 3, 4, 5 e 7 do Quadro 9 e os outros cinco registros apontados no
Quadro 10 abaixo. Dois trabalhos, listados a seguir, no contm dados suficientes para anlise
(resumo, palavras-chave e/ou texto completo). Portanto, nenhum dos 13 registros foi
computado.

DiPietro, Deanne. Next Generation Knowledge Organization Systems: Integration


Challenges and Strategies. D-Lib Magazine v. 11, no. 7/8 (July/August 2005) p. 2.

Wu, Wang-Jiun. Scientific knowledge organization systems. Journal of Information,


Communication and Library Science v. 5 no. 1 (Fall 1998) p. 19-42.

Quadro 10.
Base
Dados

Registros da base de dados Wilson e outras bases


Autor

Ttulo

Referncia

LISA
ISTA
LISTA
Wilson

Lacasta, Javier; NoguerasIso, Javier; Lopez-Pellicer,


Francisco Javier; MuroMedrano, Pedro Rafael;
Zarazaga-Soria, Francisco
Javier

ThManager: An Open Source Tool Information Technology and


for Creating and Visualizing SKOS Libraries v. 26 no. 3 (Sept.
2007, p. 39-51.

LISA

Shiri, Ali; Molberg, Keri

Interfaces to knowledge

Online Information Review

111
Wilson

organization systems in Canadian


digital library collections

v. 29 no. 6, 2005, p. 604-20.

LISA
ISTA
LISTA
Wilson

Zeng, Marcia Lei; Chan,


Lois Mai

Trends and Issues in Establishing


Interoperability Among
Knowledge Organization Systems

Journal of the American


Society for Information
Science and Technology v.
55 no. 5, March 2004, p.
377-95

LISA
Wilson

Peters, Isabella; Weller,


Katrin

Paradigmatic and Syntagmatic


Relations in Knowledge
Organization Systems

Information (Frankfurt am
Main, Germany) v. 59 no. 2
(March 2008) p. 100-7,
2008.

LISA
Wilson

Anila Angjeli; Antoine


Isaac; Thierry dourer
Frdric Martin; Lourens
van der Meij, Henk
Matthezing, Stefan
Schlobach

Semantic Web and Vocabulary


Interoperability: an Experiment
with Illumination Collections

International Cataloguing
and Bibliographic Control v.
38 no. 2 (April/June 2009) p.
25-9

4.2.5 Observou-se na base de dados E-LIS algumas ocorrncias irrelevantes para a pesquisa,
as quais so relatadas a seguir. Nenhum caso foi considerado.
4.2.5.1 Dez documentos no foram publicados e/ou so apresentaes de trabalhos (slides).
Estes itens foram considerados inconsistentes pela falta de divulgao na comunidade
cientfica e pela falta de dados suficientes para anlise, conforme destaca o Quadro 11.
Quadro 11.
Condio
no publicado

Documentos no publicados e/ou apresentaes de trabalhos


Autor
Cortez, EdwinMichael and
Colon-Aguirre,
Monica

Ttulo

Referncia

What Libraries and Information


Professionals Can Learn from
Project and Knowledge
Management

In 17th annual BOBCATSSS


symposium, Porto (Portugal),
28-30 January 2009.

no publicado De Robbio,
e apresentao Antonella and
Maass, Anne

La comunicazione scientifica: il
processo di pubblicazione e il
mercato.

Terrazza Metelli, CIS di


Psicologia, Universit di Padova
(Italy), 28 February 2008.

no publicado Aover Lopez,


e apresentao Julin Manuel
Curricula.

Sistema de informacin sobre la


actividad investigadora en un
Hospital

Hospital 12 de Octubre - Unidad


de Investigacion, Diciembre
2006

no publicado Greer, Chris


e apresentao

The Digital Data Universe

In Berlin 5 Open Access : From


practice to impact :
Consequences of Knowledge
dissemination, Padova (Italy),

112
19-21 September.
no publicado

Chisenga, Justin

no publicado Oberlander, Cyril


e apresentao

Information and communication


technologies: opportunities and
challenges for national and
university libraries in Eastern,
Central and Southern Africa.

In Standing Conference of
African National and University
Libraries of Eastern, Central and
Southern Africa, Dar es Salaam
(Tanzania), 9 10 July 2006.

Emergent Resource Sharing &


Interlibrary Loan.

In PALINET ILL Conference,


Hershey, Pennsylvania, May 12,
2006

no publicado Eckelmann, Sigrun Knowledge Exchange: Strategy


e apresentao
and Roadmap for a New Network
of Transnational Information
Service, an Initiative of Four
Partner Funding Organizations].

In 8th International Bielefeld


Conference, Bielefeld
(Germany), 7-9 February 2006

no publicado

Civallero, Edgardo The sound library : sound


documents and collections as
means of recovering and
protecting endangerred languages.,

In IFLA Council and General


Conference (71st : 2005 : Oslo),
Oslo (Norway), 14th - 18th
August 2005

no publicado

Garusing
Arachchige, J. J.

An approach to marketing in
special and academic libraries of
Sri Lanka : a survey with
emphasis on services provided to
the clientele.

No consta

no publicado

Martnez Mndez,
Francisco Javier;
Garca Rivas,
Marta Isabel

"Canal Universitario": una


experiencia innovadora de la
Universidad de Murcia en la
produccin televisiva de un
informativo universitario.,

In Congreso Internacional de
Comunicacin UPSA 2002
(2002 : Salamanca), Salamanca
(Spain), January 2002

4.2.5.2 Houve a identificao de um guia/manual, cujo acesso ao material no foi possvel,


logo no foi computado nos resultados: A regional policy blueprint highlighting the uses of
strategic intelligence in cluster policy, 2006. Dos autores: Passas, Isidoros; Sefertzi, Elena;
Komninos, Nikos; Guth, Michael; Pelayo, Esteban; Aroca, Juan A.; Halvorsen, Knut; Krogh,
Ann Camila; Komendantova, Maria; Lien Egerund, Martina Stratinc.
4.2.5.3 Ocorreu o resultado de um livro que tambm no foi possvel o acesso, portanto foi
desconsiderado: Majumdar, S.; Bhalla, S. C.; Chander, Ramesh. Compendium of select
government reports on library & information services in India. Central Secretariat Library:
New Delhi, 2003.
4.2.5.4 O seguinte artigo trata-se de um estudo de caso, por isso no foi computado nos

113
resultados: Alemu, Getaneh Agegn. The Role of Open Access in Fostering Knowledge
Sharing and Collaboration in Ethiopia: a case study., 2009.
4.2.5.5 Dez artigos foram identificados em lnguas estrangeiras, diferentes do ingls, no
sendo possvel o reconhecimento completo de alguns campos, dificultando a anlise, como
mostra o Quadro 12, portanto foram eliminados do resultado.
Quadro 12.
Ano

Documentos em lngua estrangeira

Autor

Ttulo

Referncia

Palavra-chave

Idioma

2008 ,
and
,

In 17

,
(GR), 24-26
.

Hospital libraries, user


education, information
literacy, evaluation,
Greece

Grego

2007

In 16

,
(GR), 1-3 .
[Conference Paper]

Emotional Intelligence,
Academic Libraries,
Librarians, Users,
Management

Grego

2007 Wang, Jun and An Overview on


Zhang, Li
the Networked
Knowledge
Organization
System

Wang, Jun and Zhang,


Li

., 2007

NKOS (networked
knowledge organization
system), semantic tools,
ontology, NKOS

Chins

2006 SzewczykKos, Danuta

Wspczesne
metody
zarzdzania a
struktury
organizacji pracy
w bibliotekach
akademickich.

In Biblioteki XXI
wieku. Czy
przetrwamy? II
Konferencja Biblioteki
Politechniki dzkiej,
d (Poland), 19-21
June 2006. [Conference
Paper]

total quality
management, strategic
management,
benchmarking,
organization structure,
work organization,
academic libraries

Polons

2006 Tomaszewski,
Roman and
Polarczyk,
Mariusz

Biblioteka uczca In Biblioteki XXI


si.
wieku. Czy
przetrwamy? II
Konferencja Biblioteki
Politechniki dzkiej,
d (Poland), 19-21
June 2006.[Conference
Paper]

learning organization,
intelligent organization,
management methods,
library

Polons

114
2006 Walter, AnneKathrin; Mayr,
Philipp;
Stempfhuber,
Maximilian;
Ballay, Arne

Crosskonkordanz
en als Mittel zur
Heterogenittsbeh
andlung in
Informationssyste
men

In 11. Kongress der


IuK-Initiative der
Wissenschaftlichen
Fachgesellschaft in
Deutschland, Bonn,
Germany, May 2006
Conference Paper

Heterogeneity treatment, Alemo


cross-concordances,
knowledge organization
systems, thesauri,
terminology mapping

2005 Antoni, Sanja

Infoteka

Upravljanje znanjem pogled u nau


budunost. Infoteka,
2005, vol. 6, n. 1-2, pp.
77-82[Journal Article
(Print/Paginated)]

knowledge management, Srvia


intellectual capital,
librarianship

2005 Odaba,
Hseyin

Bilgi Ynetimi
Sistemi.

In: Bilgi a Bilgi


Ynetimi ve Bilgi
Sistemleri. izgi
Kitabevi, pp. 101-120.
[Book Chapte

knowledge sharing,
Turco
knowledge management

2003 Milojevi,
Glasnik Narodne
Staa
biblioteke Srbije
Katalogizacija i
klasifikacija u
Sjedinjenim
Amerikim
Dravama

Glasnik Narodne
biblioteke Srbije, 2003,
n. 1, pp. 203214[Journal Article
(Print/Paginated)]

USA, Anglo-American Srvia


Rules for
Cataloguization, MARC,
Dewey Decimal
Classification (DDC),
the Classification of the
Congress Library

1998

In 7

,
(GR), 1998.
[Conference Paper]

Grego

,
.

.1998

4.2.5.6 Cinco trabalhos, listados a seguir, encontram-se com registros repetidos. Por
considerar essa repetio uma inconsistncia, apenas um registro foi considerado no cmputo.
1. , and ,
., 2008 . In 17
, (GR), 24-26 .
2. Aover Lopez, Julin Manuel Curricula. Sistema de informacin sobre la actividad
investigadora en un Hospital., 2007 , Hospital 12 de Octubre - Unidad de
Investigacion, Diciembre 2006.
3. Antoni, Sanja Upravljanje znanjem - pogled u nau budunost. Infoteka, 2005, vol. 6,

115
n. 1-2, pp. 77-82.
4. Civallero, Edgardo The sound library: sound documents and collections as means of
recovering and protecting endangerred languages (presentation), 2005 . In 71st IFLA
Council and General Conference, Oslo, Norway, 2005.
5. Raman Nair, R. Public library purpose. 49th FID Conference and Congress on
Towards the New Information Society of Tomorrow: Innovations, Challenges and
Impact, New Delhi (India), 11-17 October 1998. [Conference Paper]
4.2.6 A base BDTD foi descartada para o estudo por obter resultado zero ou busca vazia na
pesquisa.
O total de registros recuperados pelas bases de dados consultadas foi de 195. No
entanto, aps este levantamento inicial considerando apenas um dos registros iguais
recuperados em mais de uma base de dados e descartados os registros considerados
inconsistentes, delimitou-se a amostra representativa da pesquisa em 90 registros para a
anlise. Como mostra o Quadro 13.
Quadro 13.

Amostra representativa da pesquisa

Bases de Dados

N de Registros para Anlise

LISA

ISTA

--

LISTA

10

WILSON

--

E-LIS

39

LISA ,ISTA, LISTA

10

LISA, LISTA

LISA, WILSON

LISA,ISTA, LISTA,WILSON

ISTA, LISTA

12

ISTA, E-LIS

LISTA, WILSON

BDTD

--

TOTAL

90

116
A amostragem o mtodo selecionado para uma amostra, que parte da populao
que integrar a pesquisa. No caso desta investigao, a populao de 195 registros e a
amostra representativa para a anlise bibliomtrica de 90 registros. A partir dessa amostra
representativa foi selecionada a amostra representativa para a anlise de contedo com 39
registros. Trata-se de uma amostra no probabilstica, selecionada por julgamento utilizandose de critrios pr-estabelecidos.

4.3 Anlise e Interpretao dos Dados

Nesta seo, de acordo com os objetivos especficos j descritos, a amostra


representativa foi analisada em dois conjuntos de caractersticas, as primeiras, extrnsecas
para a anlise bibliomtrica com o total de 90 registros e segunda correspondendo aos
aspectos intrnsecos, para a anlise de contedo com uma amostra de 39 registros .

4.3.1 Aspectos extrnsecos ou de forma

Para os aspectos extrnsecos, foram levantados os seguintes itens para anlise: base de
dados, ano de publicao, autor, ttulo do documento, publicao, palavra-chave, condio do
registro (se foi publicado ou no, formato do registro (power point), idioma e pas de
publicao. Porm, no decorrer da pesquisa observou-se que nem todas as bases de dados
indexam o idioma do documento e o pas de publicao. Das bases consideradas para anlise
apenas a LISA indexa o idioma e o pas de publicao. As bases E-LIS e Wilson indexam,
somente, o idioma e as bases ISTA e LISTA no indexam idioma nem pas de publicao.
Pela falta de dados para analisar o conjunto, esses itens no foram analisados. Embora o
idioma para a indexao dos documentos nas bases de dados seja, predominantemente, o
ingls.

117

4.3.1.1 Ano de publicao

No Grfico 1, a seguir, pode ser verificada a frequncia de publicaes sobre o tema


no perodo de 1998 at julho de 2009. Observa-se que nos primeiros anos houve modesta
contribuio de publicaes sobre o tema. Mas, a partir de 2002 existe uma tendncia
crescente de publicaes sobre SOC. Os anos 2006 e 2007 apresentam maior nmero de
publicaes, que somados atingem 41% da produo. Em 2008, a produo foi de 13%,
porm at meados de 2009 houve diminuio no nmero de publicaes.
Grfico 1.

Nmero de publicaes por ano


Nmero de publicaes por ano

20
18
16
14
12
10

19

18

8
12

6
4
2

1999

2000

0
1998

2001

2002

3
2003

2004

2005

2006

2007

2008

2009

Os dados de 2009 referem-se aos artigos indexados at julho de 2009.

4.3.1.2 Publicao

Foram selecionados e examinados 53 diferentes tipos de publicaes do total de 90

registros. As publicaes sobre o tema encontram-se distribudas em vrios tipos, o que


aponta para a disperso de publicaes. Essa distribuio acontece da seguinte forma: em 35
publicaes diferentes encontrou-se apenas 1 produo; em 10 publicaes ocorreram 2
produes; em 3 publicaes apareceram 3 produes; e outras 3 publicaes tm 4 produes
e 2 publicaes obtiveram 7 produes. Quanto maior o nmero de publicao, menor o

118
nmero de produo e quanto maior o nmero de produo, menor o nmero de publicao.
Entre os peridicos analisados, destacaram-se como os mais produtivos e relevantes, segundo
o critrio de nmero total de produes, os apresentados no quadro a seguir.
Quadro 14.

Peridicos mais produtivos


Publicao

N de produo

Knowledge Organization

ACIMED

Rivista de Scienze dell'informazione

International Cataloguing and Bibliographic Control

Journal of the American Society of Information Science and Technology

Bulletin of the American Society of Information Science and Technology

Wissenschaft & Praxis

Webology

Devido diversidade de publicaes encontrada, optou-se por dividir em trs


categorias, para facilitar a visualizao. As categorias so: peridicos, que fazem parte os
jornais, boletins e revistas; eventos englobam as conferncias, congressos, seminrios, anais,
fruns e workshop e acadmicos, so as teses, dissertaes e monografias. O Grfico 2 retrata a
rea de maior incidncia com 67,92% de publicaes em algum tipo de peridico, diminuindo para
26,41% nas publicaes em diferentes tipos de eventos e a menor incidncia est em trabalhos
acadmicos, 5,66%.

Grfico 2.

Incidncia em diferentes categorias de publicaes


Nmero de re gistros em diferentes cate gorias de publicaes

3
14
36

Peridico
Evento
Acadmico

119

4.3.1.3 Autores

Na anlise da categoria autor, procurou-se verificar os autores mais produtivos ao


longo do perodo de estudo. Do total de 90 trabalhos examinados, houve a ocorrncia de 141
autores. Desse total, 125 autores aparecem com uma nica produo sobre o tema, sendo 62
citados como autor principal e 63 como autor secundrio. Observa-se um equilbrio com
relao citao de autor principal e secundrio e diversidade de autorias, o que significa
grande interesse pelo tema.
Devido ao elevado nmero de autores com somente uma produo, destacou-se os que
tm mais de uma produo. O Quadro 15 apresenta autoria, o nmero de produo por autor,
especificando se o autor citado como principal ou secundrio e a publicao do documento.
Quadro 15.

Produtividade dos autores

Autor

Princ.

Sec.

Publicao (*)

Zeng, Marcia Lei

Knowledge Organization(2);
Journal of Digital Information;
Bulletin of ASIST;
International Cataloguing and Bibliographic Control(2);
IFLA Journal;

Gnoli, Claudio

--

Knowledge Organization;
ISKO;
BRAKOR

Tudhope, Douglas

Bulletin of ASIST;
New Review of Hypermedia & Multimedia;
ALISS Quarterly;

Weller, Katrin

Wissenschaft & Praxis (2)


Webology

Keizer, Johannes

--

Journal of Digital Information


Dublin Core Conference 2008
Quarterly Bulletin of AGRIS

Peter, Isabella

--

Wissenschaft & Praxis;


Webology

De Robbio, Antonella

--

Intervento alla Tavolta Rotonda


Condividi la conoscenza

Raman Nair, R.

--

Workshop on managing e-document


49th FID

Tennis, Joseph T.

--

Knowledge Organization;

120
Bulletin of ASIST
Nez Paula, Israel Adrin

--

ACIMED (2)

Chan, Lois Mai

--

Journal of ASIST
IFLA Journal

Shiri, Ali

--

Online Information Review


Library Review

Mayr, Philipp

Advanced Knowledge Organization;


Dublin Core Conference 2008

Rodrguez Perojo, Keilyn

ACIMED;
Revista Cubana de los Profesionales de la Informacin y
de la Comunicacin en Salud

Lauser, Boris

Journal of Digital Information;


Dublin Core Conference 2008

Nielsen, Marianne Lykke

--

New Review of Hypermedia & Multimedia;


ALISS Quarterly

* (nmero de produo no peridico).


Da visualizao desse quadro foi percebida a existncia de trs autores que tm mais
de uma produo no mesmo peridico, o caso de Marcia Lei Zeng que publicou no
Knowledge Organizao (2) e no International Cataloguing and Bibliographic Control (2),
Katrin Weller que publicou no peridico alemo Wissenschaft & Praxis (2) e Nez Paula,
Israel Adrin com duas produes no jornal cubano de cincias mdicas ACIMED (2).
Entre os autores com maior nmero de produo, os peridicos que se destacam so: o
Knowledge Organization com 4 artigos, em seguida encontram-se com 3 artigos cada, os
peridicos: Journal of Digital Information, Bulletin of ASIST, Wissenschaft & Praxis; Dublin
Core Conference 2008 e ACIMED.
Dos autores destacados no quadro 15 foram identificadas algumas parcerias entre eles:
Marcia Lei Zeng e Lois Mai Chan que publicaram no Journal of ASIST em 2004 e no IFLA
Journal em 2002; Isabella Peters e Katrin Weller com publicaes no Wissenschaft & Praxis
e no Webology, ambas em 2008; Douglas Tulhope e Marianne Lykke Nielsen escreveram em
parceria com Koraljka Golub, Catherine Jones, Brian Matthews e Jim Moon no ALISS
Quarterly em 2008; Boris Lauser e Johannes Keizer participaram juntamente com Frehiwot
Fisseha, Stephen Katz, Anita Liang e Soergel Dagobert no artigo publicado no Journal of
Digital Information em 2003; e Boris Lauser, Philipp Mayr e Johannes Keizer publicaram na

121
Dublin Core Conference 2008 com Gudum Johannsen, Caterina van Hage Caracciolo e
Robert Willem.
Na categoria de autores observou-se, tambm, a produo dos autores com maior
nmero de produo e a relao com as bases de dados que foram indexados os artigos,
conforme mostra o Quadro 16.
Quadro 16.

Quadro resumo de autores e as bases de dados


Autor (*)

Base de Dados (**)

Zeng, Marcia Lei (7)

LISA (3), ISTA (3), LISTA (5),


Wilson

Gnoli, Claudio (3)

ISTA, LISTA, E-LIS (2)

Tudhope, Douglas (3)

ISTA,LISTA (3)

Weller, Katrin (3)

LISA (3), Wilson

Keizer, Johannes (3)

LISA, E-LIS, LISTA

Peter, Isabella (2)

LISA (2), Wilson

De Robbio, Antonella (2)

E-LIS (2)

Raman Nair, R. (2)

E-LIS (2)

Tennis, Joseph T. (2)

LISA, ISTA (2), LISTA (2)

Nez Paula, Israel Adrin (2)

E-LIS (2)

Chan, Lois Mai (2)

LISA, ISTA, LISTA (2), Wilson

Shiri, Ali (2)

LISA, Wilson, ISTA, LISTA

Mayr, Philipp (2)

E-LIS (2)

Rodrguez Perojo, Keilyn (2)

E-LIS (2)

Lauser, Boris (2)

LISA, E-LIS

Nielsen, Marianne Lykke (2)

LISTA (2)

* (nmero total de produes)


** (nmero de produes indexados na base)
Conforme o Quadro 16 mostra, a base LISTA aparece com 17 registros, depois, com
13 registros, as bases LISA e E-LIS, e por fim, as bases ISTA e Wilson com 9 e 5 registros
respectivamente. Os autores que mais aparecem nas bases de dados so Marcia Lei Zeng com
12 registros e, Joseph T. Tennis e Lois Mai Chan com 5 registros cada um.

122

4.3.1.4 Palavra-chave

Na categoria palavra-chave, buscou-se identificar os termos mais frequentes no campo


palavra-chave dos registros recuperados e, tambm identificar as reas s quais o termo
Knowledge Organization System pode estar relacionado.
No total foram computadas 404 palavras-chave, sendo 225 termos diferentes. Dentre
as 404 palavras-chave, 27 variam a frequncia de 24 a 3 ocorrncias nos documentos
pesquisados, conforme mostra o Quadro 17.
Quadro 17.

Incidncia de palavras-chave
Quadro Resumo de Incidncia de Palavras-chave
Palavras-chave

% do total

Knowledge organization

24

5,94

Thesauri

13

3,22

KOS

12

2,97

Knowledge management

11

2,72

Information retrieval

11

2,72

Digital libraries

2.23

Classification

1,98

Semantic web

1,48

Information science

1,48

Ontologies

1,48

Metadata

1,48

Information systems

1,24

Information management

1,24

Information services

1,24

Information organization

1,24

Semantic relation

1,24

Interoperability

0,99

Cataloguing

0,99

Subject heading schemes

0,99

SKOS core

0,99

123
Classification schemes

0,99

Natural language processing

0,74

On line information retrieval

0,74

Taxonomies

0,74

Institutional repositories

0,74

Information

0,74

Semantic

0,74

3 ou mais incidncias (total)

175

43,31

2 incidncias (31) total

62

15,34

1 incidncia

167

41,35

Total

404

100,00

Com o objetivo de apresentar brevemente as principais reas de estudo e de atividades


relacionadas aos artigos recuperados, alguns termos que apresentaram maior nmero de
incidncias como palavras-chave, sozinhos ou associados a outros termos Knowledge,
Information, Organization, Semantic esto exibidos de forma destacada nos quadros a
seguir.
Quadro 18.

Palavras-chave com o termo knowledge


Palavra-chave

N ocorrncia

Knowledge organization

24

KOS

12

Knowledge management

11

SKOS

Knowledge representation

Knowledge society

Knowledge base management system

Knowledge networking

Knowledge sharing

Knowledge unity

Knowledge workers

Libraries Knowledge management

Competitive knowledge management

Abstraction knowledge

124

Quadro 19.

Palavra-chave com o termo information


Palavra-chave

N ocorrncia

Information retrieval

11

Information science

Information management

Information organization

Information services

Information systems

information

On line information retrieval

Access to information

Information resource management

Information storage & retrieval systems

Information technology

Information visualization

Cataloguing of electronic information resources

Library and information professionals

Computerized information retrieval

Management information storage

Electronic information resource searching

Electronic libraries information

Quadro 20.

Palavra-chave com o termo semantic


Palavra-chave

N ocorrncia

Semantic web

Semantic relation

Semantic

Semantic heterogeneity

Semantic markup

Semantic networks

Dentre os artigos recuperados sobre SOC, o termo Knowledge sozinho ou associado

125
a outros termos aparece como palavra-chave desde 1998, mas somente em 1999 a expresso
knowledge organization system aparece como palavra-chave. interessante observar que,
no ano de 1999, tambm aparece a expresso knowledge management nas palavras-chave e
a expresso knowledge organization aparece somente a partir de 2003. As expresses
information retrieval e digital libraries apareceram pela primeira vez como palavraschave em 1998 e 2002 respectivamente. O primeiro artigo que apresenta o termo semantic
como palavra-chave data de 2001, sendo que a expresso web semantic aparece apenas em
2005 e em 2006 observa-se a expresso semantic relation como palavras-chave.
No quadro 21 so apresentadas algumas palavras-chave agrupadas em relao a alguns
usos de SOC que so mencionadas, com frequncia, na literatura.
Quadro 21.

Palavras-chave associadas aos SOC


Palavra-chave

Numero

organization

34

8,41

library / libraries

22

5,44

classification

18

4,45

retrieval

18

4,45

search

12

2,97

communication

1,48

terms / terminology

1,48

indexing

1,23

interoperability

0,99

As percentagens dos quadros 17 e 21 esto relacionadas com o total de 90 documentos


e 404 palavas-chave. Assim como o nmero de ocorrncias com alguns termos que sugerem a
tendncia dos estudos realizados sobre o tema Sistema de Organizao do Conhecimento no
campo da Cincia da Informao, com fortes evidncias para estudos relacionados com os
campos de: organizao do conhecimento, web semntica, bibliotecas digitais, gesto de
conhecimento, recuperao da informao e tesauros.

126

4.3.2 Aspectos intrnsecos ou de contedo

Este tpico, rene a anlise e interpretao de dados encontrados nos contedos dos
documentos examinados da amostra representativa para esta anlise. Foram desenvolvidos em
trs etapas: a) pr-anlise, b) especulao e anlise do material e c) tratamento dos resultados
obtidos e interpretaes, conforme mencionados na metodologia.
Na pr-anlise foram selecionados, dos 90 registros recuperados que formam a
amostra representativa, os trabalhos que mencionam em seus contedos, algum tipo de
relao com a base terica apresentada na reviso de literatura. Esta seleo foi feita por meio
de leituras dos campos: ttulo, palavra-chave e resumo. Com base nesse critrio foram
identificados 43 documentos para a anlise temtica e selecionados para a leitura na ntegra.
Porm, algumas inconsistncias na amostra para a anlise de contedo foram
apontadas. Dois artigos no foram localizados na ntegra, ainda que, usando diversos recursos
de busca da internet, nas bases de dados da CAPES e usando o servio de COMUT da
Biblioteca Central da UnB. Um artigo do peridico Knowledge Organization, com o
seguinte ttulo: Knowledge Organization in Italy de Claudio Gnoli e o artigo New
development of library automatization system integrated with knowledge oganization
systems de Haiyan Bai, Tiejun Hu, Fang Liang e Yonglong Zuo, do peridico Journal of
the China Society for Scientific and Technical Information.
Observou-se, ainda nessa fase, dois artigos completos no idioma alemo, no sendo
possvel a leitura na ntegra, pelo desconhecimento desse idioma pela autora da pesquisa. O
Faceted knowledge organization systems and dynamic classification as tools for the
research of the Desk Web, de Silke Heesemann e Hans-Dieter Nellissen e Mapping
Knowledge Organization Systems, de Philipp Mayr e Anne-Kathrin Walter. Portanto, esses
quatro trabalhos no fizeram parte do cmputo da anlise de contedo. A amostra
representativa para a anlise temtica somou o total de 39 documentos.
A partir da determinao da amostra significativa para a anlise de contedo, inicia-se

127
a fase de especulao e anlise do material, com a leitura na ntegra dos documentos
relevantes. Os diferentes tipos de sistemas de organizao do conhecimento foram
classificados de acordo com o nmero de vezes que foram abordados nos documentos com
relao ao desenvolvimento de tesauro e/ou taxonomia e/ou ontologia e/ou sistemas de
classificao e/ou outro tipo de SOC26 e as categorias pr-estabelecidas: princpios da
classificao; conceitos e relaes entre conceitos; lingustica e terminologia.
Primeiramente, o Grfico 3 mostra o resultado por ano de publicao dos documentos
que fazem parte da anlise de contedo, podendo-se comparar com o resultado da produo
por ano do total de registros, no Grfico 1.
Grfico 3.

Nmero de publicao por ano da anlise de contedo


Nmero de publicaes por ano na anlise de contedo

9
8
7
6
5

4
6

3
4

2
1

1999

2000

0
2001

2002

2003

2004

2005

2006

2007

2008

2009

No nmero de publicaes por ano da amostra representativa da anlise de contedo


pode-se verificar que houve apenas uma publicao nos anos de 1999 e 2000. Observa-se
modesta contribuio de publicaes sobre o tema at 2004, iniciando-se, ento, um
crescimento na produo com o auge de contribuies no ano de 2006, seguindo em 2008 e
2007. Comparando o Grfico 3 com o Grfico 1, nota-se que no ano de 2008 o nmero de
documentos relevantes sobre o tema para a anlise de contedo foi mais que 50% do total
publicaes daquele ano, seguido do ano de 2006 com mais de 40% do total de publicaes.
26

No decorrer da pesquisa observou-se que muitos autores no especificam o tipo de SOC, por isso a
necessidade de criar o grupo outro tipo de SOC.

128
A terceira etapa da anlise de contedo consiste no tratamento dos resultados
obtidos e interpretaes. Este tpico rene a anlise e discusso de resultados, desdobradas
em dois conjuntos principais: dos tipos de sistemas de organizao do conhecimento e das
categorias. Os dois conjuntos correspondem ao nmero de ocorrncia nos documentos que
tratam, em seus contedos, sobre os tipos de SOC e as categorias abordadas nos trabalhos. As
categorias foram pr-determinadas na metodologia e so baseadas na fundamentao terica
desenvolvida na reviso de literatura. Os termos usados para a anlise de contedo
correspondem a conceito, definio, funo, finalidade e/ou metodologias para a construo
dos sistemas de organizao do conhecimento. Os mapeamentos apresentados nos quadros a
seguir e seu detalhamento podem ser vistos no apndice B.
Grfico 4.

Nmero de citao dos tipos de SOC


Ocorrncia dos tipos de SOC
19
34
21

30

24

Tesauro
Sistema de
Classificao
Ontologia
Outros tipos de
SOCs
Taxonomia

Quanto aos tipos de sistemas de organizao do conhecimento pode-se verificar,


conforme mostra o Grfico 4, que os tesauros so os mais citados com 87% de frequncia dos
documentos analisados. Logo em seguida, vm os sistemas de classificao com 77%, as
ontologias com 61%, os outros tipos de SOC com 54% e as taxonomias com o menor ndice
de frequncia 49%.
No Grfico 4, observa-se, ainda, que dos SOC citados nos documentos analisados, os
tesauros e os sistemas de classificao so os que apresentam maior ndice de ocorrncia,
somando a metade do total. Assim, os resultados permitem refletir, que tal fato pode ser

129
justificado por esses dois sistemas possurem estruturas de construo consolidadas por
normas e padronizaes internacionais, enquanto que as taxonomias e ontologias ainda no.
Alm disso, no se pode deixar de mencionar a preocupao com a prpria rea de Cincia da
Informao em refletir sobre a necessidade da consolidao de uma base terica comum para
a construo de tais sistemas.
Dentre os sistemas de classificao os que mais se destacam so CDD e CDU com o
mesmo nmero de citao (14), seguido da LCC (9), facetada (7) e BC (1). Sobre os outros
tipos de SOC identificados na anlise ressaltam os vocabulrios controlados, lista de
cabealho de assunto, gazetteer, glossrio, dicionrio, mapa conceitual e folksonomias.
Na anlise por categorias, foram evidenciadas as influncias tericas quando a
temtica sistema de organizao do conhecimento, de acordo com o grfico a seguir.
Grfico 5.

Nmero de citao por categorias da base terica

Ocorrncia das cat egorias da base t erica


14
22
Teoria do conceito e relaes
entre conceitos
Terminologia
Lingustica
Princpios de
Classificao

68

33

Para compreender melhor a anlise de contedo das categorias, adotou-se como


procedimento metodolgico o mapeamento de cada uma das categorias, separadamente, para
evidenciar os temas mais especficos abordados.
A categoria que representa a base terica com maior frequncia nos artigos analisados,
foi teoria do conceito e relaes entre conceitos. Como parte dessa categoria, os temas

130
especficos mencionados so: teoria do conceito (frequncia 20), relao hierrquica (17),
relao associativa (12) e categorizao (12). No entanto, alguns autores referem-se a
relaes entre conceitos (7) sem especificar qual o tipo de relacionamento. Os resultados
apontam com clareza a influncia da fundamentao terica para o melhor entendimento e
preciso do conceito do objeto a ser representado, fornecendo bases seguras tanto para
estabelecer relacionamentos quanto para a determinao dos termos.
A terminologia representa o aporte terico com o segundo maior nmero de
ocorrncias. Conforme constatado, o tema predominante relatado nos documentos o controle
terminolgico (19), que engloba o controle da polissemia, as estruturas sintticas e semnticas
e os termos de origem mais complexa. Observou-se em muitos trabalhos o interesse em
identificar e discutir os desafios para o desenvolvimento geral de estruturas de
conceitualizao, que abrange os conceitos e as terminologias a fim de melhorar as
informaes cruzadas e a representao de conceitos entre diferentes sistemas usados para
fins da recuperao de informaes.
Na anlise da categoria lingustica identificou-se os temas sobre significado e
significante, relao de sinonmia, hiponmia, homonmia, hiperonmia, meronmia e
equivalncia. Verificou-se, tambm, que diversos autores mencionam apenas relaes
semnticas, com 23 ocorrncias, sem especificar o tipo de relacionamento. Por isso, no
foram somadas no total dessa categoria e mesmo assim os conceitos e relacionamentos
obtiveram o maior nmero de citaes conforme o grfico 5. Mas, por outro lado, o nmero
de ocorrncias bastante elevado, merecendo ser destacado, inclusive, se considerados os
relacionamentos especificados nas categorias conceitos e relaes entre conceitos e
lingustica. Percebe-se, com esse estudo, que a natureza de diferentes relaes semnticas,
seu uso apropriado e bem definido podem ajudar na construo dos sistemas de organizao
do conhecimento consistentes.
Finalmente, princpios de classificao foi a categoria com o menor ndice de
ocorrncia, porm no menos significativo. Durante a anlise, buscou-se observar os
fundamentos tericos da teoria da classificao, os princpios da diviso de classes, das
facetas e das hierarquias. O estudo evidenciou a baixa frequncia com que os autores tratam o

131
assunto, mas ao mesmo tempo, alguns autores concordam que o ncleo das relaes
semnticas para todos os sistemas de organizao do conhecimento a hierarquia.
No decorrer da investigao foi detectada a associao de diferentes assuntos com
relao aos SOC. No Quadro 22, esto os temas com maior nmero de ocorrncia.
Quadro 22.

Nmero de ocorrncia de temas associados com os SOC


Temas associados aos SOC

N de ocorrncia

Web semntica

13

Interoperabilidade

13

Recuperao da informao

11

Biblioteca digital

11

Linguagem de representao do conhecimento

10

Indexao

SKOS core

Folksonomia

Processo cognitivo construo de conceitos

Integrao de sistemas de diferentes SOC

Falta de padronizao construo dos SOC

Gesto do conhecimento

Internet

As expresses organizao do conhecimento e organizao da informao esto


presentes na grande maioria dos documentos analisados. Observou-se o uso das duas
expresses com o mesmo sentido. Questes relacionadas com ambiguidade dessas duas
terminologias foram apontadas por Brscher e Caf (2008),
a anlise do emprego desses termos nesses contextos revela falta de
clareza quanto delimitao do conceito. Por vezes o termo
organizao do conhecimento utilizado no sentido de organizao da
informao e vice-versa e, em determinadas situaes, empregam-se
os termos conjuntamente organizao da informao e do
conhecimento (BRSCHER e CAF, 2008 p. 2).

Portanto, a pesquisa ressalta essa problemtica da confuso terminolgica que envolve


no s pesquisadores da rea da Cincia da Informao como tambm de outras reas que

132
pesquisam sobre o tema.
A anlise dos temas associados aos SOC sugere a tendncia de estudos sobre o
assunto no campo da Cincia da Informao. Web semntica e interoperabilidade aparecem
como os temas mais frequentes, juntamente com as bibliotecas digitais para fins de
recuperao de informao. A folksonomia, por ser tema novo, surpreende pela frequncia de
ocorrncia desse tema relacionado com os SOC. Dentre os temas identificados, porm com a
ocorrncia mais baixa, destacam-se cincia da informao, teoria da informao, softwares
para construo de SOC, construo automtica e semi-automtica de tesauros, rede
semntica, bibliometria, abstrao automtica de termos, mapeamento de diferentes SOC e ecomrcio.
Sintetizando a anlise dos dados, pode-se afirmar que com base no estudo feito sobre a
relao dos SOC com os princpios tericos que orientam a construo de tesauros,
taxonomias e ontologias, na rea de Cincia da Informao a base de dados com maior
nmero de trabalhos indexados sobre o tema foi a E-LIS, os anos que tiveram mais
publicaes foram 2006 e 2007. Os peridicos com mais artigos publicados foram o
Knowledge Organization, peridico especializado da rea de organizao e representao
do conhecimento e o ACIMED, que especializado na rea de medicina, sendo artigos os
tipos de publicao mais escritos.
Quanto aos autores mais produtivos sobre o tema, Marcia Lei Zeng, Claudio Gnoli,
Douglas Tudhope e Katrin Weller foram os que mais publicaram sobre o assunto no perodo
da pesquisa. As palvras-chave mais usadas pelos autores so knowledge organization,
thesauri, knowledge organization system, knowledge management e information retrieval.
Dos diferentes tipos de SOC, os tesauros e os sistemas de classificao (CDD e CDU) so os
mais mencionados nos documentos analisados. E o caminho

terico percorrido para o

desenvolvimento dos SOC passa pela teoria do conceitos, da terminologia, da lingustica, dos
princpios de classificao e com destaque os relacionamentos entre conceitos. Os SOC esto
diretamente relacionados com os temas da web semntica, interoperabilidade entre diferentes
sistemas, recuperao da informao e bibliotecas digitais.

Captulo 5
Consideraes Finais e Trabalhos Futuros

134

5.1 Consideraes finais e sugestes de estudos futuros

Quanto ao objetivo geral proposto pela pesquisa a investigao realizada evidenciou


que os sistemas de organizao do conhecimento so estruturas sistematizadas que tm no seu
desenvolvimento uma relao muito estreita dos princpios tericos com a construo de
taxonomias, ontologias e, principalmente, de tesauros e sistemas de classificao. A expresso
SOC foi sugerida no final da dcada de 1990, poca em que os estudos voltados s adaptaes
e descobertas de instrumentos ideais para lidar com as novas tecnologias ligadas internet
ganharam fora.
As mudanas so inerentes aos processos de evoluo. Alguns elementos so
agregados enquanto outros se tornam obsoletos, substitudos ou transformados. Na
organizao e representao do conhecimento, no diferente. Com base no que foi
verificado na pesquisa, principalmente, na reviso de literatura, que constituiu o primeiro
objetivo especfico, estima-se que haja uma probabilidade para a tendncia da evoluo, que
acontece naturalmente das linguagens documentrias para os sistemas de organizao do
conhecimento, acrescidos de elementos prprios da tecnologia moderna para atuar no
ambiente web.
Outra observao significativa que os SOC, mesmo empregados no ambiente
informatizado, herdam caractersticas no desenvolvimento de suas estruturas que esto
fundamentadas em teorias que os profissionais da informao testemunham h pelo menos um
sculo. Como por exemplo, a influncia dos sistemas de classificao na construo de outros
sistemas, apontada na anlise de contedo. Porm, no simplesmente uma repetio do
passado, uma verso nova, incorporada de linguagens novas, softwares e ferramentas
tecnolgicas, que criam estruturas de elevada representatividade conceitual e permitem
estabelecer ricas e exaustivas redes semnticas.
Os SOC so instrumentos que dependem de padronizao para melhor interagirem,
integrarem e interoperarem entre eles e entre humanos, sejam

usurios, provedores de

informaes ou mquinas. Esses sistemas contribuem para diminuir o abismo na comunicao

135
entre pesquisadores, bancos de dados e documentos armazenados, criados pelas dificuldades
na organizao das informaes e do conhecimento.
Quanto ao segundo objetivo especfico, relacionado anlise bibliomtrica das
caractersticas extrnsecas, o ano com maior nmero de publicaes foi 2006 e os peridicos
que mais publicaram sobre o tema foi o Knowledge Organization da rea de Cincia da
Informao e ACIMED da rea de Medicina, o que caracteriza a importncia dos SOC nesses
campos do conhecimento. Mrcia Lei Zeng destacou-se como a autora que mais publicou
sobre o assunto e a palavra-chave com maior nmero de ocorrncia foi knowledge
organization.
Na anlise de contedo, que consiste o terceiro objetivo especfico da pesquisa,
observou-se que, embora os tesauros tenham sido originrios na dcada de 1960, os princpios
que envolvem sua construo continuam no s a serem seguidos, mas sendo influenciados
por aqueles adotados na construo de outros sistemas. O mesmo ocorre com os princpios
que orientam a elaborao dos sistemas de classificao, porm com menor influncia que os
tesauros. Alm disso, ficou evidente que existe um caminho terico a ser percorrido para a
construo de SOC que tambm fundamenta a construo de taxonomias e ontologias. Esse
caminho passa pela teoria da classificao, teoria do conceito, os relacionamentos entre
conceitos e os princpios da Lingustica e da Terminologia para o tratamento dos termos. Esse
percurso terico fundamenta e garante a consistncia nas estruturas dos sistemas e nas
relaes semnticas para o melhor desempenho de suas funes.
A forte relao dos SOC com o ambiente web tambm evidenciada nos resultados
desta anlise, os quais aparecem com frequncia significativa os temas web semntica,
bibliotecas digitais, recuperao da informao, interoperabilidade entre diferentes sistemas,
integrao entre os sistemas a fim de facilitar a migrao de vocabulrios controlados.
importante destacar alguns problemas detectados no decorrer da pesquisa que, no
entendimento da autora, prejudicaram o seu desenvolvimento, como a baixa revocao no
resultado das buscas nas bases de dados. A ausncia de recuperao de publicaes nacionais
outra limitao do estudo, uma vez que obteve-se resultado zero nas buscas da BDTD. A

136
falta de uma base de dados atualizada que indexe e recupere artigos de peridicos brasileiros
na rea de Cincia da Informao tambm contribuiu para ausncia de anlise de publicaes
brasileiras.
Para estudos futuros essa pesquisa sugere uma investigao exaustiva nas
metodologias de construo de sistemas de organizao do conhecimento, a fim de sugerir
uma base terico-metodolgica comum para a construo desses sistemas em ambiente web.
Pois existe uma tendncia para a formao de novas estruturas semnticas que podero
funcionar com impacto nunca antes imaginado.
interessante, tambm, aprofundar questes de terminologia e lingustica, quando
existe a possibilidade de integrao e interoperabilidade entre diferentes sistemas,
vocabulrios e idiomas. A migrao desses sistemas e vocabulrios, que so apenas lidos por
computador, para o ambiente web semntica, pode ser vista como alternativa. Nesse ambiente
as informaes so lidas e entendidas por computadores com o uso de tecnologias tais como
XML, SKOS, OWL, RDF entre outras. So alguns esforos que podem contribuir para a
integrao dos SOC existentes ou at mesmo criar sistemas novos que melhorem o
compartilhamento de informaes no ambiente web.

137
REFERNCIAS
ALMEIDA, M.B. ; BAX, M.P. Uma viso geral sobre ontologias: pesquisa sobre definies,
tipos, aplicaes, mtodos de avaliao e de construo. Cincia da Informao, Braslia,
v.32, n.3, p.7-20, set./dez. 2003.
ALVARENGA, L. A teoria do conceito revisada em conexo com ontologias e metadados no
contexto das bibliotecas tradicionais e digitais. DataGramaZero Revista de Cincia da
Informao, v. 2, n. 6, dez., 2001. Disponvel em: http://www.dgz.org.br/dez01/Art_05.htm .
Acesso em: jul. 2005.
AMABIS, J. M.; MARTHO, G. R. Biologia das populaes: gentica, evoluo e ecologia.
So Paulo: Moderna, 1994. 511 p.
AMERICAN NATIONAL STANDARDS INSTITUTE / NATIONAL INFORMATION
STANDARDS ORGANIZATION. Guidelines for the Construction, Format, and
Management of Monolingual Controlled Vocabularies. ANSI/NISO Z39.19-2005. NISO Press,
Bethesda: Maryland, 2005. Disponvel em:<www.iso.org/kst/reports/standards/>. Acesso em:
jul. 2008.
ANJOS, L. dos. Sistemas de classificao do conhecimento na filosofia e na biblioteconomia:
uma viso histrico-conceitual crtica com enfoque nos conceitos de classe, de categoria e de
faceta. 2008. 291 fl. Tese (doutorado em Cincia da Informao) Escola de Comunicaes e
Artes da Universidade de So Paulo. So Paulo, 2008.
APPOLINRIO, F. Metodologia da Cincia. So Paulo: Thomson Pioneira, 2006. 220 p.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR 6023: Informao e
Documentao - Referncias - Elaborao. Rio de Janeiro: ABNT, 2000.
BERNERS-LEE, T. ; HENDLER, J. ; LASSILA, O. The Semantic Web: a new form of Web
content that is meaningful to computers will unleash a revolution of new possibilities.
Scientific American. 2001. Disponvel em:
<http://www.cs.nyu.edu/rgrimm/teaching/reading/semantic-web.pdf> Acesso em: maio 2008.
BLISS, E. H. A Bibliographic Classification: Principles and Definies. In: CHAN, L. M.;
RICHMOND, A.; SVENONIUS, E. Theory of Subject Analysis: a sourcebook. Colorado:
Libraries Unlimited, Inc, 1985. 75-85 p.

138
BORST, W. N. Contruction of engineering ontologies. 1997. 243 f. Tese (Doutorado)
University of Twente, Enschede, 1997. Disponvel em: <http://doc.utwente.nl/fid/1392>
Acesso em: abril 2006.
BRSCHER, M.; CAF, L. Organizao da Informao ou Organizao do Conhecimento?
In: ENCONTRO NACIONAL DE PESQUISA EM CINCIA DA INFORMAO, 9, 2008,
So Paulo. Anais. So Paulo: ECA/USP. Programa de Ps-Graduao em Cincia da
Informao, 2008. ENANCIB. 1835 pdf. Set./out. 2008. CD-ROM.
BREWSTER, C.; WILKS, Y. Ontologies, Taxonomies, Thesauri: Learning from Texts.
Department of Computer Science, University of Sheffield, Sheffield, UK. 2004
BROUGHTON, V. et. al. Knowledge Organization. In: European Curriculum Reflections on
Library and Information Science Education. Copenhagen: Kajberg, L. and Lorring, L. 2004.
chapter 7, pages pp. 133-148. Royal School of Library and Information Science, Copenhagen.
Disponvel em: http://dlist.sir.arizona.edu/1050/. Acesso em: mar 2009.
BRYAR, J. V. Taxonomies: the Value of Organized Business Knowledge. Editorial Services
NewsEdge Corporation. 2001. <http://www.cmswatch.com/Feature/59-Taxonomies>acessado
em: jun. 2007.
CABR, M. T. La Terminologa: Teoria, metodologia, aplicaciones. Barcelona: Editorial
Antrtida/Empries, 1993. 529 p.
CAMPOS, M. L. de A. A Organizao de Unidades do Conhecimento em Hipertextos: o
modelo conceitual como um espao comunicacional para a realizao da autoria. 2001, 198 fl.
Tese. (Doutorado em Cincia da Informao) Programa de Ps-Graduao e Cincia da
Informao da Escola de Comunicao da Universidade Federal do Rio de Janeiro. Rio de
Janeiro, 2001.
______. A. Integrao de Ontologias o domnio da Bioinformtica e a problemtica da
compatibilizao terminolgica. In: ENCONTRO NACIONAL DE PESQUISA EM
CINCIA DA INFORMAO, 8, 2007, Salvador. Anais. Salvador: UFBA. Programa de
Ps-Graduao em Cincia da Informao, 2007. VIII ENANCIB. Disponvel em:
<http://www.portalppgci.marilia.unesp.br/enancib/viewabstract.php?id=163> Acesso em:
maio 2008.
CAMPOS, M. L. M.; CAMPOS, M. L. A.; CAMPOS, L. M. Web Semntica e a Gesto de
Contedos Informacionais. In: MARCONDES, C. H. (Org.). Bibliotecas Digitais: Saberes e

139
Prticas. Salvador/Braslia, UFBA/IBICT, 2006. p. 55-78.
CAMPOS, M. L. de A. ; GOMES, H. E. Taxonomia e Classificao: o princpio de
categorizao. DataGramaZero Revista de Cincia da Informao, v. 9, n. 4, ago. 2008.
Disponvel em: <http://www.dgz.org.br/ago08/F_I_art.htm> Acesso em: abril 2009.
CAVALCANTI, C.R. Indexao e tesauro: metodologia e tcnicas. Braslia, ABDF, 1978.
CINTRA, A.M.M.; et al. Para entender as linguagens documentrias. So Paulo: Polis, 2002.
CONWAY, S.; SLIGAR, C. Building Taxonomy. In: Unlocking Knowledge Assets.
Washington, Microsoft Press, 2002. 256 p.
CORCHO, O.; FERNNDEZ-LPEZ, M.; GMEZ-PREZ, A. Methodologies, tools and
languages for building ontologies. Where is their meeting point? Data & knowledge
Engineering 46 (2003) 41-64. Disponvel
em:<http://www.cs.man.ac.uk/~ocorcho/#publications> Acesso em: maio 2008.
CURRS, E. Ontologas, Taxonomas y Tesauros: manual de construccin y uso. 3 ed.
Espanha: Ediciones Trea, S. L. 2005. 337 p.
DACONTA, M. C.; OBRST, L. J.; SMITH, K. T. The Semantic Web: A guide to the future of
XML, Web Services, and Knowledge Management. Indiana: Wiley Publishing, Inc. 2003.
281 p.
DAHLBERG, I. Teoria do conceito. Cincia da Informao, Rio de Janeiro, v.7, n.2, p.101107, 1978.
______. Knowledge Organization. 2006. Disponvel em:
<http://www.db.dk/bh/lifeboat_ko/CONCEPTS/knowledge_organization_Dahlberg.htm>
Acesso em: mar. 2008.
DODEBEI, V. L. D. TESAUROS: linguagem de representao da memria documentria. Rio
de Janeiro: Editora Intercincia, 2002. 119 p.
DUTRA, J. ; BUSCH, J. NASA Technical White Paper Enabling Knowledge Discovery:
Taxonomy Development for NASA. 2003. Disponvel em: <http://trs-new.jpl.nasa.gov.>

140
Acesso em: jul 2007.
EDOLS, L. Taxonomies are what? Free Pint, Reino Unido, n.97, out. 2001. Disponvel em:
<http://www.freepint.com/issues/041001.htm#eature>. Acesso em: out. 2008.
FEITOSA, A. Organizao da informao na web: das tags web semntica. Braslia:
Thesaurus, 2006.
FERREIRA, A. B. de H. Novo Dicionrio da lngua portuguesa, 1 ed., 15 imp., Rio de
janeiro: Nova Fronteira, [1986]. p. 365 e 1005: organizar e conhecer.
GLOSSRIO GERAL DE CINCIA DA INFORMAO. Disponvel em:
<http://www.cid.unb.br/publico/setores/100/123/sistema/m0039015.htm >. Acesso jul. 2009.
GOMES, H. E. Manual de elaborao de tesauros monolngues. Braslia: o Programa, 1990.
78 p.
______. H. E. Tendncias da Pesquisa em Organizao do Conhecimento. Tendncias da
Pesquisa Brasileira em Cincia da Informao. Braslia, v. 2, n.1, p. 60-88, jan./dez. 2009.
GUARINO, N. Formal Ontology. In: PROCEEDING OF FOIS'98, TRENTO, ITALY, 6-8
JUNE 1998. Amsterdam, IOS Press, pp. 3-15.
GUINCHAT, C.; MENOU, M. Introduo geral s cincias e tcnicas da informao e
documentao. 2 ed. Braslia: FBB e IBICT, 1994. 540 p.
GRUBER, T. (1996). What is an ontology? [S. I. : s. n.], 1996. Disponvel em:
<http://ksl.stanford.edu/kst/what-is-an-ontology.html> Acessado em: abril 2007.
HESSEN, J. Teoria do Conhecimento. 2 ed. So Paulo: Martins Fontes. 2003. 177p.
HJRLAND, B. Fundamentals of knowledge organization. Knowledge Organization, v.30,
n.2, p. 87- 111, 2003.
______. Knowledge Organization Systems. 2007.Disponvel em:
<http://www.db.dk/bh/lifeboat_ko/CONCEPTS/knowledge_organization_systems.htm>

141
Acesso em: 14 maro 2008.
HODGE, G. Systems of Knowledge Organization for Digital Libraries: beyond traditional
authorities files. Washington, DC, the Council on Library and Information Resources. 2000.
Disponvel em: <http://www.clir.org/pubs/reports/pub91/contents.htm> Acesso em: 24 maio
2008.
IBICT. Diretrizes para elaborao de tesauros monolngues. Braslia, 1984.
KENT, A.; LANCOUR, H. Encyclopedia of library and information science. New York: M.
Dekker, 1968.
KWASNIK, B. H. The Role of Classification in Knowledge Representation and Discovery
1. Library Trends. FindArticles.com. 1999. Disponvel em:
<http://findarticles.com/p/articles/mi_m1387/is_1_48/ai_57046525>. Acesso em: mar 2009.
LANCASTER, F. W. Indexao e resumos: teoria e prtica. 2 ed. Braslia: Briquet de
Lemos. 2004. 452 p.
LANGRIDGE, D. Classificao: abordagem para estudantes de Biblioteconomia. 1
reimpresso. Rio de Janeiro: Intercincia, 2006.
LARA, M. L. G. O Unicrnio (o Rinoceronte, o Ornitorrinco ...), a Anlise Documentria e a
Linguagem Documentria. DataGramaZero Revista de Cincia da Informao, v. 2, n. 6,
dez. 2001. Disponvel em: <http://www.dgz.org.br/dez01/F_I_art.htm>. Acesso em: maio
2009.
LARA, M. L. G. de. A representao documentria: em jogo a significao. 1993.
Dissertao de Mestrado em Cincias da Comunicao, Universidade de So Paulo, Escola de
Comunicaes e Artes, Departamento de Biblioteconomia e Documentao, So Paulo.
LIMA, J. A. de O. Modelo Genrico de Relacionamentos na Organizao da Informao
Legislativa e Jurdica. 2008. 289fl. Tese (Doutorado em Cincia da Informao)
Universidade de Braslia, Braslia, 2008. Disponvel
em:<http://www2.senado.gov.br/bdsf/item/id/92749>. Acesso em: maio 2009.
LIMA, V. M. A. Da classificao do conhecimento cientfico aos sistemas de recuperao
de informao: enunciao de codificao e enunciao de de codificao da informao

142
documentria. 2004. 156fl. Tese (Doutorado em Cincias da Comunicao) Escola de
Comunicaes e Artes da Universidade de So Paulo, So Paulo, 2004. Disponvel em:
<http://www.teses.usp.br/teses/disponiveis/27/27143/tde-06032006-150120>. Acesso em:
mar 2009.
LYON, J. Linguagem e Lingustica: uma introduo. Rio de Janeiro: Guanabara Koogan,
1987. 322 p.
NASCIMENTO, M. S. O. do et all. A ontologia na Cincia da Informao. Revista Digital de
Biblioteconomia e Cincia da Informao, v. 5, n. 1, p.13-39. jan/jun. 2007 ISSN: 1678765.
NOY, N. F.; McGUINNESS, D. L. Ontology Development 101: A Guide to Creating Your
First Ontology. Stanford University: Stanford, 2001. Disponvel em:
<http://www.ksl.stanford.edu/people/dlm/papers/ontology101/ontology101- noymcguinness.html> Acesso em: maio 2008.
PHILLIPS, W. H. A primer of book classification. London: Association of Assistant
Librarians, 1955. 235 p.
PIEDADE, M.A.R. Introduo teoria da classificao. Rio de Janeiro: Intercincia, 1977.
RANGANATHAN, S. R. Colon Classification: basic classification. 6 ed. Bombay: Asia
Publ. House, 1963.
REITZ, J. M. ODLIS Online Dictionary for Library and Information Science. Libraries
Unlimited. 2004. Disponvel em: <http:http://lu.com/odlis/odlis_t.cfm> Acesso em: 22 out.
2008.
ROBREDO, J. Documentao de Hoje e de Amanh. 4 ed. rev. e ampl. Braslia: Edio de
autor, 2005, 409 p.
ROCHA, D.; DEUSDAR, B. Anlise de Contedo e Anlise do Discurso. ALEA Estudos
Noelatinos. v. 7, n. 2, jul./dez. 2005. p. 305-322.
ROWLEY, J. E. Organizing Knowledge: an Introduction to Information Retrieval. 2 ed.
England: Ashgate, 1992. 509 p.

143
RUSSELL, B. Histria do Pensamento Ocidental: a aventura dos pr-socrticos a
Wittgenstein. 3 ed. Rio de Janeiro: Ediouro. 2003. 510 p.
SALES, R. de. Tesauros e Ontologias sob a luz da Teoria Comunicativa da Terminologia.
2008. 210fl. Dissertao (Mestrado em Cincia da Informao) - Universidade Federal de
Santa Catarina, Florianpolis, 2008. Disponvel em:
<http://aspro02.npd.ufsc.br/pergamum/biblioteca/index.phpresolution2=1024_1> . Acessado
em: abril 2009.
SALES, L. F.; CAMPOS, M. L. de A.; GOMES, H. E. Ontologias de domnio: um estudo das
relaes conceituais. Perspectivas em Cincia da Informao, v. 13, n. 2, p. 62-76, maio/ago.
2008.
SLAVIC, A. Knowledge Organization Systems, Network Standards and Semantic Web. IN:
INFORMACIJSKE ZNANOSTI U PROCESU PROMJENA. Zagred: Zavod za informacijske
studije, 2005. p. 5-22. Disponvel em:
http://dlist.sir.arizona.edu/1326/03/semweb_kos_EN_2.doc. Acessado em: 01 abril 2009.
SMIRAGLIA, R. The progress of theory in knowledge organization. Library Trends. Wntr
2002. Disponvel em: http://findarticles.com/p/articles/mi_m1387/is_3_50/ai_88582618.
Acessado em: 21 Jul. 2008
SOUZA, J. S. de. Classificao: sistemas de classificao bibliogrfica. Rio de Janeiro:
Imprensa Nacional, 1943.
SRIVASTAVA, A. Theory of Knowledge Classification in Libraries. New Delhi: Sagar
Publications, 1964. 206 p.
SVENONIOUS, E. The Intellectual Foundation of Information Organization. London: The
MIT Press, 2000. 254 p.
TERRA, et al. Taxonomia: elemento fundamental para a Gesto do Conhecimento.
Disponvel em: <www.terraforum.com.br> Acesso em: 01 mar. 2005.
TOUTAIN, L. M. B. B. Biblioteca digital: definio de termos. In: MARCONDES, C.H.Org.)
Bibliotecas Digitais: Saberes e Prticas. Salvador/Braslia, UFBA/IBICT, 2006. p. 15-24.

144
VELTMAN, K. H. Towards a Semantic Web for Culture. Journal of Digital Information, v.
4, n. 4, artigo no 255, 15/03/2004. Disponvel em:
<http://jodi.ecs.soton.ac.uk/Articles/v04/i04/Veltman/veltman.pdf>. Acesso em: maio 2009.
W3C World Wide Web Consortium. KOS. Disponvel em:
<http://www.w3.org/2004/02/skos/> Acesso em: jan. 2009.
WYLLYS, R. E. Information Architecture. Material de aula da equipe da The Graduate
School of Library and Information Science at UT-Austin. Direitos autorais de LIS 386.13.
Disponvel em: http://www.ischool.utexas.edu/~l38613dw/readings/InfoArchitecture.html.
Acesso em: 25 maio 2008.
ZENG, M. L. Knowledge Organization Systems (KOS). Knowledge Organization, v. 35, n. 23, p. 160-182, 2008.

145

Apndice A - universo da pesquisa


Base de dados - LISA
Nome
1 - Keith C.
Clarke

Afiliao

Pas

Department of Geography, University of California, Santa Barbara


Professor, 1996 Current Chair, 2001 Current Professor, Center for
Film, Television and New Media, University of California, Santa Barbara
Environmental Media Initiative, University of California, Santa Barbara

Estados Unidos

2 - Michael
Professor, Department of Geography, University of California, Santa
Frank Goodchild Barbara

Estados Unidos

3 - Mara Jos
Lpez-Huertas
Prez

Espanha

Departamento de Biblioteconomia y Documentacion, University of


Granada Departamento de Biblioteconomia y Documentacion, University
of Granada Instituto de Estudios de la Mujer, University of Granada

Base de dados - LISA


Ano

Autor

Ttulo do
Artigo

Referncia da
Publicao

Relao com a Base


Terica

Palavrachave

Idioma
/
pas

4
Nielsen,
2008 Marianne
Lykke

Networked
D-Lib Magazine,
Knowledge
vol. 14, no. 11-12,
Organization
Nov-Dec 2008
Systems/Service
s (NKOS):
ECDL 2008
Conference
Report

KOS,tesauros, taxonomias
e ontologias, estruturas
conceituais e bases
conceituais para sistemas
baseados emconhecimento.
Ferramentas, representao
e indexao de
informaes e documentos.
Bibliotecas digitais,

Workshops; Ingls /
Knowledge Estados
organization Unidos
; Networks

5
Weller,
2008 Katrin;
Stock,
Wolfgang

Transitive
meronymy.
Automatic
concept-bases
query expansion
using weighted
transitive partwhole relations

Information:
Wissenschaft &
Praxis, vol. 59, no.
3, pp. 165-170,
Apr-May 2008

Aponta a relao de
meronmia e hiponmia
para a construo dos
KOS.

Query
expansion;
Computeriz
ed
information
retrieval;
Semantic
relations

Ingls /
Repbli
ca da
Aleman
ha

6
Peters,
2008 Isabella;
Weller,
Katrin

Paradigmatic and
syntagmatic
relations in
knowledge
organization
systems

Information:
Wissenschaft &
Praxis, vol. 59, no.
2, pp. 100-107,
2008

Mtodos clssicos de RC
so vagos e restritos,
quanto as relaes como
sinonmia e hierarquia
(meronmia e hiponmia).
Mostra as relaes usadas
para a construo de
ontologia e outros KOS.

Knowledge
representati
on;
Ontology;
Controlled
vocabulary;
Collaboratio
n

Ingls /
Repbli
ca da
Aleman
ha

Online
information
retrieval;
Knowledge
organization
;

Alemo
/
Repbli
ca da
Aleman
ha

7
Heesemann Faceted KOS
2008 , Silke;
and dynamic
Nellissen, classification as
Hanstools for the
Dieter
research of the
Desk27 Web
27

Information:
Online information
Wissenschaft &
retrieval; Knowledge
Praxis, vol. 59, no. organization; Classification
2, pp. 108-117,
2008

do ttulo original Facettierte Wissensordnungen und dynamisches Klassieren als Hilfsmittel der
Erforschung des Dark Web.

146
Classificatio
n
8
Dextre
2008 Clarke,
Stella G.

The last 50 years


of knowledge
organization: a
journey through
my personal
archives

Journal of
Information
Science, vol. 34,
no. 4, pp. 427-437,
2008

Princpios de classificao
e classificao facetada na
construo de tesauros e
outros esquemas de
representao do
conhecimento.

9
Zeng,
Knowledge
2008 Marcia Lei Organization
Systems (KOS)

Knowledge
Organization, vol.
35, no. 2-3, pp.
160-182, 2008

KOS:tesauros, taxonomias Knowledge


e ontologias, na funo de organization
eliminar a ambiguidade,
; Semantics
controle de sinnimos ou
equivalentes,estabelecendo
relaes semnticas em um
domnio. Facilitador de
buscas, indexadores e
futuros usurios (homens
ou mquinas)

10
Slavic,
2007 Aida

On the nature
and typology of
documentary
classifications
and their use in a
networked
environment

Profesional de la
Informacion, vol.
16, no. 6, pp. 580589, Nov-Dec

KOS classificao
documentria,
terminologia, esquemas de
classificao influencia
estruturas semnticas e
sintticas

Classificatio Ingls /
n schemes, Espanha
Knowledge
organization

11
Sanchez2007 Cuadrado,
Sonia;
MoratoLara, Jorge;
PalaciosMadrid,
Vicente;
LlorensMorillo,
Juan;
MoreiroGonzalez,
Jose
Antonio

And suddenly,
everybody is
talking about
ontologies?

Profesional de la
Informacion, vol.
16, no. 6, pp. 562568, Nov-Dec,
2007

KOS tesauros, ontologias


em base de dados e o
significado desses
conceitos

Ontologies; Espanho
Thesauri;
l/
Knowledge Espanha
organization

12
Barat,
2007 Agnes
Hajdu

Human
perception and
knowledge
organization:
visual imagery.

Library Hi Tech,
vol. 25, no. 3, pp.
338-351, 2007

KOS teoria e prtica de


OC. Construo de
conceitos e extenso
determinao de semntica
em diferentes aspectos.
Processo cognitivo para
construo de conceitos,
mtodos lingusticos
consideram a percepo.

Knowledge Ingls /
organization Reino
; Visual
Unido
materials;
Images

KOS vital para


bibliotecas digitais;
tesauros, sinnimos e
antnimos termos e
relacionamentos;

Knowledge
management
; Digital
libraries;
Institutional

13
Angrosh,
Ontology-driven Information
2006 M. L.; Urs, knowledge
Studies, vol. 12,
Shalini R. management
no. 3, pp. 151-168,
systems for
Jul 2006
digital libraries:

Knowledge Ingls /
organization Reino
; Faceted
Unido
classificatio
n schemes;
Thesauri
Ingls /
Repbli
ca da
Aleman
ha

Ingls /
no
consta
pas de
publica

147
towards creating
semantic
metadata-based
information
services.

taxonomias, agrupamento
hierrquico e estrutura de
rvore; ontologias alto grau
de relacionamento
associativo entre conceitos,
semntica.

repositories; o
Metadata;
Semantic
relations;
Ontologies

14
Cantara,
2006 Linda

Encoding
controlled
vocabularies for
the Semantic
Web using
SKOS Core.

OCLC Systems
and Services, vol.
22, no. 2, pp. 111114, 2006

SKOS core sequncia


dos KOS tradicionais:
tesauros e sistemas de
classificao porm mais
complexos e usam
liguagens da web
semntica. Novos padres
para bibliotecas digitais

Online
information
retrieval;
Searching;
Subject
heading
schemes;
Semantic
relations;
Metadata;
Software;
SKOS Core

15
Tennis,
2005 Joseph T

Experientialist
Knowledge
epistemology
Organization; 32
and classification (2) 2005, pp.79-92
theory:
embodied and
dimensional
classification

KOS:teoria da
classificao, CI,
semntica cognitiva,
organizao do
conhecimento. Para
investigao de
experimentos em teoria da
classificao.

Classificatio Ingls /
n;
no
Knowledge consta
organization
;
Epistemolog
y

KOS vocabulrio
controlado, esquemas de
classificao e
interoperabilidade;
linguagens e estruturas;
anlise metodolgica.

Knowledge Ingls /
management no
;
consta
Knowledge
organization
;
Interoperabi
lity

16
Chan, Lois Trends and
2004 Mai; Zeng, issues in
Marcia Lei establishing
interoperability
among
knowledge
organization
systems

Journal of the
American Society
for Information
Science and
Technology; 55
(5) Mar 2004,
pp.377-395

Ingls /
no
consta
pas de
publica
o

17
Mai, Jens2003 Erik

Organization of Knowledge
knowledge in a Organization; 30
networked
(1) 2003, pp.36-37
environment: a
report of the 6th
Networked
Knowledge
Organization
Systems (NKOS)
Workshop

Dos KOS tradicionais s


novas ferramentas
semnticas; ontologias,
tesauros, princpios de
organizao de colees e
desenvolvimento de
vocabulrios e bibliotecas
digitais.

Information Ingls /
work;
no
Knowledge consta
management
International
conferences;
Networked
KOS

18
Fisseha,
2003 Frehiwot;
Katz, S.;
Keizer,
Johannes;
Lauser,
Boris;
Liang,
Anita;
Soergel,
Dagobert

Reengineering
thesauri for new
applications: the
AGROVOC
example

KOS estrutura conceitual


e processos de transio
para dar suporte troca dos
KOS tradicionais pelos
KOS mais completos e
mais ricos em semntica
interoperabilidade RDFS
e XML no ambiente web.

Knowledge Ingls /
management no
;
consta
Knowledge
organization
; Thesauri;
AGROVOC

Journal of Digital
Information; 4 (4)
2003, No page
numbers

148
19
Orom,
2003 Anders

Knowledge
organization in
the domain of art
studies - history,
transition and
conceptual
changes

Knowledge
Organization; 30
(3/4) 2003,
pp.128-143

20
Hodge,
2000 Gail

Systems of
Report:
Knowledge
ED440657. 46pp.
Organization for Apr 2000
Digital Libraries:
Beyond
Traditional
Authority Files.

KO no domnio da Artes:
no nvel dos sistemas de
classificao, bibliografias
e tesauros; a integrao
com as taxonomias da
LCC, DDC, UDC e
Sovietic BBK sistemas de
classificao, a relao
entre os paradigmas,
princpios para artes,
maneiras de conceitualizar
e organizao do contedo
dos documentos de arte

Classificatio Ingls /
n schemes; no
Knowledge consta
organization
; Thesauri;
Art

KOS aplicao em
materiais digitais e
iniciativas em bibliotecas
digitais. Definies de
caractersticas gerais,
origem e uso, exemplos
como podem ser usados
em bibliotecas digitais e
em vrias disciplinas.

Access to
Ingls /
Information; no
Electronic
consta
Libraries;
Information
Managemen
Information
Storage;
Information
Systems;
Library
Collection
Developmen

Base de dados - LISA continuao


Ano

Autor

Ttulo do Artigo

Referncia da
Publicao

PalavrasChave

Idioma/pas
publicao

21
2008

Peters,
Tag Gardening for
Webology, vol. 5,
Isabella;
Folksonomy Enrichment no. 3, Sept 2008
Weller, Katrin and Maintenance

Tagging;
Knowledge
organization;
Semantics

ingls/Iran

22
2008

Spiteri, Louise Folksonomies, the Web


and Search Engines

Webology, vol. 5,
no. 3, Sept 2008

Search
engines;
Tagging

ingls/Iran

23
2008

LopezHuertas,
Maria J

Some Current Research


Questions in the Field of
Knowledge
Organization

Knowledge
Knowledge
Organization, vol.
organization;
35, no. 2-3, pp. 113- Research
136, 2008

ingls/Repb
lica da
Alemanha

24
2007

Anderson,
Jack

Information criticism:
where is it?

Faslname-Ye
Ketab/Library and
Information Studies,
vol. 18, no. 2, pp.
251, summer 2007

Library and
information
science;
professional
education;
Knowledge
organization;
Criticism

Persa / Iran

25
2007

Bai, Haiyan;
Hu, Tiejun;
Liang, Fang;
Zuo,

New development of
library automatization
system integrated with
knowledge organization

Journal of the China


Society for Scientific
and Technical
Information, vol. 26,

Knowledge
Chins / no
management; consta pas
Knowledge
de publicao
organization;

149
Yonglong

systems.

no. 1, pp. 106-110,


2007

Library
technology;
Information
retrieval

26
2007

Lacasta,
ThManager: an open
Javier;
source tool for creating
Nogueras-Iso, and visualizing SKOS.
Javier; LopezPellicer,
Francisco
Javier; MuroMedrano,
Pedro Rafael;
ZarazagaSoria,
Francisco
Javier

Information
Technology and
Libraries, vol. 26,
no. 3, pp. 39-51,
2007

Knowledge
organization;
Thesauri;
Open source
software;
ThManager

Ingls /
Estados
Unidos

27
2006

Zeng, Marcia Sharing and use of


Lei
subject authority data.

International
Cataloguing and
Bibliographic
Control, vol. 35, no.
3, pp. 52-54, Jul
2006-Sep 2006

Subject
indexing;
Authority
control; Data
sharing;
Knowledge
organization

Ingls / no
consta local
de publicao

28
2006

SanchezAlonso,
Salvador;
GarciaBarriocanal,
Elena

29
2004

Shiri, Ali;
Interfaces to knowledge
Molberg, Keri organization systems in
Canadian digital library
collections

30
2004

Perkins, Jody

Making use of upper


Online Information
ontologies to foster
Review, vol. 30, no.
interoperability between 3, pp. 263-277, 2006
SKOS concept schemes.

Computer
Ingls / no
applications; consta pas
Knowledge
de publicao
management;
Knowledge
organization;
Semantic
relations;
Ontologies

Online Information Online


Review; 28 (5) 2004, information
pp.604-620. \itYR\
retrieval;
Searching;
User
interface;
Digital
libraries;
Knowledge
organization;
Canada

Marcia Zeng, PhD: from Journal of Internet


indexing to knowledge
calaoguing, vol. 7,
organization systems,
no. 2, pp. 9-17, 2004
one woman's journey
across the globe and into
the future of library and
information science.

Ingls / no
consta

Library and
Ingls / no
information
const
professionals;
Digitallibrarie
s;cataloguing;
Knowledge
organization;
Zeng, M. Lei

150
Base de dados - ISTA
Ano

Autor

Ttulo do
Artigo

Referncia da
Publicao

Relao com Base


Terica

Palavra-chave

1
McCulloch Analysis of
2008 , Emma
Equivalence
and
Mapping for
Macgregor, Terminology
Services

Journal of
Information
Science, 2008, vol.
34, n. 1, pp. 70-92
[Journal Article
(Print/Paginated)]

Interoperabilidade,
caracterizar
relacionamentos entre
mapeamento de
determinadas
terminologias e
esquema da CDD,
SKOS

classification, Hilt3, ingls


interoperability,
knowledge
organisation
systems, SKOS
Core,terminologies,
vocabulary
mapping

2
Hjrland,
2009 Birger

Concept
theory

Journal of the
American Society
for Information
Science &
Technology;
Aug2009, Vol. 60
Issue 8, p15191536, 18p

CI e KO possuem
relaes com a teoria
do conceito. KOS
sistemas de
classificao, tesauros
e ontologias so
sistemas que
organizam conceitos e
suas relaes
semnticas. Assim
como em SRI. O
artigo aponta que o
entendimento
histrico e pragmtico
de conceitos so
muito frutferos em
CI.

Abstraction
---Knowledge, Theory
of Perception
Cognition,
Eletronic data
processing,
Information
technology,
Communication
Information theory,
Information
visualization,
analytic models,
concepts
epistemology,
KOS, mental
processes

3
Sanchez2007 Cuadrado,
S; MoratoLara,J;
PalaciosMadrid,
V; LlorensMorillo, J;
MoreiroGonzalez, J
A.

And suddenly,
everybody is
talking about
ontologies?

Profesional de la
Informacion, vol.
16, no. 6, pp. 562568, Nov-Dec,
2007

KOS tesauros,
Ontologies;
ontologias em base de Thesauri;
dados e o significado Knowledge
desses conceitos
organization

espanho
l/
Espanha

4
Shiri, Ali
2003

Digital library
research:
current
developments
and trends

Library Review;
2003, Vol. 52 Issue
5 and 6, p198-202,
5p

Presents an overview
of current trends in
digital library research
in the following areas:
digital library
architecture, systems,
tools, technologies;
digital content and
collections; metadata;
standards;
interoperability;KOS;
users and usability;
legal,organizational,
economic, and social
issues.

-----

Digital libraries
Research
Design
Concepts

Idioma/
pas

151
5
Nielsen,
2004 Marianne
Lykke

ECDL 2004
D-Lib Magazine;
Workshop
Oct2004, Vol. 10
ReportNKOS: Issue 10, p1-1, 1p
User-centred
approaches to
Networked
Knowledge
Organization

Workshoptroca de
experincias ligadas
aos KOSmodelos de
estruturao, relaes
de conceitos,
metodologias e
tcnicas de
padronizao

Informationresourc Ingls /
es management
Inglaterr
Seminars
a
Knowledge
management
Information storage
& retrieval systems
System design

6
Cantara,
2006 Linda

Encoding
controlled
vocabularies
for the
Semantic Web
using SKOS
Core.

OCLC Systems
and Services, vol.
22, no. 2, pp. 111114, 2006

SKOS coreKOS
tradicionais: tesauros
e sistemas de
classificao, mais
complexos, novos
padres bibliotecas
digitais, liguagens da
web semntica.

Online information Ingls /


retrieval;
no
Searching; Subject consta
heading schemes;
Semantic relations;
Metadata;
Software; SKOS
Core

7
Thornton,
2009 Grace

Everything is
Miscellaneous
: The Power
of the New
Digital
Disorder.

Journal of the
American Society
for Information
Science &
Technology;
Jun2009, Vol. 60
Issue 6, p12991300, 2p (book
review)

No apresenta dados
suficientes para saber
do que se trata. Artigo
da reviso do livro:
Everything is
miscellaneous: the
power of the New
Digital Disorder

collaborative
indexing
customization
knowledge
organization
systems
organization of
information
World Wide Web

8
Tennis,
2005 Joseph T

Experientialist Knowledge
epistemology Organization; 32
and
(2) 2005, pp.79-92
classification
theory:
embodied and
dimensional
classification

KOS teoria da
classificao, CI,
semntica cognitiva,
organizao do
conhecimento.
Investigao de
experimentos em
teoria da classificao
e organizao do
conhecimento.

Classification;
Knowledge
organization;
Epistemology

Ingls /
no
consta

9
Barat,
2007 Agnes
Hajdu

Human
Library Hi Tech,
perception and vol. 25, no. 3