Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
ELIANA CARLAN
Braslia
2010
Eliana Carlan
Braslia
2010
Carlan, Eliana.
Sistemas de Organizao do Conhecimento: uma reflexo no contexto da Cincia da
Informao / Eliana Carlan. Braslia: UnB / Departamento de Cincia da Informao e
Documentao, 2010.
100 f. : Il. color. ; 30 cm.
Dissertao (Mestrado) Universidade de Braslia / Departamento de Cincia da
Informao e Documentao, 2010
Orientadora: Prof. Dr. Marisa Brscher Baslio Medeiros.
1. Sistemas de Organizao do Conhecimento. 2. Tesauro. 3. Taxonomia. 4.
Ontologia. 5. Teoria do conceito. 6. Teoria da classificao. 7. Terminologia. 8.
Lingustica. I. Ttulo.
_____________________________________________
Prof. Dr. Marisa Brscher Baslio Medeiros
Presidente (UnB/PPGCInf)
_____________________________________________
Prof. Dr. Dulce Maria Baptista
Membro Interno (UnB/PPGCInf)
_____________________________________________
Prof. Dr. Lgia Maria Arruda Caf
Membro Externo (UFSC/Florianpolis)
__________________________________________
Prof. Dr. Sofia Galvo Baptista
Suplente (UnB/PPGCInf)
Agradecimentos
minha famlia: meu marido Joo; meus filhos, Paulo, Pedro e Laura; meus pais Mariano e
Irene; e minhas irms, Kika e Marisa, por tudo que fazem por mim.
Professora Dr. Marisa Brscher, pelo apoio e incentivo, pelas oportunidades em sala de aula,
participaes em eventos, publicaes, pela orientao, pelas dicas valiosas e por todo meu
aprendizado.
Fernanda Moreno e Mariana Brandt, pelas dicas, discusses sobre o tema, trabalhos em grupo
e pela amizade.
A todos os professores do CID que contriburam para a minha formao.
Prof. Dr. Dulce Maria Baptista e Prof. Dr. Lgia Maria Arruda Caf, pelas sugestes e por
integrarem a banca.
Meu primo, Prof. Dr. Cludio Carlan pela fora e apoio.
Aos integrantes do grupo de pesquisa EROIC, especialmente Prof. Dr. Jaime Robredo, Auto
Jnior, Greyciane Lins e Fbio Teixeira .
Biblioteca Central da UnB e Biblioteca do IBICT, pelos servios do COMUT e acessos ao
acervo.
Marta e Jucilene, pelo empenho nos servios da secretaria da ps-graduao.
A todos que de alguma maneira contriburam para a realizao desta pesquisa.
E CAPES, pelo apoio financeiro.
Muito Obrigada, de corao!
Resumo
A presente pesquisa estuda os sistemas de organizao do conhecimento e a relao com as
bases tericas utilizadas na construo de tesauros, taxonomias, ontologias e sistemas de
classificao encontradas na literatura da rea de Cincia da Informao. Para tal estudo,
utiliza-se a metodologia de reviso de literatura, alm de pesquisa nas bases de dados da rea,
a fim de investigar a produo bibliogrfica sobre o tema, de 1998 at junho de 2009.
realizada reviso bibliogrfica na rea de organizao e representao do conhecimento,
especificamente relacionada com o desenvolvimento de tesauros, taxonomias, ontologias e
sistemas de classificao. Identifica um caminho terico comum para ser percorrido na
construo dos sistemas de organizao do conhecimento passando pela teoria da
classificao, teoria do conceito, os relacionamentos entre conceitos e os princpios da
Lingustica e Terminologia. A partir de amostra representativa da produo bibliogrfica
sobre o tema, faz-se a anlise nas suas caractersticas extrnsecas e intrnsecas. As primeiras,
relativas forma, incluem ano de publicao, autores, ttulo, publicao e palavras-chave. As
caractersticas intrnsecas abrangem a anlise de contedo dos documentos, respeitando a
fundamentao terica abordada na reviso de literatura. Conclui-se que os tesauros e os
sistemas de classificao so os mais citados na literatura sobre sistemas de organizao do
conhecimento, inclusive servindo de referncia terica para o desenvolvimento desses
sistemas. Apesar de contar com essa base terica proveniente dos estudos sobre tesauros e
classificaes com normas e padres relativos a esses dois sistemas reconhecidos
internacionalmente, evidencia-se a necessidade da consolidao de padres comuns para o
desenvolvimento dos diferentes tipos de SOC, na rea de Cincia da Informao. Aponta-se
para a necessidade de congregar os interesses multidisciplinares pela convergncia de
objetivos e, com isso, gerar melhores prticas de organizao e representao do
conhecimento.
Abstract
This research studies the knowledge organization systems (KOS) related to theories to build
thesaurus, taxonomies, ontologies and classification systems in the literature field of
Information Science. It uses the methodology of literature review and a research on the same
field databases in order to investigate the bibliographic production about the theme, from 1998
up to July 2009. A bibliographic research about knowledge organization and representation is
carried out, specifically related to the development of thesaurus, taxonomies, ontologies and
classification systems. It identifies the same theoretical way to build KOS through the
classification theory, concept theory, the relationship between the concepts and the foundation
of Linguistics and Terminology. Extrinsic and intrinsic characteristics were analysed from the
representative sample of the bibliographic production about KOS. The extrinsic analysis is
relative to form aspects, including the publication year, authors, title, publication and
keywords. The intrinsic analysis relates to content aspects through the subject analysis of the
documents following the theoretical foundations. The last chapter verifies that the thesaurus
and classification systems are the most quoted in the literature about KOS, being a theoretical
reference to the development of these systems based on the international standards and rules.
It highlights the importance of consolidating common standards to build different types of
KOS in the field of Information Science and shows the need of
gathering the
multidisciplinary interests linked by the same goals and also getting better practices in the
knowledge organization and representation.
LISTA DE ILUSTRAES
Lista de Figuras
Figura 1
Figura 2
Classificao...............................................................................................66
Figura 3
rvore de Porfrio.......................................................................................70
Figura 4
Tringulo conceitual...................................................................................79
Figura 5
Figura 6
Lista de Quadros
Quadro 1
Quadro 2
Quadro 3
Quadro 4
Quadro 5
Quadro 6
Quadro 7
Quadro 8
Quadro 9
Relatos de conferncias.............................................................................109
Quadro 10
Quadro 11
Quadro 12
Quadro 13
Quadro 14
Quadro 15
Quadro 16
Quadro 17
Incidncia de palavras-chave....................................................................122
Quadro 18
Quadro 19
Quadro 20
Quadro 21
Quadro 22
Lista de Grficos
Grfico 1
Grfico 2
Grfico 3
Grfico 4
Grfico 5
LISTA DE SIGLAS
ACM
AGRIS
ALISS
ANSI
ASIST
BDTD
BRAKOR
CC
Colon Classification
CB
Classificao de Bliss
CDD
CDU
CEB
CICA
E-LIS
EPC
FID
HTML
IBICT
IFLA
ISTA
ISO
ISKO
KO
Knowledge Organization
KOS
LCC
LISA
LISTA
MRF
NASA
NISO
OC
Organizao do Conhecimento
OWL
RDF
SGML
SKOS
SOC
SRI
TCT
TGT
UDCC
UNESCO
XML
W3C
WWW
SUMRIO
1 CONTEXTUALIZAO..............................................................................................15
1.1 Introduo......................................................................................................................16
1.2 Definio do Problema..................................................................................................18
1.3 Questo de Pesquisa......................................................................................................19
1.4 Objetivos.......................................................................................................................20
1.4.1 Objetivo Geral............................................................................................................20
1.4.2 Objetivos Especficos.................................................................................................20
1.5 Justificativa....................................................................................................................20
2 REVISO DE LITERATURA......................................................................................23
2.1 Organizao e Representao do Conhecimento.....................................................24
2.2 Sistemas de Organizao do Conhecimento.............................................................28
2.2.1 Sistemas de Organizao do Conhecimento e a Web Semntica..............................35
2.2.2 Simple Knowledge Organization System SKOS....................................................35
2.2.3 Tipos de Sistemas de Organizao do Conhecimento................................................36
2.2.3.1 Lista de Termos.......................................................................................................36
2.2.3.2 Classificao e Categoria........................................................................................32
2.2.3.3 Lista de Relacionamentos.......................................................................................33
2.3 Tesauros........................................................................................................................40
2.4 Taxonomias...................................................................................................................45
2.5 Ontologias.....................................................................................................................51
2.6 Sistemas de Classificao............................................................................................57
2.6.1 Classificao Decimal de Dewey...............................................................................57
2.6.2 Classificao da Biblioteca do Congresso dos Estados Unidos.................................58
2.6.3 Classificao Decimal Universal................................................................................59
2.6.4 Classificao de Dois Pontos......................................................................................61
2.6.5 Classificao de Bliss.................................................................................................63
2.7 Teoria da Classificao................................................................................................66
2.7.1 Princpios de Hierarquia.............................................................................................69
2.7.2 Classificao Facetada...............................................................................................74
2.8 Conceitos e relaes entre conceitos..........................................................................78
2.8.1 Teoria do Conceito.....................................................................................................78
Captulo 1
CONTEXTUALIZAO
16
1.1 Introduo
A ateno de uma gama de disciplinas vem sendo atrada pelos desafios impostos
pelos novos espaos informacionais no sentido de torn-los mais eficientes e efetivos. Dentre
esses desafios encontram-se aqueles relacionados organizao e recuperao de informaes
e s formas de representao e de categorizao do conhecimento.
Este trabalho insere-se nesse contexto, ao abordar como tema central a representao
do conhecimento por meio dos sistemas de organizao do conhecimento (SOC), os quais
abrangem todos os tipos de esquemas que organizam e representam o conhecimento, como
por exemplo, as classificaes, taxonomias, tesauros e ontologias.
Os SOC so sistemas conceituais semanticamente estruturados que contemplam
termos, definies, relacionamentos e propriedades dos conceitos. Na organizao e
recuperao da informao, os SOC cumprem o objetivo de padronizao terminolgica para
facilitar e orientar a indexao e os usurios. Quanto estrutura variam de um esquema
simples at o multidimensional, enquanto que suas funes incluem a eliminao da
ambiguidade, controle de sinnimos ou equivalentes e estabelecimento de relacionamentos
semnticos entre conceitos.
Por esta razo necessrio dialogar com a abordagem terica de algumas reas do
conhecimento na busca pela representao e, algumas vezes, na substituio do documento
em termos de seus aspectos temticos. Essa representao acontece pela identificao de
conceitos, sua expresso terminolgica e os relacionamentos entre os conceitos, o que leva
procura por um referencial terico na Teoria da Classificao, Teoria do Conceito, nos
relacionamentos entre conceitos, nos princpios da Lingustica e da Terminologia.
Esse referencial terico proporciona a fundamentao bsica na estrutura consistente
dos tesauros, taxonomias, ontologias e sistemas de classificao, para que eles possam
cumprir suas funes de organizao, recuperao de informao e obteno de resultados
satisfatrios. A construo destes sistemas feita a partir de escolhas de termos, conceitos,
17
classificao de termos, determinao de categorias, classes, subclasses, identificao de
caractersticas comuns e diferentes, propriedades ou atributos, o que faz disso a
fundamentao comum entre os sistemas.
Esta pesquisa tem a inteno de apontar os princpios tericos na construo de
tesauros, taxonomias, ontologias e sistemas de classificao com base na literatura da rea de
Cincia da Informao e nas opinies e relatos dos diversos autores desse campo do
conhecimento. Procura, ainda, relacionar esses fundamentos com os fundamentos tericos
mencionados em trabalhos tcnico-cientficos que foram publicados sobre o sistemas de
organizao do conhecimento, desde 1998 at 2009. Na tentativa de apontar a relao dos
estudos sobre SOC com a fundamentao terica empregada para o desenvolvimento de
tesauros, taxonomias, ontologias e sistemas de classificao, foram pesquisadas bases de
dados especficas da rea de Cincia da Informao e repositrios multidisciplinares.
O trabalho encontra-se estruturado da seguinte forma: no primeiro captulo, a
contextualizao da pesquisa, Seo 1.1 introduo, apresenta uma viso geral da pesquisa; na
Seo 1.2, definio do problema; na Seo 1.3 a questo de pesquisa; na Seo 1.4 e
subsees 1.4.1 e 1.4.2 os objetivos: geral e especficos e a justificativa na Seo 1.5.
No Captulo 2, reviso de literatura, a Seo 2.1 contempla abordagem sobre a
organizao e representao do conhecimento. A Seo 2.2 e subsees, caracterizam e
tipificam os sistemas de organizao do conhecimento, uma breve explicao dos SOC e o
ambiente da web semntica e dos SKOS. As Seo 2.3, Seo 2.4, Seo 2.5 e a Seo 2.6,
apresentam tesauros, taxonomias, ontologias e os sistemas de classificao, respectivamente.
A Seo 2.7 apresenta a teoria da classificao; na Seo 2.8 e subsees so tratados os
conceitos e relaes entre conceitos; a Seo 2.9 mostra a Lingustica, a Terminologia e os
SOC; e a Seo 2.10 as consideraes da reviso de literatura.
O Captulo 3, procedimentos metodolgicos, enfoca na Seo 3.1 o levantamento
bibliogrfico; Seo 3.2 a anlise e interpretao dos dados; Seo 3.3 as bases de dados
consultadas.
18
O Captulo 4 registra a anlise dos dados, na Seo 4.1 a definio do universo da
pesquisa; na Seo 4.2 as consideraes acerca dos resultados encontrados nas bases de dados
e na Seo 4.3 e subsees, a anlise e interpretao dos dados. E no Captulo 5 so
apresentadas as consideraes finais e sugestes de trabalhos futuros.
19
recuperao das informaes.
As recentes experincias em construo, manuteno e reuso de ontologias, tesauros e
taxonomias tm demonstrado ser mais eficiente a adoo de um enfoque colaborativo. No
entanto, a comunicao entre os colaboradores, tais como os profissionais em TI,
bibliotecrios, web designers e especialistas em diversas reas do conhecimento difcil e
requer tempo. Isso porque existem vrias estratgias de raciocnio, diferentes lgicas e formas
de representao do conhecimento na elaborao dos SOC para fins da recuperao da
informao. No entanto, a existncia de princpios tericos comuns, na rea de Cincia da
Informao, possibilitaria uma aproximao dessas reas e de profissionais agilizando a
comunicao e a construo dos SOC.
Observa-se, mesmo na rea de Cincia da Informao, a dificuldade de consolidar uma
base terica comum que apoie a construo dos SOC, o que leva proposio da questo de
pesquisa que orienta este trabalho.
20
1.4 Objetivos
1.5 Justificativa
21
informao. Por outro lado, tambm so conhecidas as dificuldades terminolgicas e
lingusticas na representao de conceitos, bem como a categorizao, quando se est
estruturando representaes de domnios do conhecimento. Nota-se, ainda, a necessidade de
bases metodolgicas apropriadas para a elaborao desses sistemas (HJRLAND, 2003).
Portanto, este trabalho se prope apresentar os aspectos tericos apontados pela literatura da
rea e que fundamentam a construo dos SOC.
Para o desenvolvimento desta investigao, foi realizada reviso de literatura sobre
sistemas de organizao do conhecimento para observao de seus progressos cientficos,
considerando-se os aspectos conceituais e estruturais de desenvolvimento desses sistemas.
Dessa forma, pretende-se fornecer subsdios que possam auxiliar a elaborao dos SOC e de
metodologias para a estrutura destes modelos conceituais. A pesquisa pretende relacionar os
fundamentos tericos indicados na literatura da rea e os princpios tericos encontrados nas
publicaes sobre o tema, desde seu surgimento at a realizao deste trabalho, por meio das
anlises bibliomtrica e de contedo.
Dos diferentes tipos de SOC, esta pesquisa destaca os tesauros, pelo uso ainda
frequente na rea de organizao de informao e por sua existncia consolidada e
padronizada por normas internacionais (ISO, ANSI/NISO); as taxonomias, por sua
importncia na organizao de informaes em empresas e instituies, principalmente, no
desenvolvimento de portais no ambiente web; as ontologias, pelo interesse da comunidade de
pesquisa na rea, em funo das promessas da web semntica e, ainda pelo potencial que
oferecem em relao capacidade de representao do conhecimento de forma complexa e
completa e os sistemas de classificao, pela ampla utilizao na organizao da informao
em bibliotecas, onde so empregadas at hoje. A realizao desta pesquisa brotou da
inquietao da autora a respeito da falta de consolidao, na rea de Cincia da Informao,
da fundamentao terica comum entre estes sistemas capaz de fornecer sustentao para
gerar melhores prticas de representao e recuperao do conhecimento.
Alguns autores1 vm desenvolvendo trabalhos nesta temtica, como o caso de Lara
(2004, p. 233) quando afirma que o campo da informao no exclusivo dos profissionais
1
Anna Maria M. Cintra; Hagar Espanha Gomes; Lgia A. Caf; Maria Luiza de A. Campos; Marilda Lopez G.
22
bibliotecrios e documentalistas, um grande nmero de experincias desenvolvidas com graus
variados de inovao, profundidade e mtodo, so geradas por distintas reas e rene
especialistas da engenharia, filosofia, matemtica, inteligncia artificial e da prpria Cincia
da Informao, na proposio do desenvolvimento de instrumentos como: tesauros,
taxonomias, ontologias, entre outros. Para Lara (2004), o propsito de mencionar esses
instrumentos deve-se s referncias comuns muitas vezes utilizadas por esses sistemas.
Assim, a elucidao das bases que sustentam a construo desses sistemas, pode congregar
vrios interesses pela convergncia de objetivos.
Binwall e Lalhmachhuana (2001) citados, em trabalho recente, por Gomes (2009, p.
78) reconhecem que os fundamentos epistemolgicos so essenciais para o progresso das
linguagens de representao do conhecimento, porm os estudos sobre o tema encontram-se,
ainda, bastante superficiais, no que concerne a conceituaes de conceitos, objetos, relaes,
classificao e herana, disponveis sob a forma de leis bsicas, princpios, postulados e
cnones.
Acredita-se que um estudo da natureza desta pesquisa possa contribuir para apoiar e
instrumentalizar os pesquisadores, no somente da rea de Cincia da Informao, mas de
outras reas que pesquisam e desenvolvem trabalhos sobre Sistemas de Organizao do
Conhecimento na busca de teorias que fundamentam os processos de representao
documentria e estratgias de organizao e recuperao da informao.
Captulo 2
REVISO DE LITERATURA
24
25
Seguindo essas propostas, conclui-se que o estudo terico fortalece e orienta a
pesquisa que se faz nas bases empricas, possibilitando organizar princpios que sustentaro as
proposies. No existe prtica sem uma fundamentao terica, assim como uma teoria no
consegue se fixar sem a prtica. Portanto, esta pesquisa busca nos fundamentos tericos o
aporte para a consolidao das prticas de desenvolvimento dos SOC, os quais se constituem
em representaes do conhecimento.
Para Dahlberg (2006), a organizao do conhecimento a cincia que ordena a
estruturao e sistematizao dos conceitos, de acordo com suas caractersticas, que podem
ser definidas como elementos de herana do objeto, e a aplicao dos conceitos e classes dos
conceitos ordenados pela indicao de valores, dos referentes contedos dos objetos ou
assuntos. A partir dessa organizao do conhecimento criam-se ferramentas que apresentam a
interpretao organizada e estruturada do objeto, chamados de sistemas de organizao do
conhecimento.
De acordo com os tipos de estruturas oferecidas aos usurios, a representao do
conhecimento pode ser classificada, segundo Brachman (1979 apud CAMPOS, 2001), em
quatro nveis: lgico, epistemolgico, ontolgico e conceitual.
O nvel lgico o nvel da formalizao, no existe preocupao com a semntica em
termos dos conceitos e de suas relaes, o foco est direcionado para uma dada
sintaxe;
No nvel epistemolgico a noo genrica de um conceito dada nos fundamentos de
estruturao de conhecimento, ou seja, especifica-se a estrutura dos conceitos e seus
relacionamentos;
O nvel ontolgico tem o objetivo de limitar o nmero de possibilidades de
interpretao do conceito em um determinado contexto, usando-se de um formalismo
para representar o contedo do conceito. Portanto, trata-se do processo de organizao
e classificao de um dado domnio, trabalhando com definies de conceitos que nele
esto inseridos; e
No nvel conceitual, os conceitos possuem a priori uma interpretao definida.
26
Estes nveis nos permitem construir, analisar e representar os conceitos bem como
identificar suas relaes com outros conceitos. Na realidade, quando trabalhamos com a
organizao do conhecimento para a recuperao da informao, trabalhamos, antes de mais
nada, com a organizao de conceitos. Como definem Brscher e Caf (2008, p.8), a
organizao do conhecimento
o processo de modelagem do conhecimento que visa a construo de
representaes do conhecimento. Esse processo tem por base a anlise do
conceito e de suas caractersticas para o estabelecimento da posio que cada
conceito ocupa num determinado domnio, bem como das suas relaes com
os demais conceitos que compem esse sistema nocional.
27
identificam um documento (ttulo, autor, editor, ...) e a descrio de contedo que trabalha
com os conceitos contidos nos documentos e a representao desses conceitos de forma
sistemtica e semanticamente estruturada (resumo, indexao, classificao, ...). Brscher e
Caf descrevem que a organizao do conhecimento , tambm, um processo cognitivo
A representao construda no se restringe ao conhecimento expresso por um
autor, ela fruto de um processo de anlise de domnio e procura refletir uma
viso consensual sobre a realidade que se pretende representar [...] feita por
meio de diferentes tipos de sistemas de organizao do conhecimento (SOC)
que so sistemas conceituais que representam determinado domnio por meio
da sistematizao dos conceitos e das relaes semnticas que se estabelecem
entre eles (BRSCHER e CAF, 2008 p.6 e 8).
28
desempenho deste campo; a viso cognitiva para
bibliomtrica.
Assim, pode-se sintetizar que a organizao e a representao do conhecimento esto
sistematizadas em seu prprio nome, formados por dois conceitos fundamentais: a
organizao do conhecimento e a representao do conhecimento que tm como objeto de
estudo o conhecimento e suas atividades. Sendo que uma dessas atividades o
desenvolvimento dos sistemas de organizao do conhecimento.
Linguagem Documentria (LD) um conjunto de termos, providos ou no de regras sintticas, utilizado para
representar contedos de documentos tcnico-cientficos, com fins de classificao ou busca de informaes.
29
digital.
Segundo Lara (2004), para que a linguagem documentria d forma ao contedo,
propondo-se como um modo de organizao, e ao mesmo tempo, desempenhe o papel de
instrumento de comunicao, preciso reunir algumas qualidades: a) funcionar como cdigo
inteligvel e fonte para a interpretao do sentido e; b) caracterizar-se como metalinguagem e
incorporar o usurio como integrante do processo. Essas caractersticas dependem do rigor
metodolgico utilizado na sua construo, principalmente quanto normalizao semntica.
A autora acrescenta ainda, que para funcionar como metalinguagem e integrar o usurio
como participante do processo, a linguagem documentria deve utilizar referncias de
linguagem - e de significado - que sejam razoavelmente compartilhadas (LARA, 2004, p.
234). Justificando-se um aporte terico nas reas de lingustica e terminologia.
Para Hodge (2000) os SOC englobam todos os tipos de instrumentos usados para
organizar a informao e promover o gerenciamento do conhecimento, incluindo os esquemas
de classificao que organizam materiais em nvel geral e os cabealhos de assunto que
oferecem o acesso mais detalhado, os catlogos de autoridade, que controlam verses
variantes de informao fundamental (como nomes geogrficos ou nomes de pessoas) e
outros esquemas, como as redes semnticas, tesauros, taxonomias e as ontologias. Hodge,
esclarece que os SOC so mecanismos para organizar a informao e constituem o corao
dos Sistemas de Recuperao da Informao (SRI) das bibliotecas, museus e arquivos, no
ambiente fsico, e, principalmente, no ambiente web.
Hjrland (2007) refere-se aos sistemas de organizao do conhecimento como
ferramentas que apresentam a interpretao organizada de estruturas do conhecimento,
tambm chamadas de ferramentas semnticas. Os SOC so estruturas sistemticas que visam
construo de modelos abstratos do mundo real, representando os conceitos de um domnio.
Essas ferramentas semnticas so utilizadas para o tratamento da informao viabilizando a
recuperao da informao, tanto no ambiente informatizado como no tradicional.
A LD deve integrar trs elementos: a) lxico identificado com uma lista de elementos descritores,
devidamente filtrados e depurados; b) rede paradigmtica para traduzir certas relaes essenciais e,
geralmente estveis, entre descritores; e c) rede sintagmtica destinada a expressar as relaes contingentes
entre os descritores, relaes essas que s so vlidas no contexto particular onde aparecem (GARDIN, 1968
apud CINTRA, 2002, p. 25)
30
Nas bibliotecas tradicionais, os esquemas de classificao como: CDD (Classificao
Decimal de Dewey); CDU (Classificao Decimal Universal), LCC (Library of Congress
Classification Classificao da Biblioteca do Congresso Norte Americano), entre outros,
tm a funo de organizar e localizar, nas estantes, um nico item de uma coleo. Assim
como nas bibliotecas tradicionais, as bibliotecas digitais usam um ou mais SOC para
promover uma viso geral do contedo da coleo e a sua recuperao, podendo, tambm, ser
usado para compartilhar informaes entre diferentes sistemas.
Entre as dcadas de 50 e 60 do sculo XX, os tesauros e cabealhos de assunto foram
desenvolvidos a fim de dar suporte aos servios de indexao. Os servios de indexao e
resumos eram tidos como processos usados somente por bibliotecas e editoras. Hoje, a
relevncia e utilidade desses servios tm sido amplamente reconhecidas, pois encontramos
aplicao em todos os tipos de recursos de informao em formato digital (LANCASTER,
2004 p. vii).
Por muitos anos, os SOC relacionaram-se com os servios de indexao usados
somente por catalogadores e indexadores, bibliotecrios e pesquisadores profissionais. Com o
crescimento
de
dados
eletrnicos,
exploso4
de
publicaes
eletrnicas
e,
31
da anlise de domnio, nos deparamos com as diferentes vises, abordagens ou paradigmas.
Cada uma dessas vises opera com diferentes teorias, conceitos e relacionamentos e a
organizao do conhecimento deve lidar com essas diferenas. Embora alguns SOC sejam
mais flexveis e de fcil adaptao, sempre vai existir algum tipo de viso parcial ou
tendenciosa. Esta viso parcial na estrutura dos SOC natural, pois reflete os interesses e as
consideraes de uma coleo, dos usurios e de suas prioridades. Para a construo dos
SOC, os profissionais, devem ser capazes de perceber essas tendncias o que possvel
quando o profissional j tem um conhecimento sobre o domnio. Essa perspectiva usada em
colaborao entre os especialistas em organizao do conhecimento e os especialistas da rea
de domnio a ser representado.
Com relao construo desses sistemas, Zeng (2009) afirma que o processo de
seleo de termos e os testes sob os princpios da garantia, so muito importantes no
desenvolvimento de qualquer SOC. Esse aspecto encontra-se contemplado inclusive na norma
ANSI/NISO Z39-19-2005, que identifica trs garantias: a garantia literria, a linguagem
usada para descrever o contedo de objetos, as palavras ou frases escolhidas devem se
aproximar ao mximo das usadas na literatura da rea de domnio; a garantia de usurio, a
linguagem de usurios geralmente identificada pelos termos usados em sistemas de buscas e a
garantia organizacional, as necessidades e prioridades da organizao identificando termos
que devem ser usados em vocabulrios controlados. (ANZI/NISO Z39.19-2005, p.16).
No existe um esquema de classificao do conhecimento sobre o qual todos
concordem. Um SOC pode ser significativo e vantajoso para uma cultura, uma coleo ou um
domnio e para outros pode no ser. Apesar da multiplicidade de maneiras para organizar o
conhecimento, Hodge (2000) aponta algumas caractersticas comuns dos SOC usadas em
organizao de bibliotecas digitais:
32
algo sobre determinado objeto, o SOC deve ser capaz de conectar o conceito do objeto
com sua respectiva representao no sistema.
Os SOC tradicionais, como as classificaes e tesauros, tm sido utilizados tambm
para organizar recursos digitais na Internet. Com a web semntica, as ferramentas para
desenvolvimento de SOC esto se popularizando, devido necessidade de compartilhamento
com uso de padres orientados ontologicamente.
33
informao.
A padronizao um dos primeiros objetivos numa estrutura tecnolgica da web,
seguido de uma linguagem representacional usando codificao XML e XML/RDF (SLAVIC,
2005). A padronizao desenvolvida em domnios especficos que tratam da informao, tais
como: biblioteconomia, bibliotecas digitais, tradues de dicionrios, glossrios, tesauros,
entre outros, esto sendo analisados, validados, testados e transportados para a linguagem
XML.
Isso nos permite refletir que o desenvolvimento da web semntica depende da
infraestrutura de metadados que possam ser entendidos e processveis por mquinas que
veiculam linguagens de indexao. Estas linguagens usadas na descrio dos metadados
devem ser formatadas e codificadas de forma padro, para que se torne fcil de ser processada
e compartilhada por mquinas.
34
descrio sobre o que trata esse documento e onde encontr-lo. Em alguns aspectos, o XML
assemelha-se ao HTML - HyperText Markup Language, ambas so linguagens derivadas do
SGML - Standard Generalized Markup Language. O XML est desempenhando um papel
importante e crescente de uma grande variedade de dados na web, fornecendo uma sintaxe
bsica para estruturar documentos, sem impor nenhuma restrio semntica a eles.
A RDF - Resource Description Framework uma linguagem, desenvolvida pelo
W3C, para representar informao na web. RDF uma estrutura para processar metadados e
seu principal objetivo facilitar o intercmbio de informaes, que podem ser entendidas por
mquinas, entre os aplicativos via web. Basicamente, RDF define um modelo de dados para
descrever estes dados semanticamente, de maneira que possam ser entendidos por
computadores.
Um dos objetivos da web semntica ter todos os SOC disponveis e acessveis na
web, de maneira que cada termo indexado seja identificado e tambm explicado por meio da
estrutura do sistema ao qual ele pertena.
Normalmente, quando as linguagens de indexao so formatadas para serem
processadas pelas mquinas elas so baseadas na anlise e transparncia de suas prprias
micro-ontologias que consistem de vocabulrios, sintaxe, semntica e regras de inferncia.
Existe uma tendncia de fazer este processo mais padronizado para explorar os SOC no
desenvolvimento da web semntica.
Com relao nova gerao do ambiente web, representada pela web semntica, os
SOC possuem um ponto comum, alm do ambiente digital, a necessidade de serem lidos e
compreendidos por mquinas, favorecendo a interoperabilidade entre os diferentes sistemas.
As ltimas duas subsees no foram destinadas a explorar a relao dos SOC com as novas
tecnologias, como a linguagem XML, o padro SKOS, os esquemas RDF e a linguagem
OWL, mas apontar que essa tendncia inevitvel para o desenvolvimento desses sistemas.
35
Lista de autoridades lista de termos usada para controlar a variedade de nomes para
entidades. Este tipo de SOC, geralmente, no inclui uma organizao nem uma
estrutura complexa. A apresentao pode ser alfabtica ou organizada por um esquema
de classificao superficial. Por exemplo: nomes de pases, indivduos ou instituies.
36
bibliomtricos que so tcnicas bibliomtricas usadas, por exemplo, para fazer a anlise de
citao ou mtodos de construo e manuteno semi-automtica de tesauros; mapas
conceituais permitem visualizar as relaes entre conceitos de forma a estabelecer um
diagrama e utilizar setas para conectar-se com os conceitos. As relaes entre conceitos so
37
articuladas com interligaes etiquetadas, por exemplo: parte de; um(a); etc.; hipertextos
mtodo de apresentao de textos em formato digital, ao qual agregam-se outras informaes
na forma de blocos de textos ou imagens que permite a acessibilidade de documentos de
hipertextos por meio da World Wide Web (www) e intranets; topic maps6 - um padro ISO
para descrever estruturas de conhecimento associadas com fontes de informao. Podem
representar a informao utilizando tpicos que representem conceitos (pessoas, pases,
arquivos, eventos, etc.), associaes entre conceitos e ocorrncias (relaes entre tpicos).
um modelo rico em semntica e bem estruturado para dar suporte na recuperao de
informao em geral, e folksonomias indexao colaborativa de contedo (stios, msicas,
filmes, textos, etc.) com palavras-chave ou etiquetas de livre escolha, permitem que
internautas usem palavras de vocabulrios prprios de cada comunidade, fazendo com que
outros usurios interessados no mesmo assunto encontrem o contedo mais facilmente.
Os SOC podem ser descritos de acordo com suas estruturas e principais funes. Zeng
(2009, p. 160) apresenta a viso geral de alguns tipos de SOC agrupados de acordo com a
complexidade de suas estruturas e principais funes, como mostra a Figura 1. O
entendimento da autora baseado no esquema originrio de Hodge (2000), sobre o tema, e
adotado pela Networked Knowledge Organization Systems Group (NKOS). A classe dos SOC
mostrada de acordo com os grupos, do mais simples ao mais complexo: lista de termos,
modelos como metadados, classificao e categorizao, e modelos relacionais. O ltimo
grupo no mutuamente exclusivo.
38
A Figura 1 mostra algumas das funes fundamentais dos diferentes tipos de SOC,
observando que algumas estruturas permitem aos sistemas cumprirem mltiplas funes que
podem evitar problemas causados pela falta de controle terminolgico quando se organiza
39
informaes.
A ambiguidade ocorre em linguagem natural quando uma palavra tem mais de um
significado, que sem controle apropriado desse termo, resulta na falta de preciso na
recuperao da informao. Existem diferentes maneiras de eliminar a ambiguidade, uma
delas adicionar um qualificador ao termo, muito usado em cabealho de assunto e tesauros.
para
estruturas
de
duas
dimenses
que
empregam
hierarquias
at
as
multidimensionais, como no caso das redes semnticas com estruturas e relacionamentos mais
complexos e completos.
40
2.3 Tesauro
41
uma forma de organizao das linguagens documentrias, sendo um conjunto de termos
controlados, estabelecidos por relaes hierrquicas e de vizinhana. Os autores supra citados
apontam que as vantagens do tesauro so sua especificidade, maleabilidade e capacidade de
descrever as informaes de forma completa (GUINCHAT; MENOU, 1994, p. 146).
Um dos aspectos que envolve a descrio, organizao e recuperao de informao
est relacionado com o desenvolvimento de uma linguagem padronizada e consensual. Deste
modo, o emprego dos tesauros como instrumentos que relacionam os termos ou descritores de
forma consistente apresenta uma estrutura sinttica simplificada e forma uma rede de
referncias cruzadas num relacionamento lgico e hierrquico dos descritores. Assim, Toutain
(2006, p. 22) define o termo tesauro como vocabulrio controlado, compreendido como
estruturas terminolgicas, que visa padronizar a linguagem, em servios de informao,
cobrindo um domnio especfico do conhecimento, traduzido de uma linguagem natural para
uma linguagem de mquina.
O tesauro geralmente temtico e atende uma rea especfica do conhecimento, mas
pode, tambm ser multidisciplinar. Segundo Gomes (1990, p. 16), os tesauros podem ser
classificados quanto a tipologia em: a) Monolngues e multilngues; b) Macrotesauros
(representam conceitos mais amplos) e Microtesauros (representam conceitos especficos) e;
c) Multidisciplinares e de Disciplina Especfica.
Quanto funo e estrutura, Robredo (2005, p. 147) considera tesauro como um
instrumento de controle terminolgico que utiliza as linguagens documentrias para a
traduo da linguagem natural dos documentos. Para o autor, o tesauro um vocabulrio
controlado em que os termos so relacionados semntica e genericamente, cobrindo um
campo especfico do conhecimento.
De acordo com o IBICT (1984, p. 1-2), as principais finalidades de um tesauro so: a)
controlar os termos usados na indexao mediante um instrumento que traduza a linguagem
natural dos autores, usurios e indexadores, para uma linguagem mais controlada; b)
uniformizar, mediante esta linguagem documentria, os procedimentos de indexao de
profissionais em uma instituio ou numa rede cooperativa; c) limitar o nmero de termos
42
necessrios explicitao dos conceitos expostos pelos autores de uma rea; d) auxiliar a
tarefa de recuperao da informao, fornecendo termos adequados para a estratgia de busca.
Os tesauros so estruturas consolidadas e padronizadas por normas internacionais,
como a ISO 2788 (1986), a ISO 5964 (1985) e a ANSI/NISO Z39.19-2003 que tratam da
construo, formatao e manuteno de tesauros monolngues e multilngues. Com base
nessas normas pode-se sintetizar a estrutura de tesauros em duas partes: base terica e base
tcnico-operacional.
Base terica a essncia e a fundamentao terica para a construo de tesauros, da qual
destacam-se quatro aspectos:
a) Conceito - valendo-se da Teoria do Conceito (Dahlberg, 1978), para a qual os
conceitos so unidades de conhecimento, identificadas por meio de enunciados verdadeiros de
determinado objeto e representadas na forma verbal. Interpretando o tringulo conceitual de
Dahlberg temos no pice o referente (objeto), as caractersticas (predicao verdadeira
sobre o referente) e a forma verbal (denominao do objeto) representado por um termo.
Cada elemento compe um vrtice do tringulo;
b) Termo - signo lingustico que representa um conceito num domnio do
conhecimento, a designao do conceito em forma de cdigo, frmula ou outro smbolo. Por
isso, na elaborao de tesauro o termo um elemento fundamental e precisa ser
cuidadosamente trabalhado. Os termos so apresentados por um descritor - termo
escolhido para representar um conceito que ser utilizado na indexao e na recuperao de
determinado assunto. No descritor o termo que, embora possa descrever os mesmos
conceitos que o descritor, no pode ser utilizado na indexao e na recuperao, evitando-se
assim, a proliferao de sinnimos e perda de informao;
c) Categorias - so propriedades gerais dos conceitos, utilizadas para agrup-los
segundo caractersticas comuns e;
d) Facetas - caractersticas sob a qual um grupo de conceito analisado e so vistos
como tendo algo em comum. a fragmentao de um assunto em diversas partes
43
constituintes.
Base tcnico-operacional consiste numa abordagem mais prtica de desenvolvimento de
tesauro. Divide-se em quatro etapas:
a) Planejamento - nessa etapa inicial ocorrem a delimitao da rea do conhecimento
a ser representada; a identificao de tesauros existentes e do pblico alvo; o levantamento
das fontes de pesquisa; a definio da metodologia e do tipo de sistema; as formas de
apresentao (ndice sistemtico ou ndice alfabtico); a especificao dos recursos humanos,
financeiros e materiais e como ser feita a manuteno do tesauro;
b) Coleta de termos - existem dois mtodos de coleta: o mtodo dedutivo, de cima
para baixo, ou seja, identificam-se primeiro as categorias conceituais que sero utilizadas para
agrupar os termos e o mtodo indutivo, de baixo para cima, em que primeiro so coletados os
termos e depois agrupados em categorias segundo suas caractersticas. Nessa etapa deve-se
observar a garantia literria, onde s se justifica a incluso de um termo se este ocorrer na
literatura da rea. Os termos so, geralmente, substantivos no singular, as siglas e abreviaes
devem seguir um padro estabelecido, podendo ocorrer casos isolados, de acordo com o
contexto do tesauro. Importante manter a consistncia na deciso. Outras formas que devem
ser tratadas: emprstimo lingustico, grias, nomes populares e a grafia;
c) Controle terminolgico - pela natureza lingustica dos termos no tesauro, deve-se
observar alguns fenmenos que ocorrem na linguagem natural como: sinonmia um mesmo
conceito representado por diferentes termos; homografia um mesmo termo representa
mais de um conceito e no h relao semntica entre eles e a polissemia um mesmo termo
representa mais de um conceito e existe relao semntica entre eles e;
d) Estabelecimento de relaes entre conceitos - o relacionamento entre os termos
de um tesauro acontece por meio de: relao de equivalncia termos em relao de
sinonmia ou quase sinonmia, identificados por meio de cdigos remissivos USE (Used) e
UP Usado Para (UF Used For); relao hierrquica rene conceitos que tm uma ou
mais caracterstica em comum, pode ser relao hierrquica de gnero-espcie que exprime
os graus de superordenao e representa o conceito mais abrangente, utiliza o cdigo - TG -
44
Termo Genrico (BT - Broader Term) e a subordinao com o cdigo - TE - Termo
Especfico (NT - Narrow Term) que representa o conceito mais especfico e herda as
caractersticas da classe superior com uma caracterstica a mais. As relaes hierrquicas
tambm podem ser relao hierrquica partitiva, formada entre o todo e suas partes,
representado por TGP - Termo Genrico Partitivo e suas partes por TEP - Termo Especfico
Partitivo. Outro tipo de relacionamento a relao associativa ou funcional, a qual ocorre
entre conceitos, em que pelo menos um deles envolve um processo ou operao. Essa relao
usada em todos os casos em que no se aplica a relao de equivalncia ou a hierrquica,
mas onde os termos esto relacionados semntica, conceitualmente ou por alguma associao
mental.
A contextualizao dos conceitos feita pelas Notas Explicativa NE (ou Nota de
Escopo), que indicam os pontos pelos quais o conceito foi hierarquizado, podendo ampliar ou
reduzir o campo conceitual, servindo de orientao para o indexador na melhor
correspondncia entre conceito e descritor.
e) Formas de divulgao e publicao - a divulgao pode ser feita de forma
impressa e/ou eletrnica, em CD-ROM ou disponibilizada em linha. Periodicamente,
necessrio atualizar a publicao independente da forma de divulgao.
A construo de tesauros uma tarefa difcil, que exige um esforo coletivo, pois as
linguagens construdas so nicas em cada domnio do conhecimento e, portanto, sofrem
constantes modificaes medida que as lnguas evoluem. Observa-se que das primeiras
iniciativas, como a de Mark Roget, at os dias atuais, os tesauros evoluram em sua definio,
construes tericas e metodolgicas, resultante de novos modelos cognitivos e da abordagem
centrada no usurio.
45
2.4 Taxonomia
pode
ser
considerado
como
um
esquema
de
navegao
ordenado
46
seu uso nas Webs Semnticas.
Embora as taxonomias tenham suas razes nos trabalhos de Aristteles, Linnaeus e
Darwin (CONWAY e SLIGAR, 2002; TERRA, 2005), o significado do termo taxonomia tem
sido amplamente usado para outras propostas, principalmente empresariais, visando a
organizao, armazenagem e recuperao de informao. O conceito de taxonomia sofreu
uma transformao nos tempos da informtica, chegando ao mbito da Cincia da Informao
e da Documentao, no que se refere aos sistemas de classificao. No domnio das
representaes do conhecimento, as taxonomias podem ser consideradas instrumentos que
organizam logicamente os contedos informacionais.
Em perodos mais recentes, as taxonomias vm sendo usadas para a criao de
metadados ou termos comuns para descrever um objeto, com foco na recuperao da
informao. Tambm so usadas na categorizao, como suporte de navegao e, ainda, como
esquemas que organizam contedos das pginas na web e lista de controle de dados usados para
suporte de minerao de dados.
47
para serem mais fceis de identificar, estudar e localizar. So compostas de duas partes
estruturas e aplicaes. As estruturas consistem em categorias e os relacionamentos e as
aplicaes so as ferramentas de navegao disponveis para ajudar os usurios a encontrarem
as informaes que desejam.
Uma taxonomia bem definida e bem construda racionaliza o processo de busca. Os
resultados das buscas so mais relevantes quando a categorizao construda por
especialistas e testada com preciso. Os processos de organizao, geralmente, requerem uma
sofisticada estrutura para se obter um melhor resultado. Documentos e assuntos diferentes
normalmente requerem diferentes estratgias de busca. A busca que recupera um determinado
contedo para uma pessoa pode no ter a mesma relevncia para outra. Para obter xito as
taxonomias, geralmente, tm como objetivos:
encontrar o consenso;
and Space Administration), por exemplo, os autores Dutra e Bush (2003) descrevem que o
objetivo fundamental foi a elaborao de uma metodologia consistente que pudesse manejar,
ou seja, tratar o contedo informacional eletrnico. Os documentos esto descritos com um
esquema de classificao padro que segue uma hierarquia pr-definida, o que permite ao
usurio descobrir e ver correlaes entre reas de assunto, bem como, tornar a recuperao da
informao mais precisa e relevante.
As taxonomias no so documentos estticos que ficam guardados em um lugar
seguro. Muito pelo contrrio, adaptam-se s influncias do contedo e conhecimento dos
trabalhadores que as utilizam, so, portanto, interativas (CONWAY; SLIGAR, 2002). Quanto
estrutura, devem ser objetivas e estratgicas. O ponto de partida a busca pela existncia de
taxonomias do mesmo domnio, a reutilizao de taxonomias resulta em economia de tempo e
48
esforos. Assim, outros documentos j existentes devem ser pesquisados tais como: lista de
palavras-chave ou de assunto; lista de autoridade e tesauros; dicionrios e glossrios
existentes na rea. Conway e Sligar (2002) afirmam que uma taxonomia bem formada no s
reflete a necessidade de seus usurios como o contedo que ela organiza.
Com relao terminologia, a estrutura da taxonomia pode ser simples ou complexa.
Simples se for uma lista em ordem alfabtica de termos autorizados, chamados tambm de
lista simples (flat list). Complexa quando estabelece relacionamentos hierrquico e
associativo entre os termos. Conway e Sligar (2002) recomendam que sejam consultados os
padres da ANSI e NISO para construo de tesauros, tamanha a semelhana em suas
estruturas.
As taxonomias permitem que se estabeleam padres de classificao e ordenao de
informaes por meio de herana. Para as mquinas torna-se fcil compreender corretamente
o relacionamento gnero/espcie entre as entidades atribuindo propriedades s classes gerais
e, ento, assumindo que as subclasses herdam estas propriedades (CAMPOS; CAMPOS;
CAMPOS, 2006 p. 59).
Ao contrrio do princpio dicotmico adotado por Aristteles, pode-se, atualmente,
construir taxonomias policotmicas, ou seja, um termo associado a tantas classes, e
subclasses quantas se fizerem necessrias, dentro de um domnio especializado. Com isso,
evidencia-se a grandeza do problema de mapeamento multidimensional de qualquer rea
especializada. (CAMPOS e GOMES, 2007).
Na descrio de Conway e Sligar (2002), existem trs tipos de taxonomias: taxonomia
descritiva, construda nos modelos de tesauros ou vocabulrios controlados. Aqui, observa-se
dois dos objetivos apontados por Svenonious (2000): encontrar e selecionar documentos.
Svenonious indica, ainda, que a construo de tesauros envolve considervel dificuldade.
Como por exemplo, o controle da homonmia e polissemia; taxonomia navegacional,
inerente neste conceito a ideia da relao gnero/espcie entre vrios documentos. Esta
relao deve ser exaustiva e mutuamente exclusiva; e taxonomia para gerenciamento de
dados, que contm um pequeno conjunto de termos controlados rigidamente e tem particular
significncia enumerativa. Segundo Campos e Gomes (2007), as taxonomias se caracterizam
49
por:
50
Nesta poca de sobrecarga informacional, para que seja possvel controlar, preciso
filtrar, categorizar e etiquetar
51
2.5 Ontologia
52
por computadores; conceitualizao diz respeito a um modelo abstrato de algum fenmeno
do mundo real. Borst acrescenta o termo compartilhado, no sentido de conhecimento
consensual. Vrias definies surgiram na literatura que enriquecem as citadas ou sugerem
outras.
natural que haja uma multiplicidade de acepes e de definies variadas que
refletem em diferentes tipos de ontologias, pois as ontologias, so objetos de estudo de
diferentes reas do conhecimento (Filosofia, Cincias Cognitivas, Cincia da Computao,
Lingustica, Cincia da Informao). O fato que no existe consenso entre autores, cada um
apresenta uma definio de ontologia mais adequada ao seu contexto de pesquisa e de
aplicao.
A palavra ontologia tem sido empregada para descrever artefatos com diferentes graus
de estrutura, variando de uma simples taxonomia ou um esquema de metadados at as teorias
da lgica formal. Almeida e Bax (2003), propondo dar uma viso geral sobre o estado-da-arte
no estudo de ontologias, apresentam diversos tipos, propostas para construo e aplicao de
ontologias (metodologias, ferramentas e linguagens). Segundo os autores, as ontologias
podem ser utilizadas em projetos de gesto do conhecimento, comrcio eletrnico,
processamento de linguagem natural e recuperao de informao na web.
As ontologias apresentam-se como modelo de relacionamento de entidades em um
domnio particular do conhecimento. O objetivo de sua construo suprir a necessidade de
um vocabulrio compartilhado pelo qual as informaes possam ser trocadas e tambm
reutilizadas pelos usurios de uma comunidade, sejam eles humanos ou agentes inteligentes.
A construo de ontologias vem crescendo rapidamente em diversas reas do conhecimento
usando diferentes mtodos, ferramentas e verses. Com isso, Corcho e colaboradores (2003)
apontam que, apesar de existirem diversas tcnicas e linguagens para a elaborao
de
ontologias, ainda faltam critrios comuns para a criao de bases tericas consistentes que
facilitem o seu desenvolvimento.
As diversas reas de aplicao foram apontadas por Guarino (1998), quando menciona
que no final da dcada de 1990 as ontologias j estavam sendo estudadas pela Inteligncia
Artificial, Lingustica Computacional e pelas reas de pesquisas em engenharia do
53
conhecimento, engenharia da lngua, informao modelar, integrao da informao,
integrao de empresa, medicina, mecnica projetada, padronizao do conhecimento e de
produto, sistema de informao geogrfica, sistema de informao legal e sistema de
informao biolgica. No contexto da web semntica, fundamental investigar padres de
intercmbio, controle de linguagem e modelos de representao por meio de metadados como
as ontologias, taxonomias e tesauros (CAMPOS et al, 2006).
Noy e McGuinness (2001) apresentam cinco motivos pelos quais o desenvolvimento
de ontologias torna-se algo importante e considervel: a) compartilhamento de conhecimento
comum em estruturas de informao entre outros povos ou para os agentes de software; b)
permite o reuso do conhecimento; c) realiza inferncias em um domnio de conhecimento; d)
separa o conhecimento de domnio do conhecimento operacional; e e) realiza a anlise do
conhecimento estruturado tendo como resultado respostas mais relevantes.
As ontologias promovem e facilitam a interoperabilidade entre sistemas de
informao. Por meio de um processo inteligente dos agentes (computadores), possvel
compartilhar e reutilizar o conhecimento entre os sistemas. As ontologias, fornecem, ainda,
um entendimento comum de um domnio entre pessoas de determinada comunidade, entre
computadores e pessoas e entre um ou mais computadores. Do ponto de vista de
representao do conhecimento, Feitosa (2006) afirma que
uma ontologia no deve ser concebida apenas como um vocabulrio informal,
ou mesmo como uma linguagem de termos estruturados como um tesauro,
por exemplo - , mas requer uma possibilidade de interpretao algortmica dos
seus significados e, por conseguinte, uma representao em uma linguagem
formal, cujo processamento dos significados pode ser realizado por mquinas.
Dito de outro modo: uma ontologia requer a explicitao lgico-formal de
significados e palavras, que devem ser expressos por meio de construtos
matemticos (FEITOSA, 2006, p. 73).
54
descrevem as
instncias;
d) Instncias so usadas para representar os elementos de uma ontologia, podem ser
as ocorrncias dos conceitos at sua individualizao. Uma instncia um conceito que
pertence a uma classe e possui determinadas propriedades;
e) Axiomas so expresses verdadeiras que usam linguagens de lgica para
descrever os construtos na ontologia;
f) Regras so geralmente usadas para inferir conhecimento na ontologia.
Durante os ltimos anos, as atenes tm se voltado para a metodologia de construo
de ontologias, as quais podem ser construdas a partir de um esboo ou reuso de outras
ontologias disponveis. Diferentes processos de construo de ontologias tendem a estar
associados com diferentes tipos de ontologias. Guarino (1998), numa ampla viso, apresenta
quatro tipos de ontologia, que so:
a) Ontologias de alto nvel ou genricas descrevem conceitos de forma bem geral,
tais como, espao, tempo, material, evento, etc., os quais so independentes de um problema
ou domnio particular;
b) Ontologias de domnio expressam conceituaes de domnios particulares,
descrevendo o vocabulrio relacionado a um domnio genrico, como Medicina;
c) Ontologias de tarefa expressam conceituaes sobre a soluo de problemas, no
7
Alm de atributos, encontramos tambm, na literatura sobre ontologias, os termos slots, propriedades, papis
ou caractersticas com a mesma significao.
55
dependem do domnio, descrevem o vocabulrio relacionado a uma atividade ou tarefa
genrica, como venda de produtos;
d) Ontologias de aplicao descrevem conceitos dependendo de um domnio e de
uma tarefa particular. Os conceitos, geralmente, correspondem aos papis desempenhados
pelas entidades do domnio quando realizam alguma atividade.
De acordo com Daconta, Obrst, Smith (2003, p. 181), as ontologias dizem respeito a
vocabulrios e seus significados, com semntica expressiva, explcita e bem-definida,
possivelmente interpretvel por mquina. As ontologias so o elemento da web semntica que
possibilita o nvel de representao semntico. Para isso, necessrio descrever e representar
modelos mentais sobre domnios especficos, de maneira utilizvel pelo computador, ou seja,
preciso que parte da interpretao semntica possa ser automatizada. As ontologias
permitem que isso seja feito, e, por meio delas os softwares usados na web semntica, como
agentes inteligentes e web services, so capazes de utilizar o conhecimento codificado para,
ao menos parcialmente, entender, isto , interpretar semanticamente, os documentos e objetos.
No raro, encontram-se na literatura autores que, ao dissertarem sobre tesauros,
ontologias, ou outros modelos de representao do conhecimento, se ancoram na Teoria do
Conceito e na Classificao Facetada de Ranganathan. Alvarenga (2001) um exemplo e
afirma que a superao de limitaes no que se refere anlise documentria, depende da
criao de linguagens que possam ser entendidas por homens e mquinas, s assim a
codificao de conceitos, grficos e som seria compreendida por ambos. No h dvida de
que as ontologias so ferramentas que vm colaborar para isso. Por conseguinte, existe cada
vez mais a necessidade de incentivar esforos intelectuais que favoream a construo e a
aplicao desses instrumentos. Alvarenga (2001) reflete a respeito das inovaes que, apesar
de surgirem na atualidade, podem ser vistas com olhos no passado,
mudam-se os meios, sofisticam-se os instrumentos e surgem nomes novos
para designar coisas velhas. Entretanto, a essncia das coisas permanece. Os
tempos digitais acenam para a concretizao de sonhos: da grande biblioteca
universal, do conhecimento sem fronteiras, da extenso infinita dos limites da
memria, do processamento eletrnico de dados complexos, coisas que
embora profetizadas, h anos, dcadas, sculos, somente agora encontram as
condies para se tornarem realidade (ALVARENGA, 2001 p. 20).
56
explcitos de maneira a possibilitar que as mquinas processem, automaticamente, as
informaes encontradas na web. Para isso, as ontologias so usadas com linguagens OWL,
XML e XML Scheme, RDF e RDF scheme, que so tecnologias capazes de pesquisar e/ou
captar informaes de diferentes comunidades. Isso, porque o mesmo termo pode ser usado
em diferentes contextos com diferentes significados (polissemia), e o mesmo significado pode
ser representado por diferentes termos em diferentes contextos.
57
58
000 Cincia da Computao, Informao e Trabalhos Gerais
100 Filosofia e Psicologia
200 Religio
300 Cincias Sociais
400 Lnguas
500 Cincias
600 Tecnologias
700 Artes. Recreao. Entretenimento. Esportes
800 Lngua. Lingustica. Literatura
900 Geografia. Biografia. Histria.
A notao decimal possibilitou a subdiviso de assuntos do geral at o mais especfico,
por meio de uma perspectiva hierrquica. Quanto mais longa for a notao, maior ser a
especificidade do assunto representado. O desenvolvimento ilimitado e os princpios de
diviso parecem provir da lgica, da tradio e da prtica.
A manuteno formal e a reviso da classificao responsabilidade do comit
editorial da CDD (Editorial Policy Committee EPC) localizado na Biblioteca do Congresso
dos Estados Unidos desde 1972, permitindo o monitoramento da incluso de novos tpicos e
consequentemente a manuteno da garantia literria8. A CDD atualizada a cada sete anos e
a sua verso impressa est agora na 22 edio. A On line Computer Library Center OCLC9,
tambm oferece servios, treinamentos e verses atualizadas da CDD. A classificao de
Dewey continua muito popular graas a sua facilidade e simplicidade de emprego.
Garantia literria (literary warrant) conceito introduzido por Wyndam Hume, que defendia que a
determinao de classes usadas na indexao deveria originar-se das classes existentes na literatura. O
princpio requer que as classes, nos sistemas de classificao bibliogrfica, sejam embasadas em assuntos da
literatura publicada, de preferncia que derive de uma viso filosfica do conhecimento.
http://www.oclc.org/dewey/
59
Library of Congress Classification (LCC), foi desenvolvida em 1901, a partir da CDD e da
Classificao Expansiva de Cutter10. Os assuntos esto distribudos em vinte uma classes
principais, representadas por letras maisculas, que vo de A a Z, seguidas de nmeros
arbicos nas subdivises. Ela pouco sistemtica e o seu esquema enumerativo resulta em
rigidez e falta de hospitalidade. Por ter sido elaborada especialmente para atender as
necessidades organizacionais da prpria Biblioteca do Congresso, no possui explicaes
sobre seu uso e suas atualizaes costumam ser lentas. De acordo com Piedade (1977, p. 119),
as alteraes passaram a depender de preocupaes mais gerais, sendo originrio do
conhecimento como apresentado nos livros da Biblioteca do Congresso, baseia-se, pois, na
garantia literria.
A manuteno e a administrao geral da classificao de responsabilidade da
Cataloging Services Division da Biblioteca do Congresso dos Estados Unidos. Em 2002,
surgiu a Classweb, verso online da LCC, que convive com a verso impressa
(http://www.loc.gov).
Foi idealizada pelos advogados belgas, Paul Otlet (1868-1944), respeitado na rea de
Cincia da Informao como pioneiro na recuperao da informao e aclamado como um
antecipador da teoria do hipertexto e seu colega Henri La Fontaine (1854-1943), ganhador do
Prmio Nobel da Paz em 1913 (ANJOS, 2008, p. 175). Otlet e La Fontaine conceberam a
idia de organizar um repertrio bibliogrfico universal, ou seja, uma bibliografia de todos os
trabalhos publicados em qualquer lugar do mundo, desde a inveno da imprensa. A idia
inicial de construir essa bibliografia partiu de experincias que Otlet e La Fontaine tinham
sobre a literatura em Cincias Sociais, mas para tanto, necessitavam de uma ferramenta
eficiente de recuperao de informao, no disponvel na poca.
10
O norte americano Charles Ammi Cutter (1837-1903), famoso pela classificao de autoria, desenvolveu
uma classificao bibliogrfica chamada de Expansive Classification, representava os assuntos por meio de
letras. O sistema consistia em sete sistemas classificatrios aplicados do mais simples ao mais complexo
conforme o crescimento do acervo bibliogrfico.
60
61
sistema, bem como a reviso do seu contedo e da sua extenso. Os resultados so
publicados, anualmente, no jornal Extensions and Corrections to the UDC.
12
62
Na tentativa de encontrar uma base terica para a escolha e sequncia de facetas,
Ranganathan relacionou o termo facetas a um conjunto de noes abstratas fundamentais
que denominou de categorias - PMEST Personality, Matter, Energy, Space e Time. A
classificao de dois pontos publicada em um volume contendo listas de isolados comuns,
classes principais e suas subdivises e um ndice.
De acordo com Anjos (2008, p. 203), a estrutura dessa classificao uma tabela de
reas principais que inclui as disciplinas tradicionais que podem ser divididas em facetas por
meio das categorias. A notao compreende 26 letras maisculas e 23 letras minsculas do
alfabeto latino, nmeros arbicos de 0 a 9, sinais grficos e as letras gregas delta, para
Misticismo, e sigma, para Cincias Sociais. O plano geral do esquema adota um formato
tripartite:
Cincias Naturais
Humanidades
Cincias Sociais
A. Cincias
. Cincias Sociais
B. Matemtica
N. Belas Artes
T. Educao
C. Fsica
O. Literatura
U. Geografia
D. Engenharia
P. Lingustica
V. Histria
E. Qumica
Q. Religio
W. Cincia Poltica
F. Tecnologia
R. Filosofia
X. Economia
G. Biologia
S. Psicologia
Y. Sociologia
H. Geologia
Z. Direito
I. Botnica
J. Agricultura
K. Zoologia
L. Medicina
M. Artes teis ou aplicadas
As subdivises das classes principais so formuladas com notao alfanumrica, por
exemplo:
L Medicina
L2
Sistema digestivo
63
L2:4
L2:42
Henry Evelyn Bliss (1870-1955), bibliotecrio do College of the City of New York,
que dedicou 25 anos de sua vida aos estudos de classificao e ao desenvolvimento dos
esquemas de classificao bibliogrfica. O importante aspecto desse esquema sua erudio,
manifestada no meticuloso cuidado para que todos os agrupamentos fossem aceitos at
mesmo pelos usurios mais especializados e sua adaptabilidade manifestada num grande
nmero de alternativas sem risco de confuso (PHILLIPS, 1955, p. 164).
Bliss foi o primeiro a dizer que um esquema de classificao representava a
organizao do conhecimento por isso teve o respeito dos cientistas e especialistas no
ramo. No desenvolvimento da classificao bibliogrfica, Bliss estabeleceu sua base filosfica
e terica tendo os seguintes princpios bsicos:
a) consenso - implica que no existe unanimidade em relao localizao das
classes, que pode variar segundo o consenso cientfico-educacional e a concepo de cincia
nos vrios mbitos, supondo-se cada um em uma sistematizao prpria;
b) arranjo de assuntos correlatos - manter juntos os assuntos que tm um
relacionamento forte um com outro, ordenando todas as classes segundo um critrio de
proximidade temtica;
c) gradao em especificidade - listar assuntos do geral ao especfico em um dado
contexto, refere-se a uma espcie de progresso de dependncia, que cada nova disciplina
derive tanto quanto possvel da disciplina precedente; e relatividade das classes e a da
64
classificao;
d) localizao alternativa - pretende conferir flexibilidade ao sistema permitindo
colocar um tema em dois lugares;
e) brevidade da notao - a notao deve ser sinttica, expressiva e sistemtica.
A classificao de materiais bibliogrficos uma classificao de assuntos
bibliogrficos, que faz parte de uma estrutura de organizao do conhecimento e pensamento.
Uma organizao lgica do conhecimento aplicvel, com adaptaes, a sistemas de
classificao bibliogrficos.
Os sistemas gerais de classificao existentes, desenvolvidos de alguma maneira para
atender as necessidades de uma poca e de uma determinada cultura esto representados a
seguir de uma forma sinttica no Quadro 1.
Quadro 1.
Ano
Princpios Gerais
1876
Classificao Decimal de
Dewey - CDD
Hierrquica geral;
racionalismo baconiano rege a diviso;
notao decimal pura;
integridade dos nmeros;
diviso do conhecimento em 9 classes principais (campos do
saber - disciplinas bsicas) e 1 classe generalidades;
subdiviso das classes principais em matrias;
nfase na prtica.
1902
19051907
Classificao Decimal
Universal - CDU
1933
Classificao dos Dois Pontos Esquema facetado segue uma ordem lgica consistente de
de Ranganathan
cinco facetas ou categorias: Personality, Matter, Energy,
Space, Time (PMEST), que a base para a construo de
Hierrquica universal;
notao no rigorosamente decimal, mas mista, praticada em
funo da necessidade;
integridade dos nmeros;
diviso do conhecimento em classes principais (9 campos do
saber - disciplinas bsicas - e 1 classe reservada para
generalidades;
subdivises mais avanadas das classes principais que as da
CDD, permitindo uma anlise mais detalhada dos assuntos;
importncia da sintaxe - uso de procedimentos sintticos que
multiplicam as possibilidades de combinaes.
65
todo o esquema;
sintaxe rigorosa composta de frmulas de classificao dos
temas utilizando: a classe principal da matria ou disciplina, a
sequncia PMEST e, as vezes, os ciclos e os nveis;
notao liberada do esquema decimal, a CC utiliza as
possibilidades dos smbolos alfanumricos e smbolos de
conexo para indicar os conceitos de cada faceta.
1935
66
Dividir em grupos ou
classe, segundo as
diferenas e
semelhanas.
Instrumentos para
represe ntao do
conhecimento
Organiza e
recupe ra
a
informao
Classificao
Arbitrria
Sistemtica
Cdigos de
representao
ndice alfabtico
Figura 2.
Ge rais,
Especializadas,
Facetada ...
Classificao
67
A classificao , provavelmente, o mtodo mais simples de descobrir ordem na
mltipla e confusa diversidade da natureza. usada como instrumento de representao do
conhecimento com a finalidade de organizar e recuperar informaes. Phillips (1955) nos
conta que Jevons avaliou a relao entre cincia e classificao nas seguintes palavras:
Cincia ... a deteno de identidade, a classificao colocada junto, em
pensamento ou em real proximidade de espao, entre os objetos, os quais as
identidades tenham sido detectadas. Segundo o valor da classificao, coextensivo com o valor da cincia em argumentao geral. Toda vez que
formamos uma classe, ns reduzimos a multiplicidade em unidade, e
detectamos, como Plato disse, um entre muitos (Jevons apud Phillips, 1955,
p. 9, traduo e grifo nosso).
A classificao uma processo mental que est incorporado ao nosso cotidiano, desde
quando temos conscincia e armazenamos algum conhecimento. Enquanto fenmeno social,
as pessoas classificam intuitivamente as coisas, o tempo todo. Com isso, a proposta inicial da
classificao facilitar as operaes da mente quando se percebe e guarda na memria as
caractersticas dos objetos em questo.
Assim, Langridge (2006, p.11) apresenta que o fato de que a maioria das pessoas no
percebe o quanto classifica meramente um indcio da natureza fundamental do processo de
classificao. E no campo das relaes informais do dia a dia que esto as bases para os
outros sistemas de classificao mais formais e complexos.
A classificao feita a partir dos conhecimentos e das experincias do classificador.
De acordo com Piedade (1977, p. 9) classificar [...] dispor os conceitos, segundo suas
semelhanas e diferenas, em certo nmero de grupos metodicamente distribudos. Ento, o
ponto de partida do ato de classificar identificar as semelhanas e diferenas do objeto
observado. Lara (2001) apresenta uma situao que demonstra a importncia das
caractersticas e propriedades no seguinte exemplo
Quando Marco Polo se defronta, em Java, com animais nunca vistos (hoje,
rinocerontes), realiza um esforo para identific-los (e nome-los) consultando
seu estoque de conhecimentos anterior: lanando mo de caractersticas de
animais que j conhece e a partir das descries disponveis em sua cultura,
tenta estabelecer relaes e, por aproximao, classifica o novo a partir de
referncias existentes. Se de imediato identifica-os aos unicrnios - seu corpo,
68
as quatro patas, um chifre acima do nariz, etc., - rapidamente verifica que a
classificao feita no inteiramente prpria, uma vez que, nessa comparao,
constata a existncia de diferenas relativamente ao modelo anterior. (LARA,
2001).
13
ser sistemtica;
Heurstica, palavra derivada do grego e que significa encontrar, designa uma vertente da Histria que estuda
os documentos, de forma a apurar a verdade neles contida. De igual forma, esta cincia pretende criar uma
metodologia eficaz para o prosseguimento da investigao e da descoberta cientficas. Desta forma, socorrese de todo e qualquer meio e instrumento de trabalho para conseguir o mximo de informao sobre o tema
em questo, partindo do suporte fsico at chegar considerao de elementos como a crtica psicolgica, no
descuidando de pequenos e insignificantes detalhes no processo. Referncia: heurstica. In Infopdia [Em
linha].
Porto:
Porto
Editora,
2003-2009.
[Consulta
2009-03-13].
Disponvel
em:
<URL:http://www.infopedia.pt/$heuristica>.
69
ser minuciosa;
ser lgica;
ser explcita;
ter uma classe para obras gerais, e precisa poder classificar qualquer assunto em uma
classe, diviso ou subdiviso, de um modo geral;
ter um ndice alfabtico para facilitar o seu uso e ser documentada de tal forma que
permita a ideia do campo que o sistema abrange.
O ponto de referncia desta seo o artigo de Barbara H. Kwasnik The Role of
14
70
contribuio da lgica aristotlica diz respeito diviso dicotmica dos objetos em gnero e
espcie (figura 3). Trata-se de uma hierarquia conceitual que divide um tema em espcies a
partir da aplicao de uma caracterstica classificatria que serve para reunir os grupos
segundo as suas semelhanas.
71
hierarquias so as estruturas preferidas para representao do conhecimento. Kwasnik (1999)
sugere alguns requisitos para uma estrutura hierrquica adequada, acrescidos de opinies de
autores citados na literatura:
a) Inclusividade - a hierarquia superior a classe mais inclusiva e descreve o domnio
da classificao. Inclui as subclasses e sub-subclasses. Em Os princpios fundamentais da
classificao, Bliss (1985, p. 78) descreve a inclusividade e totalidade de classes como uma
classe formada de todas as coisas que so consideradas como semelhantes, que correspondem
ao conceito da classe, que so definidas pela classe e denominada por seu termo ou termos;
b) Gnero / espcie - uma hierarquia verdadeira possui somente um tipo de
relacionamento entre suas superclasses e subclasses que o relacionamento gnero / espcie,
tambm chamado de um tipo de;
c) Herana - tudo que verdadeiro para entidades em uma dada classe tambm
verdadeiro para suas subclasses e sub-subclasses, ou seja, os atributos so herdados;
d) Transitividade - como os atributos so herdados, todas as sub-subclasses so
membros, no s de sua superclasse imediata, mas tambm das superclasses acima desta;
e) Regras sistemticas e predeterminadas para associao e distino - as regras
para agrupar entidades em uma classe so determinadas previamente, assim como as regras
para criar subclasses. Assim, todas as entidades em uma dada classe so como as outras em
alguma forma previsvel ou pr-determinada, e essas entidades diferem de outras entidades
em classes irms de alguma forma previsvel ou pr-determinada. Por exemplo, doena
conjuntiva e doena da crnea so associadas por serem tipos de doenas dos olhos, mas se
diferenciam por um critrio sistematicamente pr-determinado de distino no caso, parte
do olho afetada;
f) Mtua exclusividade - uma dada entidade pertence a somente uma classe. Dodebei
(2002, p. 83) interpreta que a diviso deve estar fundamentada no mesmo princpio e para
cada derivao conceitual deve-se usar apenas uma caracterstica do conceito;
g) Critrio necessrio e suficiente - em uma hierarquia, um membro de uma classe
72
determinado por regras de incluso conhecidas como critrio necessrio e suficiente. Para
pertencer a uma classe, uma entidade deve ter os atributos prescritos necessrios. Caso os
tenha, isso constitui garantia suficiente e a entidade deve pertencer classe;
h) Informao completa e compreensvel - uma classificao hierrquica
usualmente bem compreensvel j que todas as regras de agregao e distino devem ser
feitas a priori. Isso significa que, antes da estrutura ser estabelecida, o designer deve conhecer
bastante sobre a extenso das entidades, seus atributos, e o critrio em que se baseia para ditar
as similaridades e diferenas;
i) Herana e economia nas notaes: o formalismo da hierarquia permite
representaes econmicas dos mais complexos atributos. Cada atributo no precisa ser
repetido em cada nvel, pois herdado como parte do esquema. Muita informao pode ser
carregada numa estrutura hierrquica;
j) Inferncia - uma hierarquia permite raciocnio a partir de evidncias incompletas.
Por exemplo, se um paciente tem sintomas de conjuntivite, possvel saber que, como um
tipo de doena dos olhos, a conjuntivite compartilha propriedades com outras doenas dos
olhos. Isso particularmente til se o critrio compartilhado no bvio ou facilmente
observvel;
l) Definies reais - classificaes hierrquicas permitem definies reais, as quais
so consideradas por muitos, como sendo superiores a outros tipos de definies. Isso porque
elas fornecem uma forma de expresso como uma entidade , tal qual alguma coisa e como se
diferencia de algum modo importante. Por exemplo, a definio: um solteiro no um
homem casado; um solteiro um homem; ento ele compartilha todas as caractersticas dos
homens. Homens podem ser solteiros ou casados. Um solteiro um tipo de homem no
casado. O ponto forte desta definio baseia-se na habilidade de descrever sucintamente uma
complexidade de atributos de afinidades e um aspecto importante de distino. Uma definio
real frequentemente uma forma mais eficiente de descrever a natureza das entidades e os
limites de quando, por definio, essa entidade termina;
m) Viso de nvel elevado e perspectiva holstica - se os critrios, pelos quais a
estrutura classificatria construda so tericos no sentido em que revelam distines
73
fundamentais e significantes, ento o sistema de classificao como um todo fornece a
visualizao do fenmeno que est representando. Tal perspectiva, birdeye perspective15,
permite o reconhecimento de padres e anomalias gerais e de relacionamentos de interesse ou
problemticos. Uma viso holstica16, de nvel elevado, geralmente oferece o gatilho para
gerao de conhecimento, permitindo ao pesquisador ir alm das instncias individuais para
ver como esto posicionadas num contexto mais amplo.
Na viso de Kwasnick (1999), as hierarquias so consideradas boas uma vez que
possibilitam economia de notao, riqueza de descrio e incorporao de conhecimento
sobre os relacionamentos. Porm nem todos os domnios podem ser representados em uma
classificao hierrquica, com isso apresentam alguns problemas como: a) mltiplas
hierarquias: muitos fenmenos so entendidos por vrios atributos e relacionamentos,
dependendo do contexto e objetivos da representao; b) critrio mltiplo e diverso: se uma
hierarquia dividida em muitas perspectivas e regras dspares para agrupamento e
diferenciao, ela perde seu poder de ser uma representao clara; c) falta de conhecimento
completo e compreensvel: as hierarquias requerem, previamente, o conhecimento completo
do domnio; d) diferenas de escala: para se manterem os princpios de transitividade e
herana, todas as entidades da hierarquia devem estar no mesmo nvel conceitual de
granularidade. f) regras para incluso de classe so muito restritas: na hierarquia, as
entidades devem pertencer sem ambiguidade a uma classe.
Em resumo, hierarquias so excelentes representaes para o conhecimento de
domnios em que a natureza das entidades e a natureza do significado dos relacionamentos
conhecida. Hierarquias so teis para entidades que so bem definidas e possuem classes com
limites claros. Em geral, algumas teorias ou modelos so necessrios para guiar a
identificao de entidades, as regras de associao e distino e a ordem na qual estas regras
so requeridas.
15
16
Expresso inglesa para: uma viso geral - de acordo com Dictionary of English Idioms de Daphnem M.
Gulland e David G. Hinds-Howell, 1986.
No sentido de totalidade, o todo levando em considerao as partes e suas inter-relaes.
74
permitir que mais de uma categoria fosse utilizada por vez como caracterstica de
classificao. Ranganathan (1962) instituiu cinco categorias fundamentais, tambm
conhecidas pela sigla PMEST, originalmente do ingls:
75
determinao das facetas de um domnio do conhecimento, comeando pela diviso de um
assunto quebrando-o em diferentes facetas e mencionando todas as possveis entidades a que
pertencem na classificao do conhecimento. As classificaes so vistas como estveis,
provisrias e dinmicas, no entanto, o grande desafio construir classificaes que sejam
flexveis e que possam acomodar novos fenmenos com mais facilidade e rapidez .
Um conjunto de informaes pode ser organizado de vrias formas, seguindo
diferentes esquemas de organizao. As notcias de um jornal, por exemplo, podem ser
organizadas pelo seu assunto (poltica, economia, esportes, etc.), cronologicamente pela data
em que foram publicadas ou alfabeticamente pelo nome do reprter. A classificao desse
conjunto de informaes em diferentes esquemas chamado de classificao facetada ou
multidimensional (faceted classification). Cada esquema representa uma dimenso na
estrutura que organiza a informao. A web, por ser um ambiente virtual, permite facilmente
apresentar a mesma informao organizada de vrias formas. No mundo fsico, ao contrrio,
isso praticamente impossvel. As longas notaes criadas em esquemas multidimensionais
no so fceis de usar para fazer o arranjo de pacotes de informao fsica em prateleiras.
Entretanto, em catlogos elas so muito teis, uma vez que cada dimenso pode ser buscada
independentemente (TAYLOR, 1999).
Uma das vantagens da classificao facetada que ela oferece ao usurio diversas
maneiras de buscar a mesma informao, acomodando diferentes estratgias de busca e
modelos conceituais. Kwasnik (1999) aponta que para a criao de facetas deve-se observar
a) escolha das facetas: decidir, previamente, os critrio para descrever o domnio, os
quais determinam as categorias fundamentais das facetas, por exemplo: perodo, lugar,
processo, material e objeto e
b) anlise das entidades usando facetas: escolher a faceta apropriada para descrever
a entidade. O processo de anlise a viso do objeto de todos os ngulos, isto , olhar o
mesmo objeto sob perspectivas diferentes. Na anlise facetada, Kwasnik (1999) tambm
apresenta vantagens e limitaes.
Vantagens da anlise facetada:
76
a) no requer conhecimento completo do domnio - no preciso conhecer a
extenso total das entidades nem todos os seus relacionamentos. Isso particularmente til
em campos novos e emergentes, que ainda sofrem mudanas;
b) hospitalidade - podem acomodar novas entidades;
c) flexibilidade - abordagem Lego descreve cada objeto por um nmero
independente de atributos, os quais podem ser invocados com uma flexibilidade interminvel.
Essa flexibilidade pode ser usada para descobrir novas e interessantes associaes: abordagem
ps-coordenada e os atributos podem ser combinados na hora da recuperao. Em contraste
com a pr-coordenao, que usada na maioria das hierarquias, em que inclui a regra da
incluso de classes, a entidade est classificada e permanece fixa para sempre;
d) expressividade - a abordagem facetada mais expressiva, pois cada faceta livre
para incorporar o vocabulrio e a estrutura mais conveniente para representar o conhecimento
pela faceta;
e) podem acomodar uma variedade de estruturas tericas e modelos - possibilitam
a representao de uma variedade de perspectivas;
f) mltiplas perspectivas - permitem que as entidades sejam vistas de uma variedade
de perspectivas. possvel descrever um cachorro como um animal, como um bicho de
estimao, como comida, etc.
Limitaes da anlise facetada:
a) dificuldade de estabelecer facetas apropriadas - ponto forte da classificao
facetada est nas categorias fundamentais, que devem expressar atributos importantes das
entidades que esto sendo classificadas. Sem conhecimento do domnio e dos usurios
potenciais, isso torna-se mais difcil;
b) falta de relacionamento entre as facetas - a maioria das classificaes facetadas
no fazem um bom trabalho de conectar as vrias facetas de forma significante. Cada faceta
funciona como um reino separado, no conecta explicitamente as descries;
c) dificuldade de visualizao - os relacionamentos no ficam evidentes, em cada
faceta h uma lgica interna diferente. Como resultado, cada esquema de faceta pode ser visto
por uma ou duas dimenses de cada vez.
Os esquemas de facetas continuam florescendo, principalmente no ambiente digital,
77
pois permitem uma forma sistemtica de ver o mundo. A tecnologia da informao tem
promovido novas formas de visualizao multidimensional e o desenvolvimento de formas
assistidas por computador, bem como descoberta de novos padres que facilitam a
organizao e a recuperao da informao.
78
How we see the world is how we understand it. Things are seen in
relationship to other things and actions. Connections are made, naming
takes place and meaning is formulated. We all engage with the world
around us in diverse ways, both actively and passively.
The meanings and names given to things are not fixed, but instead fluid.
We classify and catalogue but over time these categories and attendant
meanings change, as does the importance they hold for us. The medieval
world view, or cosmology, bears little relationship to the way we
understand our place in the world today.17
Ns vemos o mundo como ns o entendemos. Coisas so vistas em relao a outras coisa e aes. Conexes
so feitas, denominaes ganham lugar e significados so formulados. Ns todos nos envolvemos com o
mundo ao nosso redor de diversas maneiras, tanto ativa quanto passivamente. Os significados e os nomes
dados para as coisas no so fixos, mas flexveis. Ns classificamos e catalogamos mas com o tempo essas
categorias os significados mudam, assim como a importncia que tm para ns. A viso do mundo medieval,
ou a cosmologia, tem pouco a ver com o jeito que entendemos nosso lugar no mundo hoje. (Abertura da
exposio Classified: Contemporary Art at Tate Britain, curadoras: Clarrie Wallis and Andrew Wilson, no
museu Tate Britain, Londres Inglaterra, julho 2009. traduo nossa)
79
Figura 4.
Tringulo conceitual
80
81
construo;
especficos para os quais a intenso verdadeira. Isto , a classe dos conceitos de tais objetos
dos quais se pode dizer que possuem aquelas caractersticas em comum que se encontram na
intenso do mesmo conceito. A extenso do conceito pode ser de dois tipos:
82
relacionamentos de fundamental importncia na comparao e na construo de sistemas de
conceitos, e tambm, na forma de organizao dos conceitos pertencentes a um campo de
estudo ou uma disciplina. Pode-se ter em mente que no campo da organizao e representao
do
conhecimento
torna-se
possvel
construir
melhores
definies
conceituais
e,
83
Quadro 2.
Conceito A
Conceito B
Identidade de Caractersticas
( X, X, X )
( X, X, X )
( X, X )
( X, X, O )
Interseo de Caractersticas
( X, O, Y )
( O, Z, W )
Disjuno de Caractersticas
( X, O, Y )
( Z, W, K )
Incluso de Caractersticas
84
A relao material / paradigmtica acontece entre conceitos que tm caractersticas
da mesma natureza no interior de uma categoria. Pode ser de trs tipos: hierrquica,
hierrquica partitiva e de oposio.
Relao Lateral
1 rvore
rvore
rvore Frutfera
rvore de nozes
1.1.1 Pereira
Pereira
Amendoeira
1.1.1 Pessegueiro
Macieira
Nogueira
A relao partitiva existe entre o todo e suas partes, sendo que as partes tambm
podem estar relacionadas entre si. As relaes partitivas podem ocorrer em:
sistema artificial, por exemplo: uma mquina (todo) e a partes da mquina (partes);
85
Figura 5.
Autor/Disciplina
Gnero/
Espcie
Partitiva
Lgica
Divisio
Partitio
Wster
Subordinao Lgica
Partitiva
Dahlberg
Abstrao-Especificao
Gnero-Espcie
Partio
Todo-Parte
Perreault
Tipo-Kind
Todo-Parte
Shreider, Bean
Hiponmia/Hiperonmia
Meronmia
Tversky, Pribbenow
Taxonomia
Partonmia
Smith, Mlopolous
Generalizao
Agregao
Biblioteconomia
Hierrquica
GeralEspecfico
Hierrquica
Geral PartitivoEspecfico Partitivo
um (isA)
Herana (pai-filho)
Cincia da Informao
Cincia da Computao
Fonte: Veltman (2004, p. 21) adaptada e traduzida por Lima (2008, p. 75)
86
87
Quadro 5.
Exemplos
Atributiva
entomologia / insetos
esttica / beleza
Processo ou operao /
Seu agente ou instrumento
iluminao / lmpadas
automao / computadores
Influncia
Matria-prima / produto
bauxita / alumnio
Coisa / aplicao
Ao / resultado da ao
tecelagem / tecido
crescimento econmico /
desenvolvimento econmico
Efeito / causa
Dependncia causal
Atividade / agente
tabagismo / fumo
Produto / propriedade
veneno / toxidade
Atividades complementares
compra / venda
Opostos
vida / morte
Ao / seu paciente
priso / criminoso
insetos / inseticidas
Atividade / produto
tecelagem / tecido
88
com referncias cruzadas entre elas. A polihierarquia permite que um mesmo termo especfico
possa estar subordinado a mais de um termo genrico, podendo ser representadas nos
diagramas em linha e diagramas em linha bidirecional, chamados de rvore de Busca.
Para Campos (2001, p. 89) as rvores de Busca so teis para representar
polihierarquias por possibilitarem um entendimento melhor do conceito, que muitas vezes,
somente por meio de um plano grfico o especialista pode evidenciar as relaes que no
esto claras. Por exemplo:
Reao
Reao de partcula
Fisso ativa
Atrao
Fisso
Atrao alfa
Fisso beta
Atrao
Figura 6.
Fonte: ISO-DIS-704. Princples and methods of terminology (1993, apud Campos, 2001, p.
89)
89
Esta seo tem como objetivo buscar subsdios tericos que fundamentam a reflexo
sobre linguagens e termos e apontar caractersticas expressivas para a elaborao dos SOC
que se destacam nas reas de Lingustica e Terminologia. Porm, o escopo deste trabalho no
permite nenhum tipo de estudo exaustivo, nem mesmo, ir alm da colaborao desses dois
campos do conhecimento para a construo e o desenvolvimento de sistemas de organizao
do conhecimento.
2.9.1 Lingustica
A imagem acstica , por sua excelncia, a representao natural da palavra enquanto fato de lngua virtual,
fora de toda realizao pela fala (Saussure, 1977 p. 80)
90
19
Significado lexical e significado de sentena hoje consenso entre linguistas no sentido de que no se pode
dar conta de um sem notar o outro (Lyon, 1987 p. 136)
91
existe uma relao de subordinao;
meronmia relao entre o todo e suas partes (A parte de B), meronmia o nome
de uma constituinte de, a substncia de ou um membro de alguma coisa, por exemplo:
corpo humano (todo); cabea, tronco, membros (partes).
Assim, os signos, tanto para linguagens documentrias como para os SOC, so
2.9.2 Terminologia
Para distinguir, optou-se pela grafia de Terminologia, com T maisculo, para a Terminologia tericometodolgica, e com t minsculo, a terminologia concreta ou produto.
92
documentrias e na elaborao dos SOC. A Terminologia como campo inter e transdisciplinar
trabalha com a descrio e ordenamento do conhecimento no nvel cognitivo, com a
transferncia do conhecimento em nvel comunicacional e com os elementos centrais,
conceitos, termos e reas de experincias no nvel de normas internacionais (ISO).
De fato, a transferncia de informao, requer um sistema de significao claro e
explcito, pois um sistema de comunicao no existe sem um repertrio de signos e sem um
corpo de regras que definam como se selecionam e se combinam esses signos para formar as
mensagens transmissveis. Como qualquer outra unidade significativa de um sistema
lingustico, os termos compe um sistema estruturado, e em determinado nvel se relacionam,
com as outras unidades do mesmo nvel e com as unidades dos demais nveis, participando
com a construo do discurso (CABR, 1993, p. 170). A terminologia de uma rea especfica,
como se sabe, constituda pelo conjunto de palavras especializadas de uma determinada
disciplina. Os termos, que so as unidades de base da terminologia, designam os conceitos
prprios de cada disciplina especializada (CABR, 1993, p. 169). Com isso, proporcionando
um maior entendimento entre pesquisadores e demais usurio dos sistemas de comunicao
nas cincias.
Um princpio fundamental da comunicao relaciona-se entre o entendimento da
mensagem e o receptor, ou seja, no ser possvel estabelecer comunicao sem a
compreenso mtua. A Cincia da Informao manifesta esta preocupao quando toma a
informao como objeto de estudo em seus aspectos de construo, comunicao e uso da
informao. Nos contextos tcnico-cientficos, a terminologia assume papel fundamental pelo
fato de trabalhar com as lnguas de especialidades, responsveis por garantir a comunicao
rpida e precisa entre os interlocutores (pesquisadores,
profissionais ou estudantes). A
informao deve ser objetiva em qualquer forma de representao, no seu uso para a
comunicao e tambm na adaptao de conhecimentos ou pensamentos.
Lara (2004, p. 234) diz que o dilogo com a Terminologia nasce quando um pblico
heterogneo acessa o sistema (um site, por exemplo) deve reconhecer ou ter condies de
conhecer o que est sendo veiculado, o que diz respeito eminentemente linguagem. Quando
os domnios do saber so reas especializadas, o papel da Terminologia bem claro,
93
fornecendo referencial concreto para a interpretao dos termos, assim como so definidos em
suas terminologias. Porm, mesmo quando o universo no especializado e a delimitao no
est bem definida, os princpios terminolgicos so essenciais para referir o processo de
organizao dos elementos que esto em questo.
A Terminologia visa o uso da unidade lexical termo, como elemento de um processo
de significao e representao de conceitos, seja de um campo especfico ou de um conjunto
de campos especializados. Como tal, visa a representao de um nico conceito para cada
denominao. Por exemplo: os dicionrios de lngua geral (produto da lexicografia), que para
cada entrada, ou seja, cada palavra, descreve inmeros significados, conforme os possveis
empregos da palavra. No entanto, os dicionrios especializados (produto da terminologia),
cada entrada ou termo, descreve apenas um conceito.
Os estudos mais recentes na organizao e representao do conhecimento,
recomendam a escolha de uma das teorias da Terminologia para a construo de SOC, de
acordo com o campo do conhecimento que ser trabalhado. Algumas teorias da Terminologia
merecem destaque como: a TGT, pioneira e responsvel pela base do trabalho terminolgico,
possui uma perspectiva prescritiva e normativa que visa rotular e padronizar definitivamente o
uso de termos e conceitos, sem considerar as inmeras variaes possveis em um contexto
comunicacional. A Teoria da Socioterminologia de Franois Gaudin, sob uma perspectiva
descritiva com nfase ao uso social da lngua, aceita a variao e a flexibilidade lexical e
conceitual, proporcionando uma aproximao entre mecanismos de informao e usurios. E
a Teoria Comunicativa da Terminologia (TCT) de Maria Teresa Cabr que se fundamenta em
aspectos comunicativos das lnguas naturais para melhor conduzir a comunicao entre
especialistas (SALES, 2008, p. 80)
De acordo com a forma, Cabr (1993, p. 178-181) apresenta uma classificao para as
unidades terminolgicas, que contribui para a construo dos SOC, e seguem alguns critrios:
94
a) quanto ao nmero de fonemas simples (cido) e complexas (acidificao);
b) quanto ao tipo de morfema derivados, formados pela agregao de afixos bases
lxicas (ulceroso; terminologia) e compostos, formado pela combinao de bases
lxicas, (toca-discos, microfilme);
c) quanto estrutura sinttica combinao de palavras que seguem uma estrutura
sinttica ou sintagmas terminolgicos, (guerra fria);
d) unidades terminolgicas de origem complexa siglas ou iniciais de palavras (CEB
Companhia Energtica de Braslia); acrnimos ou palavras formadas por segmentos
de outras que podem ser pronunciadas como palavras (Petrobrs Petrleo Brasileiro;
CICA Companhia Industrial de Conservas Alimentcias); abreviaturas ou formas
fixadas por consenso, que reproduzem o segmento inicial de uma palavra (etc. - et
cetera); e formas abreviadas, utilizao de uma parte da palavra, normalmente para
economizar o discurso, (auto automvel / moto motocicleta).
De acordo com a funo que desempenham no discurso, os termos podem se
classificar em: substantivos, adjetivos, verbos e advrbios21. E quanto a sua significao, os
termos podem se classificar segundo a classe de conceitos que denominam. Assim, podem
formar classes e subclasses em funo das caractersticas, de acordo com as relaes que
estabelecem entre si. Da interao entre os conceitos derivam os diferentes tipos de relaes,
processos e estados. Conforme essa idia pode-se estabelecer quatro grandes classes
conceituais expressas por uma classe funcional.
objeto ou entidade
- substantivo
adjetivo
Observa-se que em terminologia a funo dos termos a mesma que o lxico comum, porm as preposies,
conjunes, artigos e pronomes no tem carter terminolgico.
95
subclasses de conceitos: objetos (automveis, avies, etc.), processo (soldar, dissolver, etc.),
propriedade (visual, auditivo, etc.) e relao (equivalncia, hierrquica, etc.).
Por ltimo, quanto a procedncia lingustica, caso do emprstimo lingustico, palavras
estrangeiras que so encorporadas s regras da lngua que foi emprestada, como por exemplo:
mouse (componente de computador).
Assim como para a TGT, para a TCT, a Terminologia se ocupa de termos que
representam conceitos e esses se relacionam mutuamente dentro de um mesmo domnio do
conhecimento, so passveis de serem organizados em uma estrutura, formando um conjunto
sistematizado. As relaes entre conceitos podem ser de dois tipos: relaes hierrquicas que
podem ser relaes lgicas (gnero-espcie) ou relaes ontolgicas (todo-parte) e as relaes
associativas ou funcionais.
Nas relaes entre denominao e conceito, Cabr (1993, p. 213) enfatiza que se
analisarmos a relao entre a forma escrita e o contedo de um lexema (especializado ou no),
observa-se que a correspondncia entre ambas partes no unvoca, mas mltipla. Assim,
uma forma escrita pode ser portadora de vrios significados ou polissemia, um conceito pode
ser denominado por vrias formas escritas ou sinonmia, e quando dois ou mais termos tem a
mesma forma escrita, porm representam conceitos totalmente diferentes denominado
homonmia. Esses fenmenos acontecem, normalmente, na linguagem natural, sendo mais
restritos em um vocabulrio especializado.
Estabelecer as bases para a construo dos SOC no tarefa fcil. Do ponto de vista
da anlise de domnio encontra-se em cada campo do conhecimento diferentes vises,
abordagens, paradigmas ou qualquer outro tipo de denominao. Cada uma dessas vises
opera com diferentes teorias, conceitos e relaes semnticas, porm para a organizao do
conhecimento estas implicaes, as quais se deparam os diferentes domnios que devem ser
organizados, so frequentes. Os profissionais da organizao do conhecimento devem estar
habilitados a interpretar as tendncias na deciso de qual tipo de SOC utilizar quando se est
organizando determinado domnio. Esta deciso pode ser feita em colaborao entre
especialistas da rea a ser organizada e os prprios especialistas em organizao do
96
conhecimento.
Para tanto questes ligadas lingustica, terminologia e suas influncias para a
elaborao de linguagens documentrias e, consequentemente para a construo dos SOC,
vm sendo discutidas, estudadas e divulgadas por diversos profissionais da rea de
informao no Brasil, como: Anna Maria M. Cintra; J. Guimares, Lgia Caf; Maria da
Graa Krieger; Maria Luiza de A. Campos; Marilda Lopez G. de Lara; Marisa Brscher; U.
G. Baranow; M. F. G. M. Talamo, para citar alguns.
97
Captulo 3
PROCEDIMENTOS METODOLGICOS
99
3 Procedimentos Metodolgicos
Nessa pesquisa buscou-se atender ao objetivo geral de investigar a relao dos estudos
sobre sistemas de organizao do conhecimento com os princpios tericos abordados na
reviso de literatura e utilizados na construo desses sistemas, no contexto da Cincia da
Informao .
Para o processo de anlise, valeu-se de mtodos quantitativos e qualitativos. O perodo
definido entre 1998, ano em que foi sugerida a adoo da expresso sistema de organizao
do conhecimento (HODGES, 2000) e o ms de julho de 2009, perodo em que foi feita a
coleta dos dados para a realizao deste trabalho, num total de 11 anos.
Como caminho metodolgico para atender o objetivo especfico de buscar a
fundamentao terica em que os autores se apoiam para a construo de tesauros,
taxonomias e ontologias, o estudo teve incio com uma reviso bibliogrfica fundamentada
nos conhecimentos de Biblioteconomia, Documentao e Cincia da Informao. Essa reviso
abordou, mais precisamente as reas de organizao e representao da informao e do
conhecimento, por meio de pesquisa nas diversas fontes de informao. Procurou-se
identificar a fundamentao terica em que os principais autores sustentam suas ideias na
construo de sistemas de organizao do conhecimento, e, ainda, apoiar a fundamentao
terica que subsidia a anlise de contedo, ou seja, as caractersticas intrnsecas dos
documentos, o que caracteriza a pesquisa como qualitativa.
Num segundo momento, delineia-se como uma pesquisa quantitativa, relativa forma,
em que avaliam-se as caractersticas extrnsecas dos documentos, na qual so aplicadas
tcnicas da bibliometria para quantificar os dados. De acordo com a definio de MaciasChapula (1998, p. 134) citado por Nascimento e co-autores (2007, p.13) a bibliometria o
estudo dos aspectos quantitativos da produo, disseminao e uso da informao registrada,
podendo assim, caracterizar como um estudo bibliomtrico. Os aspectos quantitativos so o
ponto de partida e de apoio para a anlise dos dados enquanto que os aspectos qualitativos
fornecem uma melhor compreenso dos dados obtidos.
100
LISA Library and Information Science Abstracts; H. W. WILSON Library Literature and Information
Science Full Text; LISTA Library, Information Science & Technology Abstracts with Full Text; ISTA
Information Science & Technology Abstracts.
101
de Organizao do Conhecimento, no singular, plural e em lngua portuguesa para privilegiar
os documentos acadmicos produzidos no Brasil. Com o resultado no satisfatrio da busca,
decidiu-se associar expresso Sistema de Organizao do Conhecimento a expresso
Cincia da Informao. Apenas para obteno de dados complementares ou busca de textos
completos, no includos nas bases supra citadas, optou-se por consultar o google acadmico.
A delimitao das bases de dados, o perodo da busca, as estratgias de busca, a
seleo dos indicadores para a anlise bibliomtrica e de contedo e a determinao das
inconsistncias nos registros, constituram os elementos que estabeleceram os critrios para a
definio do escopo das amostras representativas.
O universo da pesquisa foi delimitado a partir do levantamento bibliogrfico e da prseleo, as amostras foram determinadas aps serem descartados os registros considerados
inconsistentes conforme foram descritos na seo 4.2.
Para a anlise dos dados, atendendo ao segundo e terceiro objetivos especficos, foram
observados dois conjuntos de dados: o primeiro relativo aos aspectos de forma ou extrnsecos
numa anlise bibliomtrica, caracterizando uma pesquisa quantitativa. O segundo relativo
aos aspectos de contedo ou intrnsecos, numa anlise de contedo, caracterizando uma
pesquisa qualitativa.
A bibliometria tem a finalidade de medir, por meio de anlises estatsticas a produo
de pesquisa cientfica e tecnolgica na forma de artigos, publicaes, citaes, patentes e
outros indicadores, possibilitando avaliar diversas atividades de pesquisas e auxiliando nas
tomadas de decises. Para alcanar os objetivos especficos esta pesquisa privilegiou os
indicadores: ano de publicao, autoria, ttulo do documento, publicao, idioma, pas de
publicao, palavra-chave e resumo. As anlises bibliomtricas e de contedo so realizadas a
partir de levantamento estatstico e frequncia.
102
103
desenvolvimento dos SOC;
Tratamento dos resultados obtidos e interpretaes os resultados foram tratados
com o intuito de viabilizar a etapa final da anlise de contedo, ou seja a interpretao
dos dados.
A unidade de registro escolhida para descrever o documento como um todo, em sua
forma e contedo, identificando a produo bibliogrfica para as anlises a referncia
bibliogrfica dos documentos. Para a anlise bibliomtrica foram considerados os dados
descritivos do documento como ano de publicao, autor, ttulo, publicao, palavras-chave,
idioma e pas de publicao. Para a anlise de contedo foram includos: o ano de publicao,
autor, ttulo, indicao de qual ou quais os tipos de SOC o documento trata, resumo do
contedo do documento e registro de elementos que possibilitaram identificar as categorias
abordadas nos documentos (mantendo a linguagem natural usada pelo autor para evitar
interpretaes) e; outras observaes do texto completo, como registro de informaes
relevantes, tais como: identificao de outras teorias e outros princpios utilizados na
construo dos SOC que no os abordadas na fundamentao terica.
104
acesso, por meio da Internet, no endereo eletrnico acima, em CD-ROM ou entrando em
contato com as instituies consorciadas CAPES. No caso desta pesquisa, o contato foi por
meio da Biblioteca Central da UnB.
ISTA Information Science & Technology Abstracts
http://www.lsuhsc.edu/no/library/ss&d/data/ista.html
uma base de dados de referncia na rea de Cincia da Informao. A abrangncia de
assuntos permite acesso ao passado, presente e o que est sendo desenvolvido nas reas de
Biblioteconomia, Cincia da Informao, Recuperao da Informao em linha, novas
tecnologias da informao e novas publicaes. A indexa documentos desde 1964 e
disponibiliza dados pela citao, resumo e links com o texto completo. A atualizao feita a
cada dois meses e as bases relacionadas com as Cincia de Biblioteca e a Cincia da
Computao.
LISTA Library, Information Science & Technology Abstracts with Full Text
http://web.ebscohost.com/ehost/search?vid=22&hid=5&sid=9fa1ef95-5d27-4989-a1a2688122a48637%40sessionmgr11
Indexa mais de 500 peridicos cientficos, alm de relatrios de pesquisas e livros, sendo 240
peridicos cientficos com texto completo. A abrangncia de assuntos inclui biblioteconomia,
classificao, catalogao, bibliometria, recuperao de informao em linha e gesto de
informao. A cobertura da base de dados remonta a meados dos anos 1960.
H. W. WILSON Library Literature and Information Science Full Text
http://www.hwwilson.com/databases/liblit.htm
Indexa 400 peridicos desde 198423, artigos completos de 155 jornais desde 1997. uma base
de dados criada por bibliotecrios para bibliotecrios cobrindo os assuntos de: automao,
cuidados e restaurao de livros, catalogao, procedimentos de emprstimos, classificao,
direitos autorais , educao para bibliotecrios, busca eletrnica, indexao, profissional da
informao, softwares para a Internet, associaes e conferncias em Bibliotecas, servios de
referncias, preservao de materiais e web sites.
23
105
Google Acadmico
http://scholar.google.com.br/intl/pt-BR/scholar/about.html
Base multidisciplinar de acesso livre na web. Indexa artigos revisados por especialistas, teses,
livros, resumos e artigos de editoras acadmicas, organizaes profissionais, bibliotecas de
pr-publicaes, universidades e outras entidades acadmicas. A classificao dos resultados
de pesquisa do Google se d segundo a relevncia e leva em conta o texto integral de cada
artigo, o autor, a publicao em que o artigo saiu e a frequncia com que foi citado em outras
publicaes acadmicas. No h dados sobre os nmeros de artigos ou documentos
indexados.
24
RCLIS Project (Research in Computing, Library and Information Science) e o DoIS (Documents in
Information Science), promividos pelo Ministrio da Cultura Espanhola e hospedados pela equipe da AEPIC nos
equipamentos da italiana CILEA (Consorzio Interuniversitario Lombardo per Elaborazione Automatica).
Captulo 4
ANLISE DOS DADOS
107
A coleta de dados nas bases LISA, ISTA, LISTA e H. W. Wilson foram feitas por
meio do portal da Biblioteca Central da UnB, valendo-se da expresso Knowledge
Organization System e Knowledge Organization Systems, delimitando o perodo entre
1998 e 2009 para todas as bases consultadas.
A pesquisa no repositrio de acesso livre e temtico de Cincia da Informao, E-LIS,
foi realizada por meio de acesso internet, valendo-se das mesmas palavras-chave. A busca
na base de dados BDTD ocorreu pelas expresses Sistema de Organizao do
Conhecimento e Cincia da Informao, juntas, separadas, singular e plural, por tratar-se
de uma base de dados multidisciplinar de trabalhos acadmicos que indexa teses e
dissertaes de diversas reas do conhecimento de vrias universidades do Brasil. No decorrer
desta primeira etapa da pesquisa, observou-se a ausncia de uma base de dados que indexe e
recupere os artigos de peridicos brasileiros na rea de Cincia da Informao. O nmero de
registros encontrados em cada base de dados e o universo da pesquisa pode ser verificado no
quadro abaixo:
Quadro 6.
N DE REGISTROS
LISA
30
ISTA
33
LISTA
49
WILSON
13
E-LIS
70
BDTD
--
TOTAL- UNIVERSO
195
Habilidade de recuperar informaes relevantes para um assunto especfico, quando uma solicitao sobre
esse assunto feita ao sistema. (LANCASTER, 1977) (GLOSSRIO GERAL DE CINCIA DA
INFORMAO, 2006).
108
system, no consta no tesauro das base LISA, LISTA nem na Wilson. Na base ISTA no foi
localizado tesauro, somente ndice e no consta a expresso. A base BDTD possui glossrio
que no consta a expresso sistema de organizao do conhecimento. O repositrio E-LIS
tem somente um campo de assunto na busca avanada com algumas sugestes de temas, que
no inclui a expresso de busca. Por outro lado, o repositrio E-LIS obteve o maior nmero
de documentos recuperados, pode-se atribuir o fato de ser um repositrio livre. Mas o
resultado mais surpreendente foi a busca vazia da base BDTD.
Pas
Michael
Frank
Goodchild
Estados
Unidos
Mara Jos
LpezHuertas
Prez
Espanha
4.2.2 Das bases de dados consultadas, foram identificados quatro artigos sem autoria, os
registros destacados no foram considerados para anlise.
109
Quadro 8.
Ano /
Base
Dados
2005
Online Information
ISTA, Review; 2005, Vol. 29
LISTA Issue 6, p604-620, 17p.
Ttulo do Artigo
Interfaces to knowledge
organization systems in
Canadian digital library
collections.
Palavras-chave
Internet searching;
Digital libraries ;
Libraries search engines
2005
Bulletin of the American SIG/CR Classification Research
ISTA, Society for Information Workshop.
LISTA Science & Technology;
Apr/May2005, Vol. 31
Issue 4, p5-5,
Informaion science;
Information technology
Seminars Associations; institutions,
etc.
Knowledge management
2008
Library Hi Tech News;
LISTA Jan/Feb2008, Vol. 25
Issue 1, p39-39
2007
Library Hi Tech News; Semantic Web Deployment
LISTA Jul2007, Vol. 24 Issue 6, Working Group Requests
p48-49,
Comments.
Information organization;
Semantic Web;
World Wide Web;
Semantic networks (Information
theory)
Access to information Teams in the
workplace.
4.2.3 Os relatos de eventos recuperados nas bases de dados onde constam a programao de
conferncias e temas apresentados nas sesses dos eventos, no foram considerados, por no
conter dados suficientes para anlise.
Quadro 9.
Relatos de conferncias
Ano / Base
Dados
Autor
Ttulo
2008
Nielsen,
LISA, ISTA, Marianne
LISTA,
Lykke
Wilson
2003
LISA,
LISTA,
Wilson
2005
ISTA,
LISTA,
Wilson
Tudhope,
Doug
Referncia
D-Lib Magazine, vol. 14,
no. 11-12, Nov-Dec 2008
D-Lib Magazine;
Nov2005, Vol. 11 Issue
11, p16-16,
110
4
2004
ISTA,
LISTA,
Wilson
Nielsen,
Marianne
Lykke
2006
ISTA,
LISTA,
Wilson
D-Lib Magazine;
Oct2006, Vol. 12 Issue
10, p12-12,
2000
LISTA
Hedberg, Jane
DLF report
2003
Wilson
Tudhope,
Douglas
4.2.4 Na base de dados Wilson, foram recuperados 13 registros, sendo que 11 j haviam sido
computados pelas bases de dados LISA, LISTA e/ou ISTA. Como possvel observar nos
registros nmeros 1, 2, 3, 4, 5 e 7 do Quadro 9 e os outros cinco registros apontados no
Quadro 10 abaixo. Dois trabalhos, listados a seguir, no contm dados suficientes para anlise
(resumo, palavras-chave e/ou texto completo). Portanto, nenhum dos 13 registros foi
computado.
Quadro 10.
Base
Dados
Ttulo
Referncia
LISA
ISTA
LISTA
Wilson
LISA
Interfaces to knowledge
111
Wilson
LISA
ISTA
LISTA
Wilson
LISA
Wilson
Information (Frankfurt am
Main, Germany) v. 59 no. 2
(March 2008) p. 100-7,
2008.
LISA
Wilson
International Cataloguing
and Bibliographic Control v.
38 no. 2 (April/June 2009) p.
25-9
4.2.5 Observou-se na base de dados E-LIS algumas ocorrncias irrelevantes para a pesquisa,
as quais so relatadas a seguir. Nenhum caso foi considerado.
4.2.5.1 Dez documentos no foram publicados e/ou so apresentaes de trabalhos (slides).
Estes itens foram considerados inconsistentes pela falta de divulgao na comunidade
cientfica e pela falta de dados suficientes para anlise, conforme destaca o Quadro 11.
Quadro 11.
Condio
no publicado
Ttulo
Referncia
no publicado De Robbio,
e apresentao Antonella and
Maass, Anne
La comunicazione scientifica: il
processo di pubblicazione e il
mercato.
112
19-21 September.
no publicado
Chisenga, Justin
In Standing Conference of
African National and University
Libraries of Eastern, Central and
Southern Africa, Dar es Salaam
(Tanzania), 9 10 July 2006.
no publicado
no publicado
Garusing
Arachchige, J. J.
An approach to marketing in
special and academic libraries of
Sri Lanka : a survey with
emphasis on services provided to
the clientele.
No consta
no publicado
Martnez Mndez,
Francisco Javier;
Garca Rivas,
Marta Isabel
In Congreso Internacional de
Comunicacin UPSA 2002
(2002 : Salamanca), Salamanca
(Spain), January 2002
113
resultados: Alemu, Getaneh Agegn. The Role of Open Access in Fostering Knowledge
Sharing and Collaboration in Ethiopia: a case study., 2009.
4.2.5.5 Dez artigos foram identificados em lnguas estrangeiras, diferentes do ingls, no
sendo possvel o reconhecimento completo de alguns campos, dificultando a anlise, como
mostra o Quadro 12, portanto foram eliminados do resultado.
Quadro 12.
Ano
Autor
Ttulo
Referncia
Palavra-chave
Idioma
2008 ,
and
,
In 17
,
(GR), 24-26
.
Grego
2007
In 16
,
(GR), 1-3 .
[Conference Paper]
Emotional Intelligence,
Academic Libraries,
Librarians, Users,
Management
Grego
., 2007
NKOS (networked
knowledge organization
system), semantic tools,
ontology, NKOS
Chins
Wspczesne
metody
zarzdzania a
struktury
organizacji pracy
w bibliotekach
akademickich.
In Biblioteki XXI
wieku. Czy
przetrwamy? II
Konferencja Biblioteki
Politechniki dzkiej,
d (Poland), 19-21
June 2006. [Conference
Paper]
total quality
management, strategic
management,
benchmarking,
organization structure,
work organization,
academic libraries
Polons
2006 Tomaszewski,
Roman and
Polarczyk,
Mariusz
learning organization,
intelligent organization,
management methods,
library
Polons
114
2006 Walter, AnneKathrin; Mayr,
Philipp;
Stempfhuber,
Maximilian;
Ballay, Arne
Crosskonkordanz
en als Mittel zur
Heterogenittsbeh
andlung in
Informationssyste
men
Infoteka
2005 Odaba,
Hseyin
Bilgi Ynetimi
Sistemi.
knowledge sharing,
Turco
knowledge management
2003 Milojevi,
Glasnik Narodne
Staa
biblioteke Srbije
Katalogizacija i
klasifikacija u
Sjedinjenim
Amerikim
Dravama
Glasnik Narodne
biblioteke Srbije, 2003,
n. 1, pp. 203214[Journal Article
(Print/Paginated)]
1998
In 7
,
(GR), 1998.
[Conference Paper]
Grego
,
.
.1998
4.2.5.6 Cinco trabalhos, listados a seguir, encontram-se com registros repetidos. Por
considerar essa repetio uma inconsistncia, apenas um registro foi considerado no cmputo.
1. , and ,
., 2008 . In 17
, (GR), 24-26 .
2. Aover Lopez, Julin Manuel Curricula. Sistema de informacin sobre la actividad
investigadora en un Hospital., 2007 , Hospital 12 de Octubre - Unidad de
Investigacion, Diciembre 2006.
3. Antoni, Sanja Upravljanje znanjem - pogled u nau budunost. Infoteka, 2005, vol. 6,
115
n. 1-2, pp. 77-82.
4. Civallero, Edgardo The sound library: sound documents and collections as means of
recovering and protecting endangerred languages (presentation), 2005 . In 71st IFLA
Council and General Conference, Oslo, Norway, 2005.
5. Raman Nair, R. Public library purpose. 49th FID Conference and Congress on
Towards the New Information Society of Tomorrow: Innovations, Challenges and
Impact, New Delhi (India), 11-17 October 1998. [Conference Paper]
4.2.6 A base BDTD foi descartada para o estudo por obter resultado zero ou busca vazia na
pesquisa.
O total de registros recuperados pelas bases de dados consultadas foi de 195. No
entanto, aps este levantamento inicial considerando apenas um dos registros iguais
recuperados em mais de uma base de dados e descartados os registros considerados
inconsistentes, delimitou-se a amostra representativa da pesquisa em 90 registros para a
anlise. Como mostra o Quadro 13.
Quadro 13.
Bases de Dados
LISA
ISTA
--
LISTA
10
WILSON
--
E-LIS
39
10
LISA, LISTA
LISA, WILSON
LISA,ISTA, LISTA,WILSON
ISTA, LISTA
12
ISTA, E-LIS
LISTA, WILSON
BDTD
--
TOTAL
90
116
A amostragem o mtodo selecionado para uma amostra, que parte da populao
que integrar a pesquisa. No caso desta investigao, a populao de 195 registros e a
amostra representativa para a anlise bibliomtrica de 90 registros. A partir dessa amostra
representativa foi selecionada a amostra representativa para a anlise de contedo com 39
registros. Trata-se de uma amostra no probabilstica, selecionada por julgamento utilizandose de critrios pr-estabelecidos.
Para os aspectos extrnsecos, foram levantados os seguintes itens para anlise: base de
dados, ano de publicao, autor, ttulo do documento, publicao, palavra-chave, condio do
registro (se foi publicado ou no, formato do registro (power point), idioma e pas de
publicao. Porm, no decorrer da pesquisa observou-se que nem todas as bases de dados
indexam o idioma do documento e o pas de publicao. Das bases consideradas para anlise
apenas a LISA indexa o idioma e o pas de publicao. As bases E-LIS e Wilson indexam,
somente, o idioma e as bases ISTA e LISTA no indexam idioma nem pas de publicao.
Pela falta de dados para analisar o conjunto, esses itens no foram analisados. Embora o
idioma para a indexao dos documentos nas bases de dados seja, predominantemente, o
ingls.
117
20
18
16
14
12
10
19
18
8
12
6
4
2
1999
2000
0
1998
2001
2002
3
2003
2004
2005
2006
2007
2008
2009
4.3.1.2 Publicao
118
nmero de produo e quanto maior o nmero de produo, menor o nmero de publicao.
Entre os peridicos analisados, destacaram-se como os mais produtivos e relevantes, segundo
o critrio de nmero total de produes, os apresentados no quadro a seguir.
Quadro 14.
N de produo
Knowledge Organization
ACIMED
Webology
Grfico 2.
3
14
36
Peridico
Evento
Acadmico
119
4.3.1.3 Autores
Autor
Princ.
Sec.
Publicao (*)
Knowledge Organization(2);
Journal of Digital Information;
Bulletin of ASIST;
International Cataloguing and Bibliographic Control(2);
IFLA Journal;
Gnoli, Claudio
--
Knowledge Organization;
ISKO;
BRAKOR
Tudhope, Douglas
Bulletin of ASIST;
New Review of Hypermedia & Multimedia;
ALISS Quarterly;
Weller, Katrin
Keizer, Johannes
--
Peter, Isabella
--
De Robbio, Antonella
--
Raman Nair, R.
--
Tennis, Joseph T.
--
Knowledge Organization;
120
Bulletin of ASIST
Nez Paula, Israel Adrin
--
ACIMED (2)
--
Journal of ASIST
IFLA Journal
Shiri, Ali
--
Mayr, Philipp
ACIMED;
Revista Cubana de los Profesionales de la Informacin y
de la Comunicacin en Salud
Lauser, Boris
--
121
Dublin Core Conference 2008 com Gudum Johannsen, Caterina van Hage Caracciolo e
Robert Willem.
Na categoria de autores observou-se, tambm, a produo dos autores com maior
nmero de produo e a relao com as bases de dados que foram indexados os artigos,
conforme mostra o Quadro 16.
Quadro 16.
ISTA,LISTA (3)
E-LIS (2)
E-LIS (2)
E-LIS (2)
E-LIS (2)
E-LIS (2)
LISA, E-LIS
LISTA (2)
122
4.3.1.4 Palavra-chave
Incidncia de palavras-chave
Quadro Resumo de Incidncia de Palavras-chave
Palavras-chave
% do total
Knowledge organization
24
5,94
Thesauri
13
3,22
KOS
12
2,97
Knowledge management
11
2,72
Information retrieval
11
2,72
Digital libraries
2.23
Classification
1,98
Semantic web
1,48
Information science
1,48
Ontologies
1,48
Metadata
1,48
Information systems
1,24
Information management
1,24
Information services
1,24
Information organization
1,24
Semantic relation
1,24
Interoperability
0,99
Cataloguing
0,99
0,99
SKOS core
0,99
123
Classification schemes
0,99
0,74
0,74
Taxonomies
0,74
Institutional repositories
0,74
Information
0,74
Semantic
0,74
175
43,31
62
15,34
1 incidncia
167
41,35
Total
404
100,00
N ocorrncia
Knowledge organization
24
KOS
12
Knowledge management
11
SKOS
Knowledge representation
Knowledge society
Knowledge networking
Knowledge sharing
Knowledge unity
Knowledge workers
Abstraction knowledge
124
Quadro 19.
N ocorrncia
Information retrieval
11
Information science
Information management
Information organization
Information services
Information systems
information
Access to information
Information technology
Information visualization
Quadro 20.
N ocorrncia
Semantic web
Semantic relation
Semantic
Semantic heterogeneity
Semantic markup
Semantic networks
125
a outros termos aparece como palavra-chave desde 1998, mas somente em 1999 a expresso
knowledge organization system aparece como palavra-chave. interessante observar que,
no ano de 1999, tambm aparece a expresso knowledge management nas palavras-chave e
a expresso knowledge organization aparece somente a partir de 2003. As expresses
information retrieval e digital libraries apareceram pela primeira vez como palavraschave em 1998 e 2002 respectivamente. O primeiro artigo que apresenta o termo semantic
como palavra-chave data de 2001, sendo que a expresso web semantic aparece apenas em
2005 e em 2006 observa-se a expresso semantic relation como palavras-chave.
No quadro 21 so apresentadas algumas palavras-chave agrupadas em relao a alguns
usos de SOC que so mencionadas, com frequncia, na literatura.
Quadro 21.
Numero
organization
34
8,41
library / libraries
22
5,44
classification
18
4,45
retrieval
18
4,45
search
12
2,97
communication
1,48
terms / terminology
1,48
indexing
1,23
interoperability
0,99
126
Este tpico, rene a anlise e interpretao de dados encontrados nos contedos dos
documentos examinados da amostra representativa para esta anlise. Foram desenvolvidos em
trs etapas: a) pr-anlise, b) especulao e anlise do material e c) tratamento dos resultados
obtidos e interpretaes, conforme mencionados na metodologia.
Na pr-anlise foram selecionados, dos 90 registros recuperados que formam a
amostra representativa, os trabalhos que mencionam em seus contedos, algum tipo de
relao com a base terica apresentada na reviso de literatura. Esta seleo foi feita por meio
de leituras dos campos: ttulo, palavra-chave e resumo. Com base nesse critrio foram
identificados 43 documentos para a anlise temtica e selecionados para a leitura na ntegra.
Porm, algumas inconsistncias na amostra para a anlise de contedo foram
apontadas. Dois artigos no foram localizados na ntegra, ainda que, usando diversos recursos
de busca da internet, nas bases de dados da CAPES e usando o servio de COMUT da
Biblioteca Central da UnB. Um artigo do peridico Knowledge Organization, com o
seguinte ttulo: Knowledge Organization in Italy de Claudio Gnoli e o artigo New
development of library automatization system integrated with knowledge oganization
systems de Haiyan Bai, Tiejun Hu, Fang Liang e Yonglong Zuo, do peridico Journal of
the China Society for Scientific and Technical Information.
Observou-se, ainda nessa fase, dois artigos completos no idioma alemo, no sendo
possvel a leitura na ntegra, pelo desconhecimento desse idioma pela autora da pesquisa. O
Faceted knowledge organization systems and dynamic classification as tools for the
research of the Desk Web, de Silke Heesemann e Hans-Dieter Nellissen e Mapping
Knowledge Organization Systems, de Philipp Mayr e Anne-Kathrin Walter. Portanto, esses
quatro trabalhos no fizeram parte do cmputo da anlise de contedo. A amostra
representativa para a anlise temtica somou o total de 39 documentos.
A partir da determinao da amostra significativa para a anlise de contedo, inicia-se
127
a fase de especulao e anlise do material, com a leitura na ntegra dos documentos
relevantes. Os diferentes tipos de sistemas de organizao do conhecimento foram
classificados de acordo com o nmero de vezes que foram abordados nos documentos com
relao ao desenvolvimento de tesauro e/ou taxonomia e/ou ontologia e/ou sistemas de
classificao e/ou outro tipo de SOC26 e as categorias pr-estabelecidas: princpios da
classificao; conceitos e relaes entre conceitos; lingustica e terminologia.
Primeiramente, o Grfico 3 mostra o resultado por ano de publicao dos documentos
que fazem parte da anlise de contedo, podendo-se comparar com o resultado da produo
por ano do total de registros, no Grfico 1.
Grfico 3.
9
8
7
6
5
4
6
3
4
2
1
1999
2000
0
2001
2002
2003
2004
2005
2006
2007
2008
2009
No decorrer da pesquisa observou-se que muitos autores no especificam o tipo de SOC, por isso a
necessidade de criar o grupo outro tipo de SOC.
128
A terceira etapa da anlise de contedo consiste no tratamento dos resultados
obtidos e interpretaes. Este tpico rene a anlise e discusso de resultados, desdobradas
em dois conjuntos principais: dos tipos de sistemas de organizao do conhecimento e das
categorias. Os dois conjuntos correspondem ao nmero de ocorrncia nos documentos que
tratam, em seus contedos, sobre os tipos de SOC e as categorias abordadas nos trabalhos. As
categorias foram pr-determinadas na metodologia e so baseadas na fundamentao terica
desenvolvida na reviso de literatura. Os termos usados para a anlise de contedo
correspondem a conceito, definio, funo, finalidade e/ou metodologias para a construo
dos sistemas de organizao do conhecimento. Os mapeamentos apresentados nos quadros a
seguir e seu detalhamento podem ser vistos no apndice B.
Grfico 4.
30
24
Tesauro
Sistema de
Classificao
Ontologia
Outros tipos de
SOCs
Taxonomia
129
justificado por esses dois sistemas possurem estruturas de construo consolidadas por
normas e padronizaes internacionais, enquanto que as taxonomias e ontologias ainda no.
Alm disso, no se pode deixar de mencionar a preocupao com a prpria rea de Cincia da
Informao em refletir sobre a necessidade da consolidao de uma base terica comum para
a construo de tais sistemas.
Dentre os sistemas de classificao os que mais se destacam so CDD e CDU com o
mesmo nmero de citao (14), seguido da LCC (9), facetada (7) e BC (1). Sobre os outros
tipos de SOC identificados na anlise ressaltam os vocabulrios controlados, lista de
cabealho de assunto, gazetteer, glossrio, dicionrio, mapa conceitual e folksonomias.
Na anlise por categorias, foram evidenciadas as influncias tericas quando a
temtica sistema de organizao do conhecimento, de acordo com o grfico a seguir.
Grfico 5.
68
33
130
especficos mencionados so: teoria do conceito (frequncia 20), relao hierrquica (17),
relao associativa (12) e categorizao (12). No entanto, alguns autores referem-se a
relaes entre conceitos (7) sem especificar qual o tipo de relacionamento. Os resultados
apontam com clareza a influncia da fundamentao terica para o melhor entendimento e
preciso do conceito do objeto a ser representado, fornecendo bases seguras tanto para
estabelecer relacionamentos quanto para a determinao dos termos.
A terminologia representa o aporte terico com o segundo maior nmero de
ocorrncias. Conforme constatado, o tema predominante relatado nos documentos o controle
terminolgico (19), que engloba o controle da polissemia, as estruturas sintticas e semnticas
e os termos de origem mais complexa. Observou-se em muitos trabalhos o interesse em
identificar e discutir os desafios para o desenvolvimento geral de estruturas de
conceitualizao, que abrange os conceitos e as terminologias a fim de melhorar as
informaes cruzadas e a representao de conceitos entre diferentes sistemas usados para
fins da recuperao de informaes.
Na anlise da categoria lingustica identificou-se os temas sobre significado e
significante, relao de sinonmia, hiponmia, homonmia, hiperonmia, meronmia e
equivalncia. Verificou-se, tambm, que diversos autores mencionam apenas relaes
semnticas, com 23 ocorrncias, sem especificar o tipo de relacionamento. Por isso, no
foram somadas no total dessa categoria e mesmo assim os conceitos e relacionamentos
obtiveram o maior nmero de citaes conforme o grfico 5. Mas, por outro lado, o nmero
de ocorrncias bastante elevado, merecendo ser destacado, inclusive, se considerados os
relacionamentos especificados nas categorias conceitos e relaes entre conceitos e
lingustica. Percebe-se, com esse estudo, que a natureza de diferentes relaes semnticas,
seu uso apropriado e bem definido podem ajudar na construo dos sistemas de organizao
do conhecimento consistentes.
Finalmente, princpios de classificao foi a categoria com o menor ndice de
ocorrncia, porm no menos significativo. Durante a anlise, buscou-se observar os
fundamentos tericos da teoria da classificao, os princpios da diviso de classes, das
facetas e das hierarquias. O estudo evidenciou a baixa frequncia com que os autores tratam o
131
assunto, mas ao mesmo tempo, alguns autores concordam que o ncleo das relaes
semnticas para todos os sistemas de organizao do conhecimento a hierarquia.
No decorrer da investigao foi detectada a associao de diferentes assuntos com
relao aos SOC. No Quadro 22, esto os temas com maior nmero de ocorrncia.
Quadro 22.
N de ocorrncia
Web semntica
13
Interoperabilidade
13
Recuperao da informao
11
Biblioteca digital
11
10
Indexao
SKOS core
Folksonomia
Gesto do conhecimento
Internet
132
pesquisam sobre o tema.
A anlise dos temas associados aos SOC sugere a tendncia de estudos sobre o
assunto no campo da Cincia da Informao. Web semntica e interoperabilidade aparecem
como os temas mais frequentes, juntamente com as bibliotecas digitais para fins de
recuperao de informao. A folksonomia, por ser tema novo, surpreende pela frequncia de
ocorrncia desse tema relacionado com os SOC. Dentre os temas identificados, porm com a
ocorrncia mais baixa, destacam-se cincia da informao, teoria da informao, softwares
para construo de SOC, construo automtica e semi-automtica de tesauros, rede
semntica, bibliometria, abstrao automtica de termos, mapeamento de diferentes SOC e ecomrcio.
Sintetizando a anlise dos dados, pode-se afirmar que com base no estudo feito sobre a
relao dos SOC com os princpios tericos que orientam a construo de tesauros,
taxonomias e ontologias, na rea de Cincia da Informao a base de dados com maior
nmero de trabalhos indexados sobre o tema foi a E-LIS, os anos que tiveram mais
publicaes foram 2006 e 2007. Os peridicos com mais artigos publicados foram o
Knowledge Organization, peridico especializado da rea de organizao e representao
do conhecimento e o ACIMED, que especializado na rea de medicina, sendo artigos os
tipos de publicao mais escritos.
Quanto aos autores mais produtivos sobre o tema, Marcia Lei Zeng, Claudio Gnoli,
Douglas Tudhope e Katrin Weller foram os que mais publicaram sobre o assunto no perodo
da pesquisa. As palvras-chave mais usadas pelos autores so knowledge organization,
thesauri, knowledge organization system, knowledge management e information retrieval.
Dos diferentes tipos de SOC, os tesauros e os sistemas de classificao (CDD e CDU) so os
mais mencionados nos documentos analisados. E o caminho
desenvolvimento dos SOC passa pela teoria do conceitos, da terminologia, da lingustica, dos
princpios de classificao e com destaque os relacionamentos entre conceitos. Os SOC esto
diretamente relacionados com os temas da web semntica, interoperabilidade entre diferentes
sistemas, recuperao da informao e bibliotecas digitais.
Captulo 5
Consideraes Finais e Trabalhos Futuros
134
usurios, provedores de
135
entre pesquisadores, bancos de dados e documentos armazenados, criados pelas dificuldades
na organizao das informaes e do conhecimento.
Quanto ao segundo objetivo especfico, relacionado anlise bibliomtrica das
caractersticas extrnsecas, o ano com maior nmero de publicaes foi 2006 e os peridicos
que mais publicaram sobre o tema foi o Knowledge Organization da rea de Cincia da
Informao e ACIMED da rea de Medicina, o que caracteriza a importncia dos SOC nesses
campos do conhecimento. Mrcia Lei Zeng destacou-se como a autora que mais publicou
sobre o assunto e a palavra-chave com maior nmero de ocorrncia foi knowledge
organization.
Na anlise de contedo, que consiste o terceiro objetivo especfico da pesquisa,
observou-se que, embora os tesauros tenham sido originrios na dcada de 1960, os princpios
que envolvem sua construo continuam no s a serem seguidos, mas sendo influenciados
por aqueles adotados na construo de outros sistemas. O mesmo ocorre com os princpios
que orientam a elaborao dos sistemas de classificao, porm com menor influncia que os
tesauros. Alm disso, ficou evidente que existe um caminho terico a ser percorrido para a
construo de SOC que tambm fundamenta a construo de taxonomias e ontologias. Esse
caminho passa pela teoria da classificao, teoria do conceito, os relacionamentos entre
conceitos e os princpios da Lingustica e da Terminologia para o tratamento dos termos. Esse
percurso terico fundamenta e garante a consistncia nas estruturas dos sistemas e nas
relaes semnticas para o melhor desempenho de suas funes.
A forte relao dos SOC com o ambiente web tambm evidenciada nos resultados
desta anlise, os quais aparecem com frequncia significativa os temas web semntica,
bibliotecas digitais, recuperao da informao, interoperabilidade entre diferentes sistemas,
integrao entre os sistemas a fim de facilitar a migrao de vocabulrios controlados.
importante destacar alguns problemas detectados no decorrer da pesquisa que, no
entendimento da autora, prejudicaram o seu desenvolvimento, como a baixa revocao no
resultado das buscas nas bases de dados. A ausncia de recuperao de publicaes nacionais
outra limitao do estudo, uma vez que obteve-se resultado zero nas buscas da BDTD. A
136
falta de uma base de dados atualizada que indexe e recupere artigos de peridicos brasileiros
na rea de Cincia da Informao tambm contribuiu para ausncia de anlise de publicaes
brasileiras.
Para estudos futuros essa pesquisa sugere uma investigao exaustiva nas
metodologias de construo de sistemas de organizao do conhecimento, a fim de sugerir
uma base terico-metodolgica comum para a construo desses sistemas em ambiente web.
Pois existe uma tendncia para a formao de novas estruturas semnticas que podero
funcionar com impacto nunca antes imaginado.
interessante, tambm, aprofundar questes de terminologia e lingustica, quando
existe a possibilidade de integrao e interoperabilidade entre diferentes sistemas,
vocabulrios e idiomas. A migrao desses sistemas e vocabulrios, que so apenas lidos por
computador, para o ambiente web semntica, pode ser vista como alternativa. Nesse ambiente
as informaes so lidas e entendidas por computadores com o uso de tecnologias tais como
XML, SKOS, OWL, RDF entre outras. So alguns esforos que podem contribuir para a
integrao dos SOC existentes ou at mesmo criar sistemas novos que melhorem o
compartilhamento de informaes no ambiente web.
137
REFERNCIAS
ALMEIDA, M.B. ; BAX, M.P. Uma viso geral sobre ontologias: pesquisa sobre definies,
tipos, aplicaes, mtodos de avaliao e de construo. Cincia da Informao, Braslia,
v.32, n.3, p.7-20, set./dez. 2003.
ALVARENGA, L. A teoria do conceito revisada em conexo com ontologias e metadados no
contexto das bibliotecas tradicionais e digitais. DataGramaZero Revista de Cincia da
Informao, v. 2, n. 6, dez., 2001. Disponvel em: http://www.dgz.org.br/dez01/Art_05.htm .
Acesso em: jul. 2005.
AMABIS, J. M.; MARTHO, G. R. Biologia das populaes: gentica, evoluo e ecologia.
So Paulo: Moderna, 1994. 511 p.
AMERICAN NATIONAL STANDARDS INSTITUTE / NATIONAL INFORMATION
STANDARDS ORGANIZATION. Guidelines for the Construction, Format, and
Management of Monolingual Controlled Vocabularies. ANSI/NISO Z39.19-2005. NISO Press,
Bethesda: Maryland, 2005. Disponvel em:<www.iso.org/kst/reports/standards/>. Acesso em:
jul. 2008.
ANJOS, L. dos. Sistemas de classificao do conhecimento na filosofia e na biblioteconomia:
uma viso histrico-conceitual crtica com enfoque nos conceitos de classe, de categoria e de
faceta. 2008. 291 fl. Tese (doutorado em Cincia da Informao) Escola de Comunicaes e
Artes da Universidade de So Paulo. So Paulo, 2008.
APPOLINRIO, F. Metodologia da Cincia. So Paulo: Thomson Pioneira, 2006. 220 p.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR 6023: Informao e
Documentao - Referncias - Elaborao. Rio de Janeiro: ABNT, 2000.
BERNERS-LEE, T. ; HENDLER, J. ; LASSILA, O. The Semantic Web: a new form of Web
content that is meaningful to computers will unleash a revolution of new possibilities.
Scientific American. 2001. Disponvel em:
<http://www.cs.nyu.edu/rgrimm/teaching/reading/semantic-web.pdf> Acesso em: maio 2008.
BLISS, E. H. A Bibliographic Classification: Principles and Definies. In: CHAN, L. M.;
RICHMOND, A.; SVENONIUS, E. Theory of Subject Analysis: a sourcebook. Colorado:
Libraries Unlimited, Inc, 1985. 75-85 p.
138
BORST, W. N. Contruction of engineering ontologies. 1997. 243 f. Tese (Doutorado)
University of Twente, Enschede, 1997. Disponvel em: <http://doc.utwente.nl/fid/1392>
Acesso em: abril 2006.
BRSCHER, M.; CAF, L. Organizao da Informao ou Organizao do Conhecimento?
In: ENCONTRO NACIONAL DE PESQUISA EM CINCIA DA INFORMAO, 9, 2008,
So Paulo. Anais. So Paulo: ECA/USP. Programa de Ps-Graduao em Cincia da
Informao, 2008. ENANCIB. 1835 pdf. Set./out. 2008. CD-ROM.
BREWSTER, C.; WILKS, Y. Ontologies, Taxonomies, Thesauri: Learning from Texts.
Department of Computer Science, University of Sheffield, Sheffield, UK. 2004
BROUGHTON, V. et. al. Knowledge Organization. In: European Curriculum Reflections on
Library and Information Science Education. Copenhagen: Kajberg, L. and Lorring, L. 2004.
chapter 7, pages pp. 133-148. Royal School of Library and Information Science, Copenhagen.
Disponvel em: http://dlist.sir.arizona.edu/1050/. Acesso em: mar 2009.
BRYAR, J. V. Taxonomies: the Value of Organized Business Knowledge. Editorial Services
NewsEdge Corporation. 2001. <http://www.cmswatch.com/Feature/59-Taxonomies>acessado
em: jun. 2007.
CABR, M. T. La Terminologa: Teoria, metodologia, aplicaciones. Barcelona: Editorial
Antrtida/Empries, 1993. 529 p.
CAMPOS, M. L. de A. A Organizao de Unidades do Conhecimento em Hipertextos: o
modelo conceitual como um espao comunicacional para a realizao da autoria. 2001, 198 fl.
Tese. (Doutorado em Cincia da Informao) Programa de Ps-Graduao e Cincia da
Informao da Escola de Comunicao da Universidade Federal do Rio de Janeiro. Rio de
Janeiro, 2001.
______. A. Integrao de Ontologias o domnio da Bioinformtica e a problemtica da
compatibilizao terminolgica. In: ENCONTRO NACIONAL DE PESQUISA EM
CINCIA DA INFORMAO, 8, 2007, Salvador. Anais. Salvador: UFBA. Programa de
Ps-Graduao em Cincia da Informao, 2007. VIII ENANCIB. Disponvel em:
<http://www.portalppgci.marilia.unesp.br/enancib/viewabstract.php?id=163> Acesso em:
maio 2008.
CAMPOS, M. L. M.; CAMPOS, M. L. A.; CAMPOS, L. M. Web Semntica e a Gesto de
Contedos Informacionais. In: MARCONDES, C. H. (Org.). Bibliotecas Digitais: Saberes e
139
Prticas. Salvador/Braslia, UFBA/IBICT, 2006. p. 55-78.
CAMPOS, M. L. de A. ; GOMES, H. E. Taxonomia e Classificao: o princpio de
categorizao. DataGramaZero Revista de Cincia da Informao, v. 9, n. 4, ago. 2008.
Disponvel em: <http://www.dgz.org.br/ago08/F_I_art.htm> Acesso em: abril 2009.
CAVALCANTI, C.R. Indexao e tesauro: metodologia e tcnicas. Braslia, ABDF, 1978.
CINTRA, A.M.M.; et al. Para entender as linguagens documentrias. So Paulo: Polis, 2002.
CONWAY, S.; SLIGAR, C. Building Taxonomy. In: Unlocking Knowledge Assets.
Washington, Microsoft Press, 2002. 256 p.
CORCHO, O.; FERNNDEZ-LPEZ, M.; GMEZ-PREZ, A. Methodologies, tools and
languages for building ontologies. Where is their meeting point? Data & knowledge
Engineering 46 (2003) 41-64. Disponvel
em:<http://www.cs.man.ac.uk/~ocorcho/#publications> Acesso em: maio 2008.
CURRS, E. Ontologas, Taxonomas y Tesauros: manual de construccin y uso. 3 ed.
Espanha: Ediciones Trea, S. L. 2005. 337 p.
DACONTA, M. C.; OBRST, L. J.; SMITH, K. T. The Semantic Web: A guide to the future of
XML, Web Services, and Knowledge Management. Indiana: Wiley Publishing, Inc. 2003.
281 p.
DAHLBERG, I. Teoria do conceito. Cincia da Informao, Rio de Janeiro, v.7, n.2, p.101107, 1978.
______. Knowledge Organization. 2006. Disponvel em:
<http://www.db.dk/bh/lifeboat_ko/CONCEPTS/knowledge_organization_Dahlberg.htm>
Acesso em: mar. 2008.
DODEBEI, V. L. D. TESAUROS: linguagem de representao da memria documentria. Rio
de Janeiro: Editora Intercincia, 2002. 119 p.
DUTRA, J. ; BUSCH, J. NASA Technical White Paper Enabling Knowledge Discovery:
Taxonomy Development for NASA. 2003. Disponvel em: <http://trs-new.jpl.nasa.gov.>
140
Acesso em: jul 2007.
EDOLS, L. Taxonomies are what? Free Pint, Reino Unido, n.97, out. 2001. Disponvel em:
<http://www.freepint.com/issues/041001.htm#eature>. Acesso em: out. 2008.
FEITOSA, A. Organizao da informao na web: das tags web semntica. Braslia:
Thesaurus, 2006.
FERREIRA, A. B. de H. Novo Dicionrio da lngua portuguesa, 1 ed., 15 imp., Rio de
janeiro: Nova Fronteira, [1986]. p. 365 e 1005: organizar e conhecer.
GLOSSRIO GERAL DE CINCIA DA INFORMAO. Disponvel em:
<http://www.cid.unb.br/publico/setores/100/123/sistema/m0039015.htm >. Acesso jul. 2009.
GOMES, H. E. Manual de elaborao de tesauros monolngues. Braslia: o Programa, 1990.
78 p.
______. H. E. Tendncias da Pesquisa em Organizao do Conhecimento. Tendncias da
Pesquisa Brasileira em Cincia da Informao. Braslia, v. 2, n.1, p. 60-88, jan./dez. 2009.
GUARINO, N. Formal Ontology. In: PROCEEDING OF FOIS'98, TRENTO, ITALY, 6-8
JUNE 1998. Amsterdam, IOS Press, pp. 3-15.
GUINCHAT, C.; MENOU, M. Introduo geral s cincias e tcnicas da informao e
documentao. 2 ed. Braslia: FBB e IBICT, 1994. 540 p.
GRUBER, T. (1996). What is an ontology? [S. I. : s. n.], 1996. Disponvel em:
<http://ksl.stanford.edu/kst/what-is-an-ontology.html> Acessado em: abril 2007.
HESSEN, J. Teoria do Conhecimento. 2 ed. So Paulo: Martins Fontes. 2003. 177p.
HJRLAND, B. Fundamentals of knowledge organization. Knowledge Organization, v.30,
n.2, p. 87- 111, 2003.
______. Knowledge Organization Systems. 2007.Disponvel em:
<http://www.db.dk/bh/lifeboat_ko/CONCEPTS/knowledge_organization_systems.htm>
141
Acesso em: 14 maro 2008.
HODGE, G. Systems of Knowledge Organization for Digital Libraries: beyond traditional
authorities files. Washington, DC, the Council on Library and Information Resources. 2000.
Disponvel em: <http://www.clir.org/pubs/reports/pub91/contents.htm> Acesso em: 24 maio
2008.
IBICT. Diretrizes para elaborao de tesauros monolngues. Braslia, 1984.
KENT, A.; LANCOUR, H. Encyclopedia of library and information science. New York: M.
Dekker, 1968.
KWASNIK, B. H. The Role of Classification in Knowledge Representation and Discovery
1. Library Trends. FindArticles.com. 1999. Disponvel em:
<http://findarticles.com/p/articles/mi_m1387/is_1_48/ai_57046525>. Acesso em: mar 2009.
LANCASTER, F. W. Indexao e resumos: teoria e prtica. 2 ed. Braslia: Briquet de
Lemos. 2004. 452 p.
LANGRIDGE, D. Classificao: abordagem para estudantes de Biblioteconomia. 1
reimpresso. Rio de Janeiro: Intercincia, 2006.
LARA, M. L. G. O Unicrnio (o Rinoceronte, o Ornitorrinco ...), a Anlise Documentria e a
Linguagem Documentria. DataGramaZero Revista de Cincia da Informao, v. 2, n. 6,
dez. 2001. Disponvel em: <http://www.dgz.org.br/dez01/F_I_art.htm>. Acesso em: maio
2009.
LARA, M. L. G. de. A representao documentria: em jogo a significao. 1993.
Dissertao de Mestrado em Cincias da Comunicao, Universidade de So Paulo, Escola de
Comunicaes e Artes, Departamento de Biblioteconomia e Documentao, So Paulo.
LIMA, J. A. de O. Modelo Genrico de Relacionamentos na Organizao da Informao
Legislativa e Jurdica. 2008. 289fl. Tese (Doutorado em Cincia da Informao)
Universidade de Braslia, Braslia, 2008. Disponvel
em:<http://www2.senado.gov.br/bdsf/item/id/92749>. Acesso em: maio 2009.
LIMA, V. M. A. Da classificao do conhecimento cientfico aos sistemas de recuperao
de informao: enunciao de codificao e enunciao de de codificao da informao
142
documentria. 2004. 156fl. Tese (Doutorado em Cincias da Comunicao) Escola de
Comunicaes e Artes da Universidade de So Paulo, So Paulo, 2004. Disponvel em:
<http://www.teses.usp.br/teses/disponiveis/27/27143/tde-06032006-150120>. Acesso em:
mar 2009.
LYON, J. Linguagem e Lingustica: uma introduo. Rio de Janeiro: Guanabara Koogan,
1987. 322 p.
NASCIMENTO, M. S. O. do et all. A ontologia na Cincia da Informao. Revista Digital de
Biblioteconomia e Cincia da Informao, v. 5, n. 1, p.13-39. jan/jun. 2007 ISSN: 1678765.
NOY, N. F.; McGUINNESS, D. L. Ontology Development 101: A Guide to Creating Your
First Ontology. Stanford University: Stanford, 2001. Disponvel em:
<http://www.ksl.stanford.edu/people/dlm/papers/ontology101/ontology101- noymcguinness.html> Acesso em: maio 2008.
PHILLIPS, W. H. A primer of book classification. London: Association of Assistant
Librarians, 1955. 235 p.
PIEDADE, M.A.R. Introduo teoria da classificao. Rio de Janeiro: Intercincia, 1977.
RANGANATHAN, S. R. Colon Classification: basic classification. 6 ed. Bombay: Asia
Publ. House, 1963.
REITZ, J. M. ODLIS Online Dictionary for Library and Information Science. Libraries
Unlimited. 2004. Disponvel em: <http:http://lu.com/odlis/odlis_t.cfm> Acesso em: 22 out.
2008.
ROBREDO, J. Documentao de Hoje e de Amanh. 4 ed. rev. e ampl. Braslia: Edio de
autor, 2005, 409 p.
ROCHA, D.; DEUSDAR, B. Anlise de Contedo e Anlise do Discurso. ALEA Estudos
Noelatinos. v. 7, n. 2, jul./dez. 2005. p. 305-322.
ROWLEY, J. E. Organizing Knowledge: an Introduction to Information Retrieval. 2 ed.
England: Ashgate, 1992. 509 p.
143
RUSSELL, B. Histria do Pensamento Ocidental: a aventura dos pr-socrticos a
Wittgenstein. 3 ed. Rio de Janeiro: Ediouro. 2003. 510 p.
SALES, R. de. Tesauros e Ontologias sob a luz da Teoria Comunicativa da Terminologia.
2008. 210fl. Dissertao (Mestrado em Cincia da Informao) - Universidade Federal de
Santa Catarina, Florianpolis, 2008. Disponvel em:
<http://aspro02.npd.ufsc.br/pergamum/biblioteca/index.phpresolution2=1024_1> . Acessado
em: abril 2009.
SALES, L. F.; CAMPOS, M. L. de A.; GOMES, H. E. Ontologias de domnio: um estudo das
relaes conceituais. Perspectivas em Cincia da Informao, v. 13, n. 2, p. 62-76, maio/ago.
2008.
SLAVIC, A. Knowledge Organization Systems, Network Standards and Semantic Web. IN:
INFORMACIJSKE ZNANOSTI U PROCESU PROMJENA. Zagred: Zavod za informacijske
studije, 2005. p. 5-22. Disponvel em:
http://dlist.sir.arizona.edu/1326/03/semweb_kos_EN_2.doc. Acessado em: 01 abril 2009.
SMIRAGLIA, R. The progress of theory in knowledge organization. Library Trends. Wntr
2002. Disponvel em: http://findarticles.com/p/articles/mi_m1387/is_3_50/ai_88582618.
Acessado em: 21 Jul. 2008
SOUZA, J. S. de. Classificao: sistemas de classificao bibliogrfica. Rio de Janeiro:
Imprensa Nacional, 1943.
SRIVASTAVA, A. Theory of Knowledge Classification in Libraries. New Delhi: Sagar
Publications, 1964. 206 p.
SVENONIOUS, E. The Intellectual Foundation of Information Organization. London: The
MIT Press, 2000. 254 p.
TERRA, et al. Taxonomia: elemento fundamental para a Gesto do Conhecimento.
Disponvel em: <www.terraforum.com.br> Acesso em: 01 mar. 2005.
TOUTAIN, L. M. B. B. Biblioteca digital: definio de termos. In: MARCONDES, C.H.Org.)
Bibliotecas Digitais: Saberes e Prticas. Salvador/Braslia, UFBA/IBICT, 2006. p. 15-24.
144
VELTMAN, K. H. Towards a Semantic Web for Culture. Journal of Digital Information, v.
4, n. 4, artigo no 255, 15/03/2004. Disponvel em:
<http://jodi.ecs.soton.ac.uk/Articles/v04/i04/Veltman/veltman.pdf>. Acesso em: maio 2009.
W3C World Wide Web Consortium. KOS. Disponvel em:
<http://www.w3.org/2004/02/skos/> Acesso em: jan. 2009.
WYLLYS, R. E. Information Architecture. Material de aula da equipe da The Graduate
School of Library and Information Science at UT-Austin. Direitos autorais de LIS 386.13.
Disponvel em: http://www.ischool.utexas.edu/~l38613dw/readings/InfoArchitecture.html.
Acesso em: 25 maio 2008.
ZENG, M. L. Knowledge Organization Systems (KOS). Knowledge Organization, v. 35, n. 23, p. 160-182, 2008.
145
Afiliao
Pas
Estados Unidos
2 - Michael
Professor, Department of Geography, University of California, Santa
Frank Goodchild Barbara
Estados Unidos
3 - Mara Jos
Lpez-Huertas
Prez
Espanha
Autor
Ttulo do
Artigo
Referncia da
Publicao
Palavrachave
Idioma
/
pas
4
Nielsen,
2008 Marianne
Lykke
Networked
D-Lib Magazine,
Knowledge
vol. 14, no. 11-12,
Organization
Nov-Dec 2008
Systems/Service
s (NKOS):
ECDL 2008
Conference
Report
KOS,tesauros, taxonomias
e ontologias, estruturas
conceituais e bases
conceituais para sistemas
baseados emconhecimento.
Ferramentas, representao
e indexao de
informaes e documentos.
Bibliotecas digitais,
Workshops; Ingls /
Knowledge Estados
organization Unidos
; Networks
5
Weller,
2008 Katrin;
Stock,
Wolfgang
Transitive
meronymy.
Automatic
concept-bases
query expansion
using weighted
transitive partwhole relations
Information:
Wissenschaft &
Praxis, vol. 59, no.
3, pp. 165-170,
Apr-May 2008
Aponta a relao de
meronmia e hiponmia
para a construo dos
KOS.
Query
expansion;
Computeriz
ed
information
retrieval;
Semantic
relations
Ingls /
Repbli
ca da
Aleman
ha
6
Peters,
2008 Isabella;
Weller,
Katrin
Paradigmatic and
syntagmatic
relations in
knowledge
organization
systems
Information:
Wissenschaft &
Praxis, vol. 59, no.
2, pp. 100-107,
2008
Mtodos clssicos de RC
so vagos e restritos,
quanto as relaes como
sinonmia e hierarquia
(meronmia e hiponmia).
Mostra as relaes usadas
para a construo de
ontologia e outros KOS.
Knowledge
representati
on;
Ontology;
Controlled
vocabulary;
Collaboratio
n
Ingls /
Repbli
ca da
Aleman
ha
Online
information
retrieval;
Knowledge
organization
;
Alemo
/
Repbli
ca da
Aleman
ha
7
Heesemann Faceted KOS
2008 , Silke;
and dynamic
Nellissen, classification as
Hanstools for the
Dieter
research of the
Desk27 Web
27
Information:
Online information
Wissenschaft &
retrieval; Knowledge
Praxis, vol. 59, no. organization; Classification
2, pp. 108-117,
2008
do ttulo original Facettierte Wissensordnungen und dynamisches Klassieren als Hilfsmittel der
Erforschung des Dark Web.
146
Classificatio
n
8
Dextre
2008 Clarke,
Stella G.
Journal of
Information
Science, vol. 34,
no. 4, pp. 427-437,
2008
Princpios de classificao
e classificao facetada na
construo de tesauros e
outros esquemas de
representao do
conhecimento.
9
Zeng,
Knowledge
2008 Marcia Lei Organization
Systems (KOS)
Knowledge
Organization, vol.
35, no. 2-3, pp.
160-182, 2008
10
Slavic,
2007 Aida
On the nature
and typology of
documentary
classifications
and their use in a
networked
environment
Profesional de la
Informacion, vol.
16, no. 6, pp. 580589, Nov-Dec
KOS classificao
documentria,
terminologia, esquemas de
classificao influencia
estruturas semnticas e
sintticas
Classificatio Ingls /
n schemes, Espanha
Knowledge
organization
11
Sanchez2007 Cuadrado,
Sonia;
MoratoLara, Jorge;
PalaciosMadrid,
Vicente;
LlorensMorillo,
Juan;
MoreiroGonzalez,
Jose
Antonio
And suddenly,
everybody is
talking about
ontologies?
Profesional de la
Informacion, vol.
16, no. 6, pp. 562568, Nov-Dec,
2007
Ontologies; Espanho
Thesauri;
l/
Knowledge Espanha
organization
12
Barat,
2007 Agnes
Hajdu
Human
perception and
knowledge
organization:
visual imagery.
Library Hi Tech,
vol. 25, no. 3, pp.
338-351, 2007
Knowledge Ingls /
organization Reino
; Visual
Unido
materials;
Images
Knowledge
management
; Digital
libraries;
Institutional
13
Angrosh,
Ontology-driven Information
2006 M. L.; Urs, knowledge
Studies, vol. 12,
Shalini R. management
no. 3, pp. 151-168,
systems for
Jul 2006
digital libraries:
Knowledge Ingls /
organization Reino
; Faceted
Unido
classificatio
n schemes;
Thesauri
Ingls /
Repbli
ca da
Aleman
ha
Ingls /
no
consta
pas de
publica
147
towards creating
semantic
metadata-based
information
services.
taxonomias, agrupamento
hierrquico e estrutura de
rvore; ontologias alto grau
de relacionamento
associativo entre conceitos,
semntica.
repositories; o
Metadata;
Semantic
relations;
Ontologies
14
Cantara,
2006 Linda
Encoding
controlled
vocabularies for
the Semantic
Web using
SKOS Core.
OCLC Systems
and Services, vol.
22, no. 2, pp. 111114, 2006
Online
information
retrieval;
Searching;
Subject
heading
schemes;
Semantic
relations;
Metadata;
Software;
SKOS Core
15
Tennis,
2005 Joseph T
Experientialist
Knowledge
epistemology
Organization; 32
and classification (2) 2005, pp.79-92
theory:
embodied and
dimensional
classification
KOS:teoria da
classificao, CI,
semntica cognitiva,
organizao do
conhecimento. Para
investigao de
experimentos em teoria da
classificao.
Classificatio Ingls /
n;
no
Knowledge consta
organization
;
Epistemolog
y
KOS vocabulrio
controlado, esquemas de
classificao e
interoperabilidade;
linguagens e estruturas;
anlise metodolgica.
Knowledge Ingls /
management no
;
consta
Knowledge
organization
;
Interoperabi
lity
16
Chan, Lois Trends and
2004 Mai; Zeng, issues in
Marcia Lei establishing
interoperability
among
knowledge
organization
systems
Journal of the
American Society
for Information
Science and
Technology; 55
(5) Mar 2004,
pp.377-395
Ingls /
no
consta
pas de
publica
o
17
Mai, Jens2003 Erik
Organization of Knowledge
knowledge in a Organization; 30
networked
(1) 2003, pp.36-37
environment: a
report of the 6th
Networked
Knowledge
Organization
Systems (NKOS)
Workshop
Information Ingls /
work;
no
Knowledge consta
management
International
conferences;
Networked
KOS
18
Fisseha,
2003 Frehiwot;
Katz, S.;
Keizer,
Johannes;
Lauser,
Boris;
Liang,
Anita;
Soergel,
Dagobert
Reengineering
thesauri for new
applications: the
AGROVOC
example
Knowledge Ingls /
management no
;
consta
Knowledge
organization
; Thesauri;
AGROVOC
Journal of Digital
Information; 4 (4)
2003, No page
numbers
148
19
Orom,
2003 Anders
Knowledge
organization in
the domain of art
studies - history,
transition and
conceptual
changes
Knowledge
Organization; 30
(3/4) 2003,
pp.128-143
20
Hodge,
2000 Gail
Systems of
Report:
Knowledge
ED440657. 46pp.
Organization for Apr 2000
Digital Libraries:
Beyond
Traditional
Authority Files.
KO no domnio da Artes:
no nvel dos sistemas de
classificao, bibliografias
e tesauros; a integrao
com as taxonomias da
LCC, DDC, UDC e
Sovietic BBK sistemas de
classificao, a relao
entre os paradigmas,
princpios para artes,
maneiras de conceitualizar
e organizao do contedo
dos documentos de arte
Classificatio Ingls /
n schemes; no
Knowledge consta
organization
; Thesauri;
Art
KOS aplicao em
materiais digitais e
iniciativas em bibliotecas
digitais. Definies de
caractersticas gerais,
origem e uso, exemplos
como podem ser usados
em bibliotecas digitais e
em vrias disciplinas.
Access to
Ingls /
Information; no
Electronic
consta
Libraries;
Information
Managemen
Information
Storage;
Information
Systems;
Library
Collection
Developmen
Autor
Ttulo do Artigo
Referncia da
Publicao
PalavrasChave
Idioma/pas
publicao
21
2008
Peters,
Tag Gardening for
Webology, vol. 5,
Isabella;
Folksonomy Enrichment no. 3, Sept 2008
Weller, Katrin and Maintenance
Tagging;
Knowledge
organization;
Semantics
ingls/Iran
22
2008
Webology, vol. 5,
no. 3, Sept 2008
Search
engines;
Tagging
ingls/Iran
23
2008
LopezHuertas,
Maria J
Knowledge
Knowledge
Organization, vol.
organization;
35, no. 2-3, pp. 113- Research
136, 2008
ingls/Repb
lica da
Alemanha
24
2007
Anderson,
Jack
Information criticism:
where is it?
Faslname-Ye
Ketab/Library and
Information Studies,
vol. 18, no. 2, pp.
251, summer 2007
Library and
information
science;
professional
education;
Knowledge
organization;
Criticism
Persa / Iran
25
2007
Bai, Haiyan;
Hu, Tiejun;
Liang, Fang;
Zuo,
New development of
library automatization
system integrated with
knowledge organization
Knowledge
Chins / no
management; consta pas
Knowledge
de publicao
organization;
149
Yonglong
systems.
Library
technology;
Information
retrieval
26
2007
Lacasta,
ThManager: an open
Javier;
source tool for creating
Nogueras-Iso, and visualizing SKOS.
Javier; LopezPellicer,
Francisco
Javier; MuroMedrano,
Pedro Rafael;
ZarazagaSoria,
Francisco
Javier
Information
Technology and
Libraries, vol. 26,
no. 3, pp. 39-51,
2007
Knowledge
organization;
Thesauri;
Open source
software;
ThManager
Ingls /
Estados
Unidos
27
2006
International
Cataloguing and
Bibliographic
Control, vol. 35, no.
3, pp. 52-54, Jul
2006-Sep 2006
Subject
indexing;
Authority
control; Data
sharing;
Knowledge
organization
Ingls / no
consta local
de publicao
28
2006
SanchezAlonso,
Salvador;
GarciaBarriocanal,
Elena
29
2004
Shiri, Ali;
Interfaces to knowledge
Molberg, Keri organization systems in
Canadian digital library
collections
30
2004
Perkins, Jody
Computer
Ingls / no
applications; consta pas
Knowledge
de publicao
management;
Knowledge
organization;
Semantic
relations;
Ontologies
Ingls / no
consta
Library and
Ingls / no
information
const
professionals;
Digitallibrarie
s;cataloguing;
Knowledge
organization;
Zeng, M. Lei
150
Base de dados - ISTA
Ano
Autor
Ttulo do
Artigo
Referncia da
Publicao
Palavra-chave
1
McCulloch Analysis of
2008 , Emma
Equivalence
and
Mapping for
Macgregor, Terminology
Services
Journal of
Information
Science, 2008, vol.
34, n. 1, pp. 70-92
[Journal Article
(Print/Paginated)]
Interoperabilidade,
caracterizar
relacionamentos entre
mapeamento de
determinadas
terminologias e
esquema da CDD,
SKOS
2
Hjrland,
2009 Birger
Concept
theory
Journal of the
American Society
for Information
Science &
Technology;
Aug2009, Vol. 60
Issue 8, p15191536, 18p
CI e KO possuem
relaes com a teoria
do conceito. KOS
sistemas de
classificao, tesauros
e ontologias so
sistemas que
organizam conceitos e
suas relaes
semnticas. Assim
como em SRI. O
artigo aponta que o
entendimento
histrico e pragmtico
de conceitos so
muito frutferos em
CI.
Abstraction
---Knowledge, Theory
of Perception
Cognition,
Eletronic data
processing,
Information
technology,
Communication
Information theory,
Information
visualization,
analytic models,
concepts
epistemology,
KOS, mental
processes
3
Sanchez2007 Cuadrado,
S; MoratoLara,J;
PalaciosMadrid,
V; LlorensMorillo, J;
MoreiroGonzalez, J
A.
And suddenly,
everybody is
talking about
ontologies?
Profesional de la
Informacion, vol.
16, no. 6, pp. 562568, Nov-Dec,
2007
KOS tesauros,
Ontologies;
ontologias em base de Thesauri;
dados e o significado Knowledge
desses conceitos
organization
espanho
l/
Espanha
4
Shiri, Ali
2003
Digital library
research:
current
developments
and trends
Library Review;
2003, Vol. 52 Issue
5 and 6, p198-202,
5p
Presents an overview
of current trends in
digital library research
in the following areas:
digital library
architecture, systems,
tools, technologies;
digital content and
collections; metadata;
standards;
interoperability;KOS;
users and usability;
legal,organizational,
economic, and social
issues.
-----
Digital libraries
Research
Design
Concepts
Idioma/
pas
151
5
Nielsen,
2004 Marianne
Lykke
ECDL 2004
D-Lib Magazine;
Workshop
Oct2004, Vol. 10
ReportNKOS: Issue 10, p1-1, 1p
User-centred
approaches to
Networked
Knowledge
Organization
Workshoptroca de
experincias ligadas
aos KOSmodelos de
estruturao, relaes
de conceitos,
metodologias e
tcnicas de
padronizao
Informationresourc Ingls /
es management
Inglaterr
Seminars
a
Knowledge
management
Information storage
& retrieval systems
System design
6
Cantara,
2006 Linda
Encoding
controlled
vocabularies
for the
Semantic Web
using SKOS
Core.
OCLC Systems
and Services, vol.
22, no. 2, pp. 111114, 2006
SKOS coreKOS
tradicionais: tesauros
e sistemas de
classificao, mais
complexos, novos
padres bibliotecas
digitais, liguagens da
web semntica.
7
Thornton,
2009 Grace
Everything is
Miscellaneous
: The Power
of the New
Digital
Disorder.
Journal of the
American Society
for Information
Science &
Technology;
Jun2009, Vol. 60
Issue 6, p12991300, 2p (book
review)
No apresenta dados
suficientes para saber
do que se trata. Artigo
da reviso do livro:
Everything is
miscellaneous: the
power of the New
Digital Disorder
collaborative
indexing
customization
knowledge
organization
systems
organization of
information
World Wide Web
8
Tennis,
2005 Joseph T
Experientialist Knowledge
epistemology Organization; 32
and
(2) 2005, pp.79-92
classification
theory:
embodied and
dimensional
classification
KOS teoria da
classificao, CI,
semntica cognitiva,
organizao do
conhecimento.
Investigao de
experimentos em
teoria da classificao
e organizao do
conhecimento.
Classification;
Knowledge
organization;
Epistemology
Ingls /
no
consta
9
Barat,
2007 Agnes
Hajdu
Human
Library Hi Tech,
perception and vol. 25, no. 3