Escolar Documentos
Profissional Documentos
Cultura Documentos
53
1.
Introduo
de
sinnimos ou equivalentes
estabelecimento de
relacionamentos semnticos entre conceitos. A pesquisa foi realizada por meio de reviso de
literatura sobre SOC observando seus progressos cientficos e os aspectos conceituais e
estruturais de elaborao desses sistemas. O objetivo da investigao foi relacionar os
fundamentos tericos indicados na literatura da rea e os princpios tericos encontrados nas
publicaes sobre o tema, desde seu surgimento at a realizao deste trabalho, por meio das
anlises bibliomtrica e de contedo. Contemplando tambm a relao dos SOC, no mbito da
Cincia da Informao (CI), e os princpios tericos que orientam a construo de tesauros,
taxonomias, ontologias e sistemas de classificao.
Para atingir os objetivos foi feito um levantamento bibliogrfico na rea com a opinio dos
diversos autores percorrendo um caminho terico fundamentado na Teoria da Classificao,
Teoria do Conceito, nos relacionamentos entre conceitos, nos princpios da Lingustica e da
3 Artigo decorrente da dissertao de mestrado: Sistemas de Organizao do Conhecimento: uma
reflexo no contexto da Cincia da Informao, de Eliana Carlan sob a orientao da Dra. Marisa
Brscher,
Universidade
de
Braslia,
Fev.
de
2010.
Disponvel
em:
http://bdtd.bce.unb.br/tedesimplificado/tde_busca/processaPesquisa.php?pesqExecutada=1&id=5381
4 O termo Sistema de Organizao do Conhecimento a traduo para o portugus do original ingls
Knowledge Organization System (KOS), proposto pelo Networked Knowledge Organization Systems
Working Group na 1 Conferncia da ACM Digital Libraries em 1998, Pittsburgh, Pennsylvania. Assim
como a sigla KOS, adotou-se o correspondente SOC em portugus.
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.
54
Terminologia. Dos diferentes tipos de SOC, deu-se destaque aos tesauros, pelo uso ainda
frequente na rea de organizao de informao e por sua existncia consolidada e
padronizada por normas internacionais (ISO, ANSI/NISO); as taxonomias, por sua importncia
na organizao de informaes em empresas e instituies, principalmente, no
desenvolvimento de portais no ambiente web; as ontologias, pelo interesse da comunidade de
pesquisa na rea, em funo das promessas da web semntica e, ainda pelo potencial que
oferecem em relao capacidade de representao do conhecimento de forma complexa e
completa e os sistemas de classificao, pela ampla utilizao na organizao da informao
em bibliotecas, onde so empregadas at hoje.
55
56
(CONWAY e SLIGAR, 2002; TERRA, 2005) o conceito de taxonomia sofreu uma transformao
nos tempos da informtica, chegando ao mbito da CI e da Documentao, no que se refere
aos sistemas de classificao. As taxonomias vm sendo usadas para a criao de metadados
ou termos comuns para descrever um objeto, com foco na recuperao da informao e na
categorizao, como suporte de navegao e esquemas que organizam contedos das pginas
na web e lista de controle de dados usados para suporte de minerao de dados. Uma
taxonomia bem definida e bem construda racionaliza o processo de busca, reflete a
necessidade dos usurios e o contedo que ela organiza.
As taxonomias no so documentos estticos, pelo contrrio, adaptam-se s
influncias do contedo e conhecimento dos trabalhadores que as utilizam. Quanto
estrutura, devem ser objetivas e estratgicas. O ponto de partida a busca pela existncia de
taxonomias, assim como outros documentos j existentes, do mesmo domnio, resultando em
economia de tempo e esforos. Conway e Sligar (2002) afirmam que uma taxonomia bem
formada no s reflete a necessidade de seus usurios como o contedo que ela organiza.
Ao contrrio do princpio dicotmico adotado por Aristteles, pode-se, atualmente,
construir taxonomias policotmicas, ou seja, um termo associado a tantas classes e
subclasses quantas se fizerem necessrias, em um domnio especializado. Com isso, evidenciase a grandeza do problema de mapeamento multidimensional de qualquer rea especializada
(CAMPOS e GOMES, 2008). Conway e Sligar (2002), descrevem trs tipos de taxonomias:
descritiva, construda nos modelos de tesauros ou vocabulrios controlados; navegacional5,
inerente neste conceito a ideia da relao gnero/espcie entre vrios documentos; e
gerenciamento de dados, que contm um pequeno conjunto de termos controlados
rigidamente e tem particular significncia enumerativa. Svenonious (2000) estabeleceu cinco
metas centrais para a classificao de documentos em um sistema de informao: encontrar;
identificar; selecionar; obter e navegar no acervo documental. As taxonomias criam uma rede
semntica comum baseada na necessidade dos negcios e considera os bens intelectuais e a
maneira pela qual os funcionrios procuram pela informao.
O desenvolvimento de ontologias cresce e ganha papel especfico em diversas
comunidades cientficas, como a Cincia da Computao, Cincia da Informao, Medicina,
para citar algumas. Uma ontologia define os termos usados para descrever e representar uma
rea do conhecimento. Pode ser usada por pessoas, bancos de dados, em tcnicas e aplicaes
de raciocnio indutivo e inferncias que necessitam compartilhar informaes dentro de um
domnio. Assim, Robredo (2005, p. 321) define uma ontologia como o resultado da
5
Sugere-se a leitura do artigo: Princpios classificatrios para a construo de taxonomias
disponvel em: http://www.portalseer.ufba.br/index.php/revistaici/article/viewArticle/3626
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.
57
58
59
60
61
62
Exemplos
Atributiva
Disciplina /Objeto
entomologia / insetos
Processo / instrumento
iluminao / lmpadas
Influncia
Matria-prima / produto
bauxita / alumnio
Coisa / aplicao
Ao / resultado da ao
tecelagem / tecido
Efeito / causa
Dependncia causal
Atividade / agente
tabagismo / fumo
Produto / propriedade
veneno / toxidade
Atividades complementares
compra / venda
Opostos
vida / morte
Ao / seu paciente
priso / criminoso
insetos / inseticidas
Atividade / produto
tecelagem / tecido
brasileiro / Brasil
63
64
3.
Procedimentos Metodolgicos
O processo de anlise valeu-se de mtodos quantitativos e qualitativos. O perodo
definido para a pesquisa foi entre 1998, ano em que foi sugerida a adoo da expresso
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.
65
7 LISA Library and Information Science Abstracts; H. W. WILSON Library Literature and Information
Science Full Text; LISTA Library, Information Science & Technology Abstracts with Full Text; ISTA
Information Science & Technology Abstracts.
8 Habilidade de recuperar informaes relevantes para um assunto especfico, quando uma solicitao
sobre esse assunto feita ao sistema. (LANCASTER, 1977)
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.
66
67
visualizao. As categorias so: peridicos (67,92%), que fazem parte os jornais, boletins e
revistas; eventos (26,41%) englobam as conferncias, congressos, seminrios, anais, fruns e
workshop e acadmicos (5,66%) so as teses, dissertaes e monografias.
Autores - houve a ocorrncia de 141 autores. Desse total, 125 autores aparecem com uma
nica produo sobre o tema, sendo 62 citados como autor principal e 63 como autores
secundrios. Os autores com mais produo so Marcia Lei Zeng, Katrin Weller, Nez Paula e
Israel Adrin, Claudio Gnoli e Douglas Tudhope.
Palavra-chave - buscou-se identificar os termos mais frequentes no campo palavra-chave dos
registros recuperados e, tambm identificar as reas s quais o termo Knowledge
Organization System pode estar relacionado. No total foram computadas 404 palavras-chave,
sendo 225 termos diferentes. Dentre os artigos recuperados o termo Knowledge sozinho ou
associado a outros termos aparece como palavra-chave desde 1998, mas somente em 1999 a
expresso knowledge organization system aparece como palavra-chave. Information
retrieval e digital libraries apareceram pela primeira vez em 1998 e 2002 respectivamente.
O primeiro artigo com o termo semantic data de 2001, sendo que a expresso web
semantic aparece apenas em 2005 e em 2006 observa-se a expresso semantic relation.
A anlise dos aspectos intrnsecos ou de contedo foi desenvolvida em:
Pr-anlise - foram selecionados os trabalhos que mencionam em seus contedos, algum tipo
de relao com a base terica apresentada na reviso de literatura. Esta seleo foi feita por
meio de leituras dos campos: ttulo, palavra-chave e resumo. Com base nesse critrio foram
identificados 43 documentos para a anlise temtica e selecionados para a leitura na ntegra.
Exceto algumas inconsistncias que foram apontadas: artigos no localizados na ntegra;
artigos completos no idioma desconhecimento da autora. Portanto, esses quatro trabalhos
no fizeram parte do cmputo da anlise de contedo totalizando para anlise temtica 39
documentos.
Especulao e anlise do material - leitura na ntegra dos documentos relevantes. Os
diferentes tipos de SOC foram classificados de acordo com o nmero de vezes que foram
abordados nos documentos com relao ao desenvolvimento de tesauro e/ou taxonomia e/ou
ontologia e/ou sistemas de classificao e/ou outro tipo de SOC9 e as categorias prestabelecidas: princpios da classificao; conceitos e relaes entre conceitos; lingustica e
terminologia. No nmero de publicaes por ano verificou-se apenas uma publicao nos anos
9 No decorrer da pesquisa observou-se que muitos autores no especificam o tipo de SOC, por isso a
necessidade de criar o grupo outro tipo de SOC.
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.
68
O grfico mostra que os tesauros so os mais citados com 87% de frequncia dos
documentos analisados. Seguida dos sistemas de classificao com 77%, as ontologias com
61%, os outros tipos de SOC com 54% e as taxonomias com o menor ndice de frequncia 49%.
O fato dos tesauros e os sistemas de classificao estarem nos tipos de SOC que apresentam
maior ndice de ocorrncia permitem refletir, que tal fato pode ser justificado por esses dois
sistemas possurem estruturas de construo consolidadas por normas e padres
internacionais, enquanto que as taxonomias e ontologias ainda no. Alm disso, no se pode
deixar de mencionar a preocupao com a prpria rea de CI em refletir sobre a necessidade
da consolidao de uma base terica comum para a construo de tais sistemas.
Dentre os sistemas de classificao os que mais se destacam so CDD e CDU com 14
citaes, LCC com 9, classificao facetada 7 e classificao de Bliss uma. Sobre os outros tipos
de SOC identificados na anlise ressaltam os vocabulrios controlados, lista de cabealho de
assunto, gazetteer, glossrio, dicionrio, mapa conceitual e folksonomia. Na anlise por
categorias, foram evidenciadas as influncias tericas quando a temtica SOC, de acordo
com o grfico a seguir.
69
Grfico 2.
A categoria que representa a base terica com maior frequncia nos artigos analisados
foi teoria do conceito e relaes entre conceitos. Como parte dessa categoria, os temas
especficos mencionados so: teoria do conceito (frequncia 20), relao hierrquica (17),
relao associativa (12) e categorizao (12). No entanto, alguns autores referem-se a
relaes entre conceitos (7) sem especificar qual o tipo de relacionamento. Os resultados
apontam com clareza a influncia da fundamentao terica para o melhor entendimento e
preciso do conceito do objeto a ser representado, fornecendo bases seguras tanto para
estabelecer relacionamentos quanto para a determinao dos termos. A terminologia
representa o aporte terico com o segundo maior nmero de ocorrncias. Conforme
constatado, o tema predominante relatado nos documentos o controle terminolgico (19),
que engloba o controle da polissemia, as estruturas sintticas e semnticas e os termos de
origem mais complexa. Observou-se em muitos trabalhos o interesse em identificar e discutir
os desafios para o desenvolvimento geral de estruturas de conceitualizao, que abrange os
conceitos e as terminologias a fim de melhorar as informaes cruzadas e a representao de
conceitos entre diferentes sistemas usados para fins da recuperao de informaes.
Na categoria lingustica identificou-se os temas sobre significado e significante,
relao de sinonmia, hiponmia, homonmia, hiperonmia, meronmia e equivalncia.
Verificou-se, tambm, que diversos autores mencionam apenas relaes semnticas (23) sem
especificar o tipo de relacionamento. Por outro lado, o nmero de ocorrncias bastante
elevado, merecendo ser destacado, inclusive, se considerados os relacionamentos
especificados nas categorias conceitos e relaes entre conceitos e lingustica. Percebe-se
que a natureza de diferentes relaes semnticas, seu uso apropriado e bem definido podem
ajudar na construo dos SOC consistentes. Finalmente, princpios de classificao foi a
categoria com o menor ndice de ocorrncia, porm no menos significativo. Durante a
anlise, observou-se os fundamentos tericos da teoria da classificao, os princpios da
diviso de classes, das facetas e das hierarquias. O estudo evidenciou a baixa frequncia com
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.
70
que os autores tratam o assunto, mas ao mesmo tempo, alguns autores concordam que o
ncleo das relaes semnticas para todos os SOC a hierarquia.
A anlise dos temas associados aos SOC sugere a tendncia de estudos sobre o
assunto no campo da CI. Web semntica e interoperabilidade aparecem como os temas mais
frequentes, juntamente com as bibliotecas digitais para fins de recuperao de informao. A
folksonomia, por ser tema novo, surpreende pela frequncia de ocorrncia desse tema
relacionado com os SOC. Porm, com a ocorrncia mais baixa, destacam-se cincia da
informao, teoria da informao, softwares para construo de SOC, construo automtica e
semi-automtica de tesauros, rede semntica, bibliometria, abstrao automtica de termos,
mapeamento de diferentes SOC e e-comrcio. As palavras-chave mais usadas pelos autores
so knowledge organization, thesauri, knowledge organization system, knowledge
management e information retrieval. E o caminho terico percorrido para o desenvolvimento
dos SOC passa pela teoria do conceitos, da terminologia, da lingustica, dos princpios de
classificao e com destaque os relacionamentos entre conceitos. Os SOC esto diretamente
relacionados com os temas da web semntica, interoperabilidade entre diferentes sistemas,
recuperao da informao e bibliotecas digitais.
Consideraes finais
Quanto ao objetivo geral proposto pela pesquisa a investigao realizada evidenciou
que os SOC so estruturas sistematizadas que tm no seu desenvolvimento uma relao muito
estreita com os princpios tericos que subsidiam a construo de taxonomias, ontologias e,
principalmente, tesauros e sistemas de classificao. As mudanas so inerentes aos processos
de evoluo. Alguns elementos so agregados enquanto outros se tornam obsoletos,
substitudos ou transformados. Na organizao e representao do conhecimento, no
diferente. Com base no que foi verificado na pesquisa, principalmente, na reviso de literatura,
estima-se que haja uma probabilidade para a tendncia da evoluo, que acontece
naturalmente das linguagens documentrias para os SOC, acrescidos de elementos prprios da
tecnologia moderna para atuar no ambiente web. Outra observao significativa que os SOC,
mesmo empregados no ambiente informatizado, herdam caractersticas no desenvolvimento
de suas estruturas que esto fundamentadas em teorias que os profissionais da informao
testemunham h pelo menos um sculo. Como a influncia dos sistemas de classificao na
construo de outros sistemas, apontada na anlise de contedo. Porm, no simplesmente
uma repetio do passado, uma verso nova, incorporada de linguagens novas, softwares e
ferramentas tecnolgicas, que criam estruturas de elevada representatividade conceitual e
permitem estabelecer ricas e exaustivas redes semnticas. Os SOC so instrumentos que
RICI: R.Ibero-amer. Ci. Inf., ISSN 1983-5213, Braslia, v. 4, n. 2, p. 53-73, ago./dez.2011.
71
72
73