Você está na página 1de 43

UNIVERSIDADE DE BRASÍLIA

Faculdade de Ciência da Informação (FCI)


Disciplina: LINGUAGENS DOCUMENTÁRIAS – Código 182.567
Créditos: 04 - Carga horária : 60 horas/aula
Profª Drª Rita de Cássia do Vale Caribé

Organização do
conhecimento (SOC)
Organização do conhecimento (KO)
• É um campo de pesquisa, ensino e prática ligado
principalmente a Biblioteconomia e Ciência da
Informação
• É sobre descrição, representação, organização e
armazenamento de documentos, representação de
documentos, assuntos e conceitos em programas por
humanos ou máquinas.
• Para isso são desenvolvidas regras e padrões, incluindo
sistemas de classificação, listas de cabeçalhos
de assunto, tesauros e outras formas de metadados.

(HJORLAND, 2016)
Organização do conhecimento
• Processo de modelagem que visa construir representações do
conhecimento.
• Tem por base a análise do conceito e de suas características
para o estabelecimento da posição que cada conceito ocupa
num determinado domínio, bem como das suas relações com
os demais conceitos que compõem um sistema conceitual.
(BRASCHER; CAFÉ 2008,)

• É a ciência que estrutura e organiza sistematicamente


unidades do conhecimento (conceitos) segundo seus
elementos de conhecimento (características) inerentes e a
aplicação desses conceitos e classes de conceitos ordenados a
objetos/assuntos.
(DAHLBERG, 2006)
Organização do conhecimento (KO)
• Núcleo de KO:
▫ Sistemas de classificação
▫ Sistemas de conceitos
• Aspectos principais de KO
▫ Processos de organização do conhecimento (KOP)
 Processos de catalogação; análise de assunto, indexação e
classificação – por humanos ou máquinas
▫ Sistemas de organização do conhecimento (KOS)
 Seleção de conceitos com indicação de relações
semânticas - sistemas de classificação, cabeçalhos
de assunto, tesauros, ontologias e outros sistemas de
metadados
(HJORLAND, 2016)
• Os sistemas de organização e representação que
empregamos na atualidade surgiram por
impulso de uma web que precisava de novas
estruturas para responder a novas necessidades,
o que nos obrigou a adaptar as linguagens
documentárias pré-existentes.
Aplicação da OC Organização do
conhecimento

• Construção de sistemas conceituais – os SOCs são tipos de


sistemas conceituais, tipos de representações do
conhecimento, frutos do processo de organização do
conhecimento
Organização da
informação

• Correlação ou mapeamento de unidades desse sistema


conceitual com objetos da realidade – são aplicados para
mapear objetos informacionais para representar os assuntos
dos documentos num sistema de informação. São
instrumentos utilizados nos processos de classificação e
indexação
(DAHLBERG, 1993; 2006 apud BRASCHER; CARLAN, 2010)
Organização do conhecimento Organização da informação

• Processos de organização • Processos de organização


que se aplicam a que se aplicam às
unidades de ocorrências individuais
pensamento/conhecimen de objetos informacionais
to – conceitos • Organização de objetos
• Visa a construção de informacionais para
modelos de mundo que se arranjá-los
constituem em abstração sistematicamente em
da realidade coleções – organização da
informação em
bibliotecas, museus,
arquivos
Diferença entre
Organização do conhecimento Organização da informação

• Aplica-se a unidades do • Aplica-se a ocorrências


pensamento – conceitos individuais de objetos
• Visa à construção de modelos informacionais
de mundo que se constituem • A organização de um
em abstrações da realidade conjunto de objetos
informacionais para arranjá-
los sistematicamente em
coleções, neste caso temos a
organização em bibliotecas,
museus, arquivos, tanto
tradicionais como
eletrônicos.
(BRASCHER; CARLAN, 2010)
Sistemas de organização de conhecimento

• Termo proposto em 1998 pelo Networked Knowledge


Organization Systems Working Group na Conferência
ACM digital Libraries
• Denominação
▫ Sistemas de organização de conhecimento (SOC)
▫ Knowledge organization systems (KOS)

(BRASCHER; CAFÉ, 2008)


Sistemas de organização de conhecimento -
definições

• São sistemas conceituais que representam determinado


domínio por meio da sistematização dos conceitos e das
relações semânticas que se estabelecem entre eles.
• Amplo conjunto de esquemas para organizar a
informação e facilitar a descrição e descoberta de
recursos de informação.
• São o coração de toda biblioteca, museu, arquivo uma
vez que são mecanismos de organização da informação.
• São instrumentos complementares que ajudam o usuário
a encontrar seu caminho no texto.

(BRASCHER; CAFÉ, 2008; BRASCHER; CARLAN, 2010)


Sistemas de organização de conhecimento -
definições
• Ferramentas semânticas que consistem de termos, conceitos e
relações semânticas definidas e selecionadas.
• Contemplam conceitos e suas relações semânticas, além de
informar o significado dos termos ou símbolos que empregam.
• Na descrição de conteúdo os SOC cumprem a função de
padronizar a representação da informação, no que concerne à
identificação do assunto do documento.
• São representações de domínios do conhecimento que
delimitam o significado de termos no contexto desses
domínios, estabelecem relações conceituais que auxiliam a
posicionar um conceito no sistema conceitual e são utilizadas
como instrumentos de organização e recuperação da
informação.
(BRASCHER; CAFÉ, 2008; BRASCHER; CARLAN, 2010)
Sistemas de organização de conhecimento - definições

• É um conjunto de elementos, geralmente


estruturado e controlado, que pode ser usado
para descrever (indexar) objetos, navegar em
coleções etc.
• Exemplos típicos são:
▫ tesauros,
▫ classificações,
▫ listas de cabeçalhos de assunto,
▫ taxonomias

(SKOS, 2004 apud BRASCHER; CARLAN, 2010)


KOS ou SOC
São sistemas conceituais que representam determinado domínio por
meio da sistematização dos conceitos e das relações que se estabelecem
entre eles.
Organização do conhecimento Organização da informação
• São tipos de representação do • Aplicados para mapear objetos
conhecimento, frutos do informacionais, para
processo de organização do representar assuntos dos
conhecimento documentos num sistema de
• São tipos de sistemas informação
conceituais • São mecanismos de
organização da informação
• São instrumentos utilizados
nos processos de classificação
e indexação
• Qualidade na recuperação vai
depender destes sistemas
KOS ou SOC
• São esquemas que organizam, gerenciam e
recuperam informação.
• Objetivo:
▫ Padronização da terminologia adotada para
organização e recuperação de informações, ao
delimitar o uso de termos e definir conceitos e
relações de alguma área do conhecimento, de
forma compartilhada e consensual.
(BRÄSHER; CAFÉ , 2008)
Sistemas de organização de conhecimento
Objetivos
• prover uma mapa semântico para domínios individuais e para os
relacionamentos entre domínios, fornecendo orientação e servindo como
um instrumento de referência;
• melhorar a comunicação e o ensino;
• prover uma base conceitual para a boa execução da pesquisa e
implementação;
• prover classificação para a ação, isto é, o uso prático dos SOC em diferentes
atividades profissionais, tais como a classificação de doenças para
diagnósticos médicos e de mercadorias para o comércio;
• apoiar a recuperação da informação;
• prover uma base conceitual para sistemas baseados em conhecimento e
• para a definição de elementos de dados e hierarquias de objetos na
engenharia de software,
• servir como um dicionário mono, bi ou multilíngue para uso pelo homem ou
por sistemas automáticos de processamento da linguagem natural.

(BRASCHER; CAFÉ, 2008)


KOS ou SOC
• A base dos modernos SOCs são termos e a
indicação de relacionamentos entre eles
• Podem ser
▫ Mais simples - índices e sumários de livro
▫ Mais complexos - assumem funções mais amplas,
surgindo novas denominações
 Taxonomias, categorizações, tesauros, ontologias.
 Dicionários, glossários, redes semânticas, slots e
frames (representações do conhecimento usadas na
inteligência artificial), mapas conceituais e listas de
termos.
Conceito de SOC
Conceito amplo – predominante Conceito restrito
• Amplo conjunto de esquemas • Sentido específico da palavra,
para organizar a informação e como ferramentas semânticas
facilitar a descrição e que consistem de palavras
descoberta de recursos de conceitos e relações
informação semânticas, definidas e
selecionadas
(SHIRI; MOLBERG, 2005) (BROUGHTON et al, 2004)
Conceito de SOC
• Os SOCs são ferramentas que apresentam a
interpretação organizada de estruturas de
conhecimento, também chamadas ferramentas
semânticas.
• Essas ferramentas contemplam conceitos e suas
relações semânticas, informam o significado do
termo ou símbolo que utilizam.
• Devem cumprir a função de instrumentos de
organização e recuperação da informação.
(HJORLAND, 2008)
Evolução histórica dos SOCs
1. Era da pré-coordenação:
▫ os SOCs eram estruturas estáticas e atendiam às necessidades dos sistemas manuais
de organização e recuperação da informação, como índices e catálogos.
▫ Exemplos - as listas de cabeçalhos de assunto e as classificações.
2. Era da pós-coordenação:
▫ os SOCs tornam-se mais dinâmicos e possibilitam que cada um de seus elementos
(termos) sejam manipulados de forma independente para representar os assuntos
de cada documento.
▫ Exemplos - vocabulários controlados (listas de termos autorizados para uso na
indexação e recuperação da informação) e tesauros.
3. Era da Internet:
▫ os SOCs que se destacam são as classificações hierárquicas que orientam o usuário
na escolha do termo que melhor expressa sua questão de busca; os elos
estabelecidos por meio de URL entre itens da Web e os índices das ferramentas de
busca, compostos de palavras extraídas dos conteúdos dos objetos informacionais.
4. Era da Web Semântica:
▫ os SOCs dessa era diferenciam-se dos demais por serem projetados para uso por
agentes inteligentes.
▫ Principal exemplo são as ontologias.
(VICKERY, 2008)
SOC
• Englobam todos os tipos de instrumentos usados para
organizar a informação e promover o gerenciamento do
conhecimento.
• Incluem:
▫ Esquemas de classificação - organizam materiais em
nível geral como livros nas estantes.
▫ Cabeçalhos de assunto - provê acesso mais detalhado.
▫ Listas de autoridades - controlam versões variantes
de chaves de acesso à informação (nomes geográficos e
de pessoas)
▫ Esquemas menos tradicionais - redes semânticas e
ontologias
(HODGE, 2000)
Tipos de SOCs

SOCs são agrupados em 3 categorias

• Listas de termos
• Classificações e categorias
• Listas de relacionamentos

(HODGE, 2000)
Tipos de SOCs

Listas de termos
• Englobam listas de termos geralmente acompanhados de suas
definições
▫ Listas de autoridades – listas de termos que controlam as variações de nomes
para entidades, nomes de países, indivíduos ou instituições.
 Ex. http://www.senado.gov.br/sf/Biblioteca/rvbi/VCb_AUTR.asp
▫ Glossários: lista de termos com definições, geralmente de assunto ou domínio
específico
 Ex. http://www.bcb.gov.br/?glossario
▫ Dicionarios: lista alfabética de palavras e suas definições. Seu escopo é mais
geral que os dos glossários
 Ex. http://www.dicionariodoaurelio.com
▫ Gazetteers: dicionário de nomes de lugares e acidentes geográficos, tais
como cidades, rios, vulcões. Quando georeferenciados, os gazetteers
apresentam as coordenadas para a localização dos lugares da Terra
 Ex. http:// https://www.arcgis.com/home/item.html?
id=346ce13fa2d4468a9049f71bcc250f37
(HODGE, 2000)
Tipos de SOCs

Classificações e categorias
• Reúnem SOCs que enfatizam a criação de classes de
assuntos
▫ Cabeçalhos de assunto – conjunto de termos controlados que
representam os assuntos de uma coleção
 Ex. http://memory.loc.gov/hlas/portugues/assuntos.html
▫ Esquemas de classificação, taxonomias e esquemas de
categorização – esquemas utilizados para agrupar entidades
em classes mais gerais.
 Os esquemas de categorização são geralmente usados para reunir
os termos de tesauros em tópicos.
 As taxonomias são usadas em modelos orientados a objeto e em
sistemas de gestão do conhecimento, para indicar grupos de
objetos baseados em características particulares
 http://www.google.com.br/dirhp (HODGE, 2000)
Tipos de SOCs

Listas de relacionamentos
• Agrupam SOCs que privilegiam a conexão entre termos e
conceitos
▫ Tesauros – conjunto de termos que representam conceitos e as
relações de equivalência, hierárquicas e associativas que se
estabelecem entre eles
 Ex. http://cnfcp.gov.br/tesauro/
▫ Redes semânticas – estrutura de conceitos e termos em forma de
rede ou teia, s conceitos são nós e os relacionamentos expandem-
se a partir dos nós.
 Ex. http://wordnetweb.princeton.edu/
▫ Ontologia – estrutura de conceitos e representação dos
relacionamentos complexos entre eles, incluindo regras de
inferência e axiomas
▫ Ex. http://wiki.musicontology.com/index.php/Main Page(HODGE, 2000)
• Os diferentes tipos de SOCs vão variar de acordo
com as características
• Nível de complexidade da estrutura
• Aproximação ou distanciamento da linguagem
natural
Tipos de SOCs
Quanto ao nível de complexidade da estrutura e quanto maior ou menor
aproximação com a linguagem natural

Ontologias
Grupos de relacionamento
Estrutura

Redes Semânticas
Tesauros
forte

d e
ida Esquemas de classificação

l ex
Classificação e Categorização
Taxonomias
p Esquemas de Categorização

o m Cabeçalhos de assunto
CAnéis de sinônimos
Listas de autoridades
Estrutura

Lista de termos Glossários/Dicionários


Gazetteers
fraca

Linguagem natural Linguagem controlada


(ZENG; SALABA, 2005 apud BRASCHER; CARLAN, 2010)
Listas de termos – conjunto de termos
organizados de acordo com um critério:
alfabético; ou uma forma lógica evidente.
Lista em ordem alfabética Lista lógica simples
• Alabama • Mercúrio
• Alaska • Vênus 
• Arkansas • Terra 
• California • Marte Distância do
• • sol
Connecticut Júpiter
• Delaware • Saturno
• Urano
• Netuno
• Plutão
Anéis de sinônimos
• Conjunto de termos que são
considerados equivalentes para
o propósito de recuperação
• Não podem ser utilizados no
processo de indexação
• São usados na interface em
sistemas de eletrônicos de
informação, provendo acesso ao
conteúdo que está representado
em linguagem natural,
vocabulário não controlado.
Questionamentos quanto a inclusão de:

• Listas de autoridade
▫ não contemplam a representação em nível conceitual;
▫ são instrumentos que têm por essência a padronização
de vocabulário;
▫ não constituem representações do conhecimento.
• Dicionários, glossários e gazetteers
▫ delimitam conceitos;
▫ apresentam alguns tipos de relações conceituais, como
as relações de equivalência e associativas;
▫ não são instrumentos elaborados com os objetivos de
organização e recuperação de informações.
(BRASCHER; CARLAN, 2010)
Retomando o conceito de SOC
• São representações de domínios do
conhecimento que delimitam o significado de
termos no contexto desses domínios.
• Estabelecem relações conceituais que auxiliam a
posicionar um conceito no sistema conceitual.
• São utilizadas como instrumentos de
organização e recuperação de informação.
Com base neste último conceito
• Alguns tipos listados não podem ser considerados SOC
• Não contemplam a representação em nível conceitual
• Objetivo é apenas a padronização de vocabulário e não constituem
representação de conhecimento

• Listas de termos geralmente acompanhados de suas definições


▫ Listas de autoridades – listas de termos que controlam as variações de nomes para entidades,
nomes de países, indivíduos ou instituições.
1º tipo  Ex. www.senado.gov.br/sf/Biblioteca/servicos/VCb AUTR.asp – não confere procurar
de SOC▫ Glossários: lista de termos com definições, geralmente de assunto ou domínio específico
 Ex. http://www.bcb.gov.br/?glossario
de ▫ Dicionarios: lista alfabética de palavras e suas definições. Seu escopo é mais geral que os dos
Hodge glossários
 Ex. http://www.dicionariodoaurelio.com
▫ Gazetteers: dicionario de nomes de lugares e acidentes geográficos, tais como cidades,
rios, vulcões. Quando georeferenciados, os gazetteers apresentam as coordenadas para a
localização dos lugares da Terra
 Ex. http://www.world-gazetteer.com/ (HODGE, 2000)
Conceito de SOC

• É um conjunto de elementos, geralmente


estruturado e controlado, que pode ser usado
para descrever (indexar) objetos, navegar em
coleções etc.
• Exemplos:
▫ Tesauros
▫ Classificações
▫ Listas de cabeçalhos de assunto
▫ Taxonomias
(SKOS, 2004)
Função do SOC

• Auxílio à recuperação da informação


• Fornece uma base de conhecimento para o
usuário que apóia a busca
▫ Menus em árvores
▫ Busca por facetas
▫ Cadeias hierárquicas que orientam a navegação
▫ Mapeamento de termos de busca por meio da
cadeia hierárquica
▫ Orientam a ordenação de resultados de busca
(SOERGEL, 1999)
Função dos SOC
• Explicitar o conhecimento de um domínio
• Possibilitam
▫ A indexação, organização e recuperação de
informações
▫ A construção de mapas de conhecimento
▫ Navegação para busca de informação
▫ Criação de novo conhecimento a partir do
existente

(VICKERY, 2008)
Função dos SOC
• As relações semânticas em SOC auxiliam:
▫ Busca genérica
▫ Busca específica
▫ Arranjo sequencial
▫ Escolha de termos de busca

(VICKERY, 2008)
Função dos SOC em ambiente digital
• Shiri e Molberg (2005) – provê várias
perspectivas de uma coleção no ambiente digital
• Hodge (2000) – estabelecer elos digitais e entre
esses e objetos físicos – em museus e exposições
Função dos SOC - resumo
• Padronização da representação dos conteúdos
dos documentos
• Recuperação da informação
• Orientam e auxiliam o usuário quanto a
localização de conteúdos

(VICKERY, 2008)
Elementos que compõem os SOC
• Conceitos – construções mentais que servem
para classificar os objetos individuais do mundo
exterior ou interior através de um processo de
abstração mais ou menos arbitrário
• Termos
• Relações entre conceitos
Elementos que compõem os SOC – (contorno
em vermelho)
Instrumento de
Termo – representa o conceito percussão cujo som é
Agogô extraído por uma vareta
de metal percutida no
corpo do instrumento,
Definiçã que é constituído por
Rótulo
o duas campânulas de
metal de tamanhos
diferentes
Relações
Conceito entre os
termos
SOC
Tem papel crucial para definição
dos conceitos
Relações conceituais ou semânticas
• As relações são estabelecidas por meio da análise
das características ou propriedades dos
conceitos, permitem identificar diferenças e
semelhanças que evidenciam determinados tipos
de relacionamentos
• O conceito está relacionado ao domínio – as
relações podem variar de acordo com o domínio
Leite As relações associativas variam de acordo com o domínio

Para a biologia Para a química


• Líquido secretado pelas • Mistura complexa constituída
glândulas mamárias das de substâncias orgânicas e
fêmeas dos mamíferos, um inorgânicas, na qual
pouco antes e, principalmente, encontramos água, gordura,
após o parto carboidrato, proteínas, sais
• Relações associativas minerais, vitaminas, certas
▫ Mamífero enzimas e gases.
▫ Glândulas mamárias • Relações associativas
▫ Fêmea ▫ Substância orgânica
▫ ...
Tipos de SOC
• Já sabemos que os SOC são formados por três
elementos principais
▫ Conceitos
▫ Termos
▫ Relacionamentos
• Os tipos de SOC vão variar de acordo como esses
elementos são tratados

Você também pode gostar