Escolar Documentos
Profissional Documentos
Cultura Documentos
UNIVERSIDADE DE BRASÍLIA
Faculdade de Ciência da Informação (FCI)
Disciplina: LINGUAGENS DOCUMENTÁRIAS – Código 182.567
Créditos: 04 - Carga horária : 60 horas/aula
Profª Draª Rita de Cássia do Vale Caribé
LINGUAGEM NATURAL
E LINGUAGENS
DOCUMENTÁRIAS
Análise documentária
• É o conceito genérico de processo documental que pode
ser descrito em três níveis de complexidade crescente:
▫ Extração de palavras-chave – palavras naturais, não
transformadas – do título ou do corpo do documento.
▫ Indexação – análise feita com a ajuda de descritores que
diferentemente das palavras-chave naturais são palavras
que simbolizam os conceitos organizados em um léxico
documentário tais como as linguagens documentárias
hierárquicas e/ou facetadas.
▫ Constituição de resumo – construção de texto novo,
podendo ser indicativo dos temas essenciais ou detalhado.
(DODEBEI, 2002)
• Todos os sistemas de organização intelectual da
informação têm uma base comum e esta é a
classificação (GROLIER, 1962)
• Classificar é o processo de tradução do nome de
um determinado objeto da linguagem natural
para uma linguagem classificatória
(RANGANATHAN, 1951)
Confusão terminológica
• Processo de classificação de um objeto em um campo
conceitual mediante a atribuição de um rótulo
• Rótulo pode ser:
▫ Um assunto
▫ Um termo/descritor
▫ Uma notação
• A confusão terminológica se deve a incapacidade de
distinção entre as etapas de análise conceitual e de
tradução na indexação
(LANCASTER, 1993)
5
Linguagem
O termo tem várias acepções de acordo com os contextos
em que aparece:
Linguagem natural
• Formada pela reunião de sinais utilizados e
reconhecidos facilmente pelo homem.
• Tipos de sinais empregados pelo homem para se
comunicar com outros homens e para expressar
suas ideias:
▫ Fala
▫ Gestos
▫ Olhares
▫ Palavra escrita
8
Linguagem natural
• A linguagem natural faz parte do modelo
comunicacional aberto, no qual a mensagem
varia conforme os códigos.
• É a linguagem utilizada nas necessidades da vida
diária
9
Linguagem natural
• Pressupõe nuances, associação de ideias, expressão de
emoções e de valores.
• São adaptadas a formas de comunicação oral ou escrita
• Estabelece com o interlocutor uma forma de diálogo
• Neste diálogo o tempo e o espaço tem papel importante
10
• Definição:
• refeição ou passeio que se realiza
em local aberto,
• cada pessoa se responsabiliza por
um tipo de comida,
• dividindo sua refeição com o
restante dos participantes.
11
Linguagem natural
• Apresenta características que dificulta sua
utilização para o tratamento da informação.
• Os sistemas de informação que empregam a
linguagem natural utilizam as descrições
fornecidas pelos autores como os títulos, os
resumos, os extratos do texto ou o texto integral
que são registradas e depois comparadas com as
perguntas feitas ao sistema.
12
(DAHLBERG, 1978)
13
Linguagens documentárias
• O conceito, as funções e as metodologias de
elaboração das LD foram evoluindo ao longo do
tempo
• Diferentes vertentes atribuem diferentes
denominações a estes instrumentos.
(VOGEL, 2007)
Linha francesa
(VOGEL, 2007)
Linha francesa
Denominação Abrangência
Linguagem informacional Sistema que leva informação dos documentos aos usuários
Meio de comunicação
Linguagem de indexação Indexação de informações
(VOGEL, 2007)
21
Linguagens documentárias
• Conceito – sistema artificial de signos
normalizados que facilitam a representação
formalizada do conteúdo dos documentos para
permitir a sua recuperação, manual ou
automática, da informação solicitada pelo
usuário.
(VOGEL, 2007)
Linha brasileira
(VOGEL, 2007)
Linha brasileira
Linguagem documentária
• É uma lista de termos autorizados
• Inclui uma forma de estrutura semântica
• Estrutura semântica objetiva:
▫ Controlar sinônimos – opta por uma única forma
padronizada, com remissivas para as outras
formas
▫ Diferenciar homógrafos – Peru (país) Peru (ave)
▫ Reunir ou ligar termos cujos significados
apresentem uma relação mais estreita entre si
Relações hierárquicas
Relações não-hierárquicas (associativas)
Características das linguagens
documentárias
• Linguagem construída – metalinguagem
• Sistema de representação sintético para
representar o conteúdo de documentos
• Ponte entre os documentos e os usuários
(VOGEL, 2007)
(DODEBEI, 2002)
LD – estrutura – domínio
UNIVERSAL x ESPECIALIZADO
• A classificação tradicional de LD isolava dois
atributos, até então antagônicos:
▫ Universal – corresponde a reduções da totalidade
do conhecimento
Classificações bibliográficas universais, os
macrotesauros, as listas de cabeçalhos de assunto –
construídos com base nas classificações universais
▫ Especializada – corresponde à totalidade de um
domínio do conhecimento
Os tesauros, as classificações e listas de assuntos de
um domínio específico
(DODEBEI, 2002)
LD – estrutura - domínio
• Do ponto de vista da condição hierárquica a
dicotomia universo/espécie é verdadeira
(DODEBEI, 2002)
LD – estrutura - domínio
• Do ponto de vista das redes de relações associativas ou
sintagmáticas, a totalidade/especialidade fica
comprometida, pois não se consegue analisar um aspecto
do conhecimento sem envolvê-lo com as circunstâncias
nas quais ele ocorre.
• O modelo enciclopédico seria o mais adequado.
▫ Neste modelo há um conjunto não ordenado, situacional e
pragmático
▫ A enciclopédia supõe uma moldura ou um roteiro local que
parte de um recorte temático e vai articulando os
significados em uma rede rizomática
▫ Ex. casa implica não somente a moradia, mas de que é
feita, quem a habita, em que espaço geográfico – uma rede
de associações infinita
(DODEBEI, 2002)
LD – estrutura - objeto
• As linguagens documentárias podem estruturar-
se:
▫ Por conceitos – abstrações de objetos
representados por um símbolo da linguagem
natural, de caráter unívoco e restrito
▫ Por assuntos – representação da soma de vários
conceitos
(DODEBEI, 2002)
LD – estrutura - objeto
• A noção de conceito como unidade estrutural das
linguagens documentárias surge com a proposta
de Ranganathan, seguida por Sayers, Bliss, Mills
e os trabalhos do Classification Research Group,
culminando na atualidade, com um campo de
estudos denominado Organização do
conhecimento.
• A base teórica repousa:
▫ Teoria da Terminologia de Eugene Würster
▫ Teoria analítica do conceito de Ingetrat Dhalberg
(DODEBEI, 2002)
LD – estrutura - objeto
• As estruturas que se formam por relações conceituais e não por relações de
assunto são as linguagens documentárias pós-coordenadas. Ex. as
classificações facetadas e os tesauros
• Dimensão de uma organização – é a natureza das relações, analíticas,
paradigmáticas que a constituem ou seja, da relação dos termos à classe a
que pertencem
▫ Unidimensional
estrutura-se em uma só dimensão.
Ex. sistemas taxonômicos das ciências naturais – uma só relação informa todos
os níveis: reino classe subclasse ordem subordem família gênero
espécie nome comum
CDD
▫ Pluridimensionais
Estrutura-se em mais de uma dimensão
Reúne as organizações semânticas (essência, definições) e as sintáticas
(acidentes funções) e são denominadas classificações facetadas
▫ Mistas
Alternam os pontos de vista essenciais e funcionais
São os esquemas analítico-sintéticos
Ex. CDU
(DODEBEI, 2002)
LD – estrutura - objeto
(DODEBEI, 2002)
LD – estrutura - ordem
MULTIPLICIDADE DE ORDENS
(DODEBEI, 2002)
Linguagens documentárias - estrutura
• Léxico de noções ou conjunto de termos
• Sistema estrutural de relações
• Conjunto de regras e símbolos
• Hipótese para a organização dos termos
(organização da informação)
• Parâmetros linguísticos e terminológicos como
base da organização dos termos
(VOGEL, 2007)
52
(DODEBEI, 2002)
LD - Funções
55
(DODEBEI, 2002)
LD - Funções
56
(DODEBEI, 2002)
LD - Funções
58
Diferenças entre LN e LD
Linguagem natural Linguagem documentária
Gramática modelável no tempo e no Gramática rigorosamente definida,
espaço inalterável no tempo
Palavras são polissêmicas (podem Termos são monossêmicos
comportar vários sentidos) (univocidade)
Irregularidade e variação Regularidade e constância
Função básica – expressão e Função básica: representação
comunicação