Você está na página 1de 26

CURSO

MESTRADO EM CINCIA DA
INFORMAO
Unidade Curricular:
Anlise de Contedo e Indexao
FEUP/FLUP
2007-2008

Anlise de Contedo e Indexao


INDEXAO (em sentido lato) = elaborar ndices
NDICE - instrumento de referncia; guia; instrumento de

acesso informao
Exemplos:
catlogos em fichas
catlogos em forma de livro
catlogos automatizados
bibliografias
ndices de fim de livros
boletins bibliogrficos
sistemas com fichas uniterm ou com fichas peek-a-boo
bases de dados e bancos de dados
... ... ...

Anlise de Contedo e Indexao


Elementos constitutivos dos ndices:

rubrica (cabealho, ponto de acesso)

referncia (conduz ao documento ou informao)

informao (geralmente de tipo bibliogrfico)


De acordo com o contexto em que se insere o ponto de acesso de um

ndice, podem-se distinguir duas categorias:

ndices independentes

ndices dependentes
NDICES

ndices independentes

Vantagens

consulta a um s tempo
(mais rpido e mais
agradvel)

mnimo de espao; facilidade de elaborao; no


limitao do n de entradas

referncias extensas (mais


espao); necessidade de
limitar o n de entradas

consulta em 2 tempos
(mais moroso; cria
relutncia)

Inconvenientes

ndices dependentes

Anlise de Contedo e Indexao


INDEXAO - operao que consiste em descrever e caracterizar um

documento, com a ajuda da representao dos conceitos nele contidos,


ou seja, transcrever em linguagem documental esses conceitos, aps tlos extrado do documento, atravs de uma anlise
(In : Principes dIndexation / UNISIST)
Da definio de indexao pode-se inferir que:
- indexar implica um processo de anlise
- na informao existem conceitos (ideias), que na indexao so

representados atravs de uma linguagem documental* (as rubricas, os


pontos de acesso) [* hoje linguagem de indexao]

Acrescentamos ainda:
- a indexao tem uma finalidade: possibilitar a pesquisa eficaz da

informao
- a pesquisa faz-se atravs de uma linguagem de indexao (registada
nos instrumentos de apoio indexao) e pressupe tambm a
indexao da pergunta

Anlise de Contedo e Indexao


FASES DA INDEXAO
1 - Reconhecimento / Identificao dos conceitos
2 - Representao dos conceitos

Conceito Termo de indexao


Palavra-chave
{Descritor
{No-descritor
{Notao de uma classificao
Termo de indexao - a expresso vocabular que
traduz o conceito; pode ser simples ou composto

Anlise de Contedo e Indexao


1 FASE DA INDEXAO - Reconhecimento / Identificao dos

conceitos
a fase essencial. Pressupe, antes de mais, a anlise do
contedo informacional.
A anlise requer o estabelecimento de uma metodologia (ver NP-3715).
- apreenso do contedo informacional
- identificao dos conceitos que representam esse contedo
- seleco dos conceitos considerados relevantes para possibilitar a
recuperao da informao
A apreenso do contedo e a identificao dos conceitos diferem
de acordo com o cdigo em que a informao est registada. A informao textual (documentos escritos) possui determinados elementos
que ajudam a fazer a anlise do contedo e permitem mais facilmente
estabelecer mtodos e grelhas de anlise. A informao no textual
(documentos no escritos) requer procedimentos especficos e, muitas
vezes, implica o recurso a fontes de referncia exteriores ao prprio
contedo em anlise.

Anlise Documental
ANLISE POR FACETAS
(metodologia aplicvel identificao dos conceitos)
Exemplos:
(Domnio)
"Questes Sociais / Sociologia"

Crianas

Faceta "Pessoas"
Mulheres

Emigrantes

etc.

Faceta "Problemas"

Doenas mentais
Marginalidade
Solido
Pobreza
etc.

Anlise Documental
(Domnio) - "Arquitectura"
Edifcios de pedra
Igrejas
Faceta "Edifcios"
Castelos
Edifcios de madeira
Edifcios gticos
Escolas
Casas
etc.
(A partir da faceta "Edifcios podem-se organizar subfacetas)

Faceta "Elementos
estruturais"

Alicerces
Janelas
Abbadas
Contrafortes
Claustros
etc.

Anlise de Contedo e Indexao

Factores que influenciam a seleco dos conceitos:


- perfil do utilizador
- caractersticas do conjunto bibliogrfico
- caractersticas do servio
- produto que vai ser elaborado
A indexao deve adaptar-se sua funo. Essa
adaptao pode ser vista segundo dois parmetros:
a exaustividade e a especificidade

A exaustividade, a especificidade, a uniformidade, a


pertinncia so factores que condicionam a qualidade da
indexao. A estes factores juntam-se, como condicionantes da
qualidade da indexao, as prprias qualidades pessoais e
profissionais do indexador.

Anlise de Contedo e Indexao


Anlise do contedo informacional Casos prticos

O aproveitamento do trapo em pequenas


indstrias da regio de Coimbra. Referncia especial
s mantas de farrapo de Almalagus e ao fabrico do
papel na Lous e sua representao na feira da
Confederao das Indstrias de Coimbra (CIC/86).

A classificao das cincias ao longo da histria


da Filosofia e a sua influncia nas classificaes
bibliogrficas. A classificao de Francis Bacon e a
classificao bibliogrfica de Brunet. A aplicao da
CDU nos Servios de Documentao da
Universidade do Minho.

Anlise de Contedo e Indexao


Anlise do contedo informacional Casos prticos
O turismo no Algarve. Os transportes em geral e os

transportes martimos em especial. Infraestruturas


hoteleiras. O factor climtico. A cooperao com
empresas tursticas britnicas.
A abertura da auto-estrada da Amaznia e o

problema da transferncia das populaes


autctones. A contestada aco da FUNAI em prol
do ndio brasileiro. Em apndice um estudo sobre a
presena do ndio guarani na literatura brasileira.
(FUNAI - Fundao de Apoio ao ndio)

Anlise de Contedo e Indexao


2 FASE DA INDEXAO - Representao dos conceitos

A representao dos conceitos faz-se atravs da

linguagem de indexao e com auxlio dos instrumentos de


indexao nos quais ela est registada.
Linguagem de indexao:
- uma condensao e simplificao da linguagem natural
- uma linguagem convencional, controlada, intermediria
entre a informao e o utilizador
- um sistema de representao do contedo informacional e das perguntas do utilizador, destinado a facilitar a
pesquisa da informao
- formada por um conjunto de termos de indexao, cuja
organizao lgica ou apresentao ordenada varia conforme o
tipo de linguagem utilizado

Anlise de Contedo e Indexao

O recurso linguagem de indexao uma necessidade que decorre das


caractersticas da prpria linguagem natural.
Na linguagem natural existem relaes implcitas entre palavras e termos:
1 - relaes de equivalncia
2 - relaes de hierarquia
3 - relaes de associao

Relaes de equivalncia
Exemplos:
termo antigo / termo actual
termo vulgar / termo erudito
termo corrente / termo cientfico
sinnimos
quase sinnimos

Relaes de hierarquia
Exemplos:
gnero / espcie
todo / parte

Relaes de associao
Exemplos:
escola / professor / aluno
feira / mercado
indstria / fbrica / produto industrial

aougue / talho
dor de cabea / cefaleia
sal / cloreto de sdio
pastelaria / confeitaria
casa / edifcio de habitao
legumes / alface, agrio
Portugal / Algarve / Faro

Anlise de Contedo e Indexao


Caractersticas da linguagem de indexao:
- um vocabulrio controlado, formado por um

conjunto limitado de termos que se impe normativamente


- est registada num instrumento de apoio para o
indexador e para o utilizador
- constituda pelos termos usados na indexao
(termos preferenciais) e pelos no usados (no
preferenciais), que remetem para os adoptados
[relaes de equivalncia]
- apresenta, de forma explcita, relaes semnticas
de tipo hierrquico e de tipo associativo, o que lhe d
a forma de um vocabulrio estruturado

Anlise de Contedo e Indexao


Elementos constitutivos da linguagem de indexao:
- termos que constituem ponto de acesso informao
- termos no preferenciais, que no so ponto de acesso

informao e que remetem para os preferenciais


- relaes entre os termos de indexao
- notaes (smbolos)
- notas de aplicao
- elementos de sintaxe (abreviaturas, sinais grficos, ...
que permitem explicitar as relaes entre os termos de
indexao)
- grficos (esquemas, representaes grficas) que
ajudam a visualizar as relaes entre os termos de
indexao

Anlise de Contedo e Indexao


Noes essenciais:
- Coordenao relao sintctica entre os vrios

conceitos que constituem o contedo informacional


- Controlo de autoridade processo que permite
manter consistncia nos pontos de acesso, atravs
da ligao a um ficheiro (ou lista) de autoridade,
constitudo pelo conjunto dos registos de autoridade
- Termo autorizado ponto de acesso informao, que integra um vocabulrio de indexao
controlado e que representa univocamente um
conceito

Anlise de Contedo e Indexao


Tipos de linguagem de indexao

Pr-coordenadas

linguagens categoriais / classificaes


tabelas de classificao
(coordenao no momento
da indexao)

Ps-coordenadas
linguagens combinatrias
tesauros, listas estruturadas
(coordenao no momento
da pesquisa)

Linguagens categoriais - os assuntos encontram-se organizados

logicamente, numa estruturao feita a priori (pr-coordenao), ou


seja, independente do contedo informacional; nesses quadros
lgicos que o indexador tem de encaixar os assuntos extrados da
informao
Linguagens combinatrias - so formadas por termos soltos, extrados
da linguagem natural, susceptveis de variadas combinaes a
posteriori (ps-coordenao), decorrentes do contedo informacional

Anlise de Contedo e Indexao


LINGUAGEM CATEGORIAL
- princpio da classificao
- os assuntos so integrados numa estrutura rgida que constitui

o universo dos conhecimentos


- este universo est organizado numa estrutura fixa e dividido
em classes e subclasses - plano de classificao
- cada rubrica do plano de classificao identifica um assunto
(da informao ou da pergunta)
- as rubricas so exclusivas e quanto construo so
hierarquizadas; as relaes hierrquicas no podem alteradas
sem modificar a indexao dos contedos j tratados
- um plano de classificao baseia-se na lgica aristotlica e
dedutivo (do geral para o particular)

Anlise de Contedo e Indexao


- indexar com uma linguagem categorial significa: identificar o

assunto principal; atribuir-lhe a notao mais adequada a esse


assunto
- na pesquisa: procura na estante (arranjo sistemtico); procura
no catlogo sistemtico
- um assunto indexado pode encontrar-se em todas as rubricas
de classificao de uma mesma hierarquia (hierarquicamente
superiores)
Exemplo: A alimentao dos gatos com produtos de conserva
Notao da CDU - 599.742.7:613.2:664.8 (1 s ponto de
acesso)
Pesquisa:

Animais
- Mamferos
-- Gatos
---Alimentao dos gatos
---- Alimentao dos gatos com conservas

Anlise de Contedo e Indexao


LINGUAGEM COMBINATRIA
- princpio combinatrio
- os assuntos so analisados e representados em conceitos,

cuja evoluo caracteriza a evoluo dos conhecimentos


- os conceitos so reunidos num tesauro, com uma estrutura
flexvel, que se destina mais pesquisa do que fixao de
relaes entre os termos de indexao
- cada rubrica identifica um conceito (da informao ou da
pergunta)
- as rubricas so exclusivas e quanto construo so
independentes entre si; as relaes existentes entre elas
podem facilmente ser alteradas sem modificao da indexao
j feita
- um tesauro constri-se pela via indutiva e analtica
(levantamento de termos a partir da realidade)

Anlise de Contedo e Indexao


- indexar com uma linguagem combinatria significa: identificar os

conceitos; represent-los pelos termos de indexao mais


adequados
- na pesquisa: procura no catlogo ideogrfico, em todos os termos
de indexao representativos dos vrios conceitos e combinao
dos mesmos
- um documento indexado pode-se encontrar em todas as
combinaes dos seus conceitos
Exemplo: A alimentao dos gatos com produtos de conserva
Termos de indexao - Alimentao / Gatos / Conservas (3 pontos
de acesso)
Pesquisa:

Alimentao / Gatos / Conservas


Alimentao / Gatos
Alimentao / Conservas
Conservas / Gatos
Alimentao
Conservas
Gatos

Anlise de Contedo e Indexao


LINGUAGENS CATEGORIAIS - Classificaes
Tipos de classificaes:
- Enumerativas - enumeram todos os assuntos

possveis, integrados em quadros lgicos


(normalmente hierrquicos); teoricamente, o tema de
qualquer contedo pode ser encontrado nesta
enumerao
- Facetadas - h uma enumerao genrica, apenas;
a notao compe-se para poder exprimir os
assuntos da informao, os quais no se encontram
pr-determinados

Anlise de Contedo e Indexao


Linguagens categoriais
Vantagens:
- permitem uma arrumao sistemtica dos

documentos (livre acesso);


- permitem a organizao de catlogos sistemticos,
onde a pesquisa pode ser feita a partir de questes
genricas para as mais especficas;
- revelam uma grande preciso semntica;
- constituem um elemento disciplinador do esprito,
quer do indexador, quer do utilizador

Anlise de Contedo e Indexao


Linguagens categoriais
Inconvenientes:
- os quadros lgicos envelhecem; eles traduzem momentos;

revelam o estado do conhecimento numa determinada poca;


- revelam, muitas vezes, particularidades de espao, tendncias
de carcter geogrfico, falta de universalidade;
- tm notaes extensas e complicadas, sobretudo se se procura muita especificidade
- suscitam uma relutncia por parte do utilizador, que no
encontra o que necessita numa s abordagem;
- as revises so caras e morosas, carecendo de patrocnios e
de especialistas;
- revelam grande unidimensionalidade, fixando a informao a
uma nica notao; no esto abertas s combinaes pedidas
pelo utilizador.

Anlise de Contedo e Indexao

Linguagens combinatrias
Vantagens:
- no tm quadros fixos, o que permite a introduo de novos termos;
- no existem imposies de carcter geogrfico; os vocabulrios so,
em geral, sectoriais, relativos a reas especializadas;
- no necessitam de notaes; esto muito prximas da linguagem
natural, o que anula a relutncia do utilizador;
- a pesquisa fcil e directa (uma s abordagem);
- no obrigam a revises de fundo e, as que so necessrias no
implicam com a indexao j feita nem com a organizao do sistema
de informao;
- lidam com conceitos, unidades isoladas do pensamento, que se
podem combinar na pesquisa; tm, pois, em conta a
multidimensionalidade dos contedos e dos interesses dos utiliza-dores

Anlise de Contedo e Indexao


Linguagens combinatrias
Inconvenientes:
- no contemplam o aspecto prtico da arrumao

dos documentos, pois no permitem a colocao


sistemtica;
- nos catlogos, no organizam hierarquicamente os
conhecimentos, dando acesso directo ao conceito
pesquisado;
- fazem correr riscos de ambiguidade, por falta de
preciso semntica (a criao de vocabulrios
estruturados - tesauros - procura colmatar esta falha)