Você está na página 1de 8

30/03/2015

Futurodaslinguagensdeindexao

OFUTURODASLINGUAGENSDEINDEXAO*
IngetrautDahlberg
UniversidadedeMainzAlemanha

1.DEFINIODOASSUNTO
Nofinaldadcadade1950eduranteadcadade1960,prevaleciaumainsatisfaogeral
com os sistemas convencionais de classificao universal, o que provocou o
desenvolvimento de thesauri, primeiro nos Estados Unidos e mais tarde em muitos outros
pases. A partir de ento, a construo de thesauri tornouse uma paixo amplamente
conhecida todos os servios de informao importantes no podiam deixar de elaborar
seusprpriosthesauri.
Umavezqueosthesaurieramdestinadosmaisparaadescriodeumdocumentoatravs
daindexaodoqueparasuaclassificao,otermo"linguagemdeindexao"tornouseo
termogenricoparadesignartodosostiposdethesauri,incluindolistasdecabealhosde
assunto,listasdedescritorese,algumasvezes,atsistemasdeclassificao.
SeacompanharmosD.Soergelemseulivro"Indexinglanguagesandthesauri:construction
andmaintenance"(1),teremosdeaceitarqueexisteumagrandediferenaentrelinguagens
de indexao e thesauri. Soergel define linguagens de indexao como sendo compostas
apenas daqueles termos usados para descrio, classificao e recuperao de
documentos,excluindoportantoostermoschamados"nodescritores"estestermos"no
descritores" so geralmente conhecidos como sendo os termos sinnimos, os "termos
guia", como soergel os chama, e que facilitam o acesso da linguagem natural aos termos
controlados, aos descritores de um thesaurus. Em outras palavras, a adoo da definio
de"linguagemdeindexao"deSoergelsignificariaqueesteconceitopoderiaseraplicado
apenas aos sistemas de classificao, excluindo portanto, explicitamente, aquelas
"linguagens" para indexao que se desenvolveram nos ltimos vinte anos e que usam a
linguagemnaturaldiretanaorganizaodoconhecimento.
Levando em conta o contexto desta Conferncia sobre sistemas de classificao,
sconsiderarse provavelmente as linguagens de indexao como sendo opostas aos
sistemas de classificao, incluindo certamente os tuesauri consequentemente, no os
excluireidoquevemaseguir.
No entanto, no sero consideradas aquelas "linguagens" compiladas por processamento
automtico do texto, por exemplo, as compostas de termos existentes nos ttulos, nos
resumos ou nos textos completos dos documentos. Estes termos no podem ser
considerados como elementos de uma linguagem de indexao, uma vez que ainda no
foramdefinidosnemrelacionadoscomosconceitosdeumthesaurusespecializadooucom
aestruturadeumsistemadeclassificao.
Devemostambmesclareceremqueconsisteo"conceitodeindexao".Foisugerido,h
muito,queestetermofosseusadotambmparaatribuirnotaesextradasdesistemasde
classificao. Houve at uma reunio em 1971 em Herceg Novi, intitulada "A CDU em
relao a outras linguagens de indexao" (2) significando, portanto, que a CDU foi
considerada uma linguagem de indexao. Por sua vez, os Princpios de Indexao do
UNISIST(3)aindamantmestepontodevista,quandomencionamaindexao"porsinais
de classe", e "smbolos de classifiao". Deveria ser esclarecido, entretanto, que podese
falar de indexao apenas quando se usam descritores a partir de uma ordem alfabtica
http://www.conexaorio.com/biti/dahlberg/

1/8

30/03/2015

Futurodaslinguagensdeindexao

para apliclos na representao do assunto de um documento. Todas as vezes que uma


notao for utilizada a partir do arranjo de conceitos de um sistema de classificao, a
estrutura deste sistema relacionada com a informao em causa. Assim, na realidade,
classificamseconceitosquando,aoinvsdetermos,atribuemsenotaesextradasdeum
sistema de classificao. (Ser totalmente excludo das consideraes deste trabalho o
outro sentido de 'indexao', significando por exemplo o estabelecimento do ndice de um
livrooudeumperidico).
2.DESENVOLVIMENTODETHESAURIENOVASPERCEPES
Senotivessehavidoumarealnecessidadederepresentaodeassuntosmaisespecfica
doqueaaplicaodenotaesdossistemasdeclassificaotradicionaisnosltimosvinte
anos, os thesauri no teriam proliferado to amplamente. Com efeito, estes instrumentos
foramcriadosabundantemente,emcadapaseemcadareadoconhecimento.Hojeem
dia, muitas bibliografias de thesauri mostram a situao deste desenvolvimento, e seria
possvelatiniciarapublicaodeumabibliografiadebibliografiasdethesauri.Oprincipal
modelodethesauruspropriamenteditofoifornecidopelaprimeiravezpeloEngineersJoint
council (EJC) Thesaurus, em 1964, e mais tarde pelo Thesaurus of Engineering and
Scientific Terms, (TEST) em 1967. Dois anos aps o TEST norteamericano, nasceu o
Thesaurofacetinglsumanovaidiasobreconstruodethesaurusemquecombinouse
umaclassificaofacetadanaparteprincipalcomumndicetipothesaurusparaentradano
sistema.Umanotaofoiusadaparaaconexodasduaspartes.
O pequeno manual sobre construo de thesaurus (4), por Aitchison e Gilchrist afirma, a
respeitododesenvolvimentodethesauri:
osprimeirosthesaurieraminteiramentealfabticosmasduranteosltimos
cincoanos(19671972)asdeficinciasdessearranjotornaramseevidentesea
abordagemsistemticaagoraamplamenteaceita.
Aocompararosthesaurialfabticoscomestanovaabordagem,osautoresfalmde"thesauri
classificados"edistinguemsetetipos.
Eugostariadesaberporqueaindasefaladethesauriparadesignartiposdesistemasde
conceitosquesopraticamenteomesmoquesistemasdeclassificao,excetopelofatode
queestesltimospodemnoteraindaacaractersticadeindicar,emseundicealfabtico,
ostermosadicionaismaisgenricosemaismaisespecficos.
O desenvolvimento dos thesauri parece ser tambm reconhecido na distino que faz D.
Soergelnolivromencionadoanteriormente(1).Soergelestabeleceumadiferenaentredois
tiposdethesauri,segundoseuarranjo.Eleoschamade"modeloTEST"e"modeloRoget
Soergel".
Estesmodelospossuemaspartesseguintes:
a)ModeloTEST
(0)Introduo
(2)Thesaurusdetermos(parteprincipalemarranjoalfabtico)
(3)Indicepermutado(Indicealfabtico)
(1)Indicesclassificados
(1.1)Indicedecategoriasdeassunto
(1.2)Indicehierrquico
b)ModeloRogetSoergel
http://www.conexaorio.com/biti/dahlberg/

2/8

30/03/2015

Futurodaslinguagensdeindexao

(0)Introduo
(1)Indiceclassificado
(2)Parteprincipalemarranjoclassificado
(3)Indicealfabtico
Soergelprova,atravsdeumfluxogramaoperacional,asuperioridadedosegundotipode
thesaurussobreoqueapresentaarrajnoalfabticonaparteprincipal(5).Elemostranos
queoprimeirotipodeusopoucoprticomastambmquetemseuscustosaumentados
nasetapasdeindexaoerecuperao.soergelaconselhaenfaticamenteaquenosejam
maisconstrudosthesauriconformeomodeloTEST.
Seria necessrio compreender que o desenvolvimento da organizao de thesauri de
acordocomomodeloRogetSoergelmnoslevadevoltaaopontodepartida:aossistemas
de classificao, quando muito aos do tipo que o classificacionista indiano S. R.
RanganathanjhaviaestabelecidoemsuaClassificaodosDoisPontosem1933asexta
edio foi publicada em 1960, e a stima est agora sendo preparada (6)e(7). Donde a
semelhana com os sistemas de classificao facetada, que tm sido divulgados pelo
British Classification Research Groupe atravs de recomendaes que constam do Anexo
ao volume da reunio de Forking em 1957 (8). Significar isto que estamos andando em
crculo,queestamosvoltandoaopontodepartida?
No existe dvida de que tm havido progressos no estudo da teoria da classificao,
especialmente atravs do desenvolvimento de thesauri. Foi principalmente atravs do
exercciointelectualdetentaridentificarasrelaesentretermosquefoicriadaumanova
compreenso da estrutura conceitual do conhecimento uma vez que um thesaurus
definidocomoumalistadeconceitosetermoscorrespondentesnumadeterminanareado
conhecimento, com a indicao das relaes entre os conceitos e os termos que os
denotam.
Podemoshoje,semdjvida,afirmarqueumanovabaseparaaconstruodesistemasde
classificao foi criada, de um lado atravs do desenvolvimento da classificao facetada
segundo Ranganathan, e de outro atravs do desenvolvimento da teoria de conceitos,
derivada da determinao de tipos diferentes de relaes entre os conceitos de um
thesaurus.
Juntamente com estas novas percepes sobre a abordagem por categorias para a
organizaodoselementosdoconhecimento(conceitos),estamosagoraprestesaexplorar
amelhormaneiradearrumaressesconceitosemenunciadosclassificatriosdestinadosa
representar a informao encontrada em novos documentos. A busca da "Sintaxe
Absoluta",quejhaviasidoestudadaporRanganathanhalgumtempo(9),equetambm
levou J. C. Gardin e seu grupo, em 1962, a desenvolver o SYNTOL Sintagmatic Oriented
Language" (10), foi identificada como uma das mais importantes linhas de pesquisa na
Terceira Conferncia Internacional de Estudos sobre Pesquisa em Classificao, em
Bombaim(11). Assim, novas experincias podem ser obtidas a partir de sistemas como o
de D. Austin (PRECIS Preserved Context Indexing System) (12), ou como o sistema
multilinge TITUS (13), que utilizam frases codificadas para a descrio do contedo de
documentos.
CONSIDERAESPROSPECTIVAS
Possuidores dessas novas percepes sobre a atual situao da apresentao da
informao, aonde iremos a partir de agora? Quais so as perspectivas referentes s
distintas aplicaes do novo conhecimento sobre construo de thesauri, ou sobre
construodesistemasdeclassificaofacetadacomndicesdotipothesaurus?
http://www.conexaorio.com/biti/dahlberg/

3/8

30/03/2015

Futurodaslinguagensdeindexao

Quaisso,porexemplo,aspropostasdoRelatriodeEstudosdoUNISISTde1971(14)?
Naverdade,podemosencontrar,nesseprogramasparaumaredemundialdesistemasde
informao, pelo menos duas propostas muito importantes para atividades ulteriores na
organizao de identificao de assuntos em sistemas de informao. O captulo 6 do
relatrioapresentaasseguintesrecomendaes:
umalistapadronizadadecabealhosdeasuntogenricospoderevelarsetil
maisparalocalizaretransferirgrandesgruposdeinformaodoque
documentosoudadosespecficos",
eissodeveriaserfeitoparticularmenteafimde
facilitarointercmbiodedocumentosedeinformaoentrediferentesmbitos
dadocumentaocientfica(regional,lingstico,setorial),
caracterizarascoleesdebibliotecasecatlogoscoletivos,
especificarasreascobertaspelosperodosatravsdeumregistromundial,
determinarsuperposieseduplicaesnascaractersticasoperacionaisdos
sistemasdeinformao",
etambmparaservircomoum
"amplofiltroparaprocessamentodepedidossobrefontesdeinformaoatravs
deumaredereferencialinternacional".
Alm de uma lista padronizada de cabealhos de assunto para a ampla organizao de
documentos, ou "indexao pouco produnda", recomendase a realizao de pesquisas
comoobjetivode"desenvolverumaestruturaformalcomumparaanalisaraconvertibilidade
edesenvolverlinguagensintermediriasadhoc,quedizemrespeitoaoscomponentestanto
semnticosquantosintticos".
Portanto, com o fito de reunir o contedo de diferentes thesauri em um nico e mesmo
assunto, de diversos pases, em diversas lnguas, de diversas instituies e de diversos
sistemasdeinformaoeafimdeestabelecercompatibilidadesentreestesthesauriparao
intercmbiodeinformaesentreosprodutosqueforamdescritoscomseuselementos,o
relatrio do UNISIST recomendou a formao de uma organizao permanente composta
de:
a)Grupossetoriaisdetrabalhopara:
realizar ou supervisionar estudos sobre a convertibilidade dos thesauri
existentesnumadeterminadareadeconhecimento
sugerirajustesqueaumentaroacompatibilidadeentrealgunsouentretodos
produzir thesaurimestres a serem utilizados com vocabulrios intermedirios
paraestabelecerconexesentrethesauriindividuaisdecoberturasimilar,e
fornecerummecanismopararevisescorrenteseatualizaesdetodosesses
instrumentos de indexao. b) Escritrios centrais ou centros de distribuio
paracoletar,analisaredisseminarclassificaes,thesauri,listasdedescritores,
etc.,emmbitomundialeinterdisciplinar,bemcomoparadivulgarosresultados
das atividades dos grupos setoriais de trabalho considerados em a) de
prefernciaemmaisdeumalnguacomumanotaosimblicacomumbaseada
no contedo estruturado dos thesaurimestres. Esses centros de distribuio
poderiamtambmserencarregadosderealizarestudossobreasinterrelaes
dethesaurimestresusadosemreassuperpostas(conexeshorizaontais),bem
como sobre as relaes com a lista padronizada de cabealhos de assunto
consideradaacima(conexesverticais"(14,p.96)
http://www.conexaorio.com/biti/dahlberg/

4/8

30/03/2015

Futurodaslinguagensdeindexao

Com referncia elaborao da lista padronizada de cabealhos de assunto genricos, a


FIDrecebeuoencargo,em1972,dedesenvolverumBroadSystemofOrderingBSO.Os
resultadosdotrabalhodeumpequenogrupodeespecialistasforamapresentadosUnesco
somente no corrente ano (maio de 1976). Em relao s outras recomentaes
mencionadas em a) e b) acima, praticamente nada foi feito ainda, com exceo do
estabelecimento, em Varsvia, de um centro depositrio de sistemas de classificao em
outras lnguas que no o ingls. A pequena biblioteca especializada em sistemas de
classificao em Cleveland, Ohio, que j existia bem antes do relatrio do UNISIST,
recebeu em 1970 auxlio financeiro da Unesco para a entrada em computador de sua
coleo. Ela no pode ser considerada hoje como um centro depositrio da Unesco para
sistemas de classificao porque no est financeiramente em condies de efetuar essa
coletadeformasistemtica,comofoipropostopelorelatriodoUNISIST.
O programa de trabalho de classificao a ser realizado, tal como foi estabelecido pelo
Relatrio de Estudo do UNISIST, parece realmente muito satisfatrio. Entretanto, somos
levadosaperguntarporquerazoaSecretariadoUNISISTaindanotomouasmedidas
necessriasparaarealizaodesuasrecomendaes.Talvezelaprecisassedeumapoio
maiorporpartedosinteressadosnaaplicaodaclassificaoembibliotecasesistemasde
informao, especialmente atravs de uma recomendao proveniente das vozes
combinadasdosparticipantesdeumagrandeconfernciacomoaqueoraserealizaaquino
RiodeJaneiro.
Deveramos nos dar conta de que o conhecimento e a informao transmitida pelos
documentosnecessitamamximaateno,afimdequepossamseridentificadoseestar
disponveis para o progresso da cincia e da tecnologia. Os instrumentos para a
identificaoeaorganizaodesseconhecimentomerecemtambmmuitomaiscuidadoe,
eventualmente, uma reviso completa, bem como uma adaptao ao nosso novo
conhecimento sobre sua estrutura. Poderseia, talvez, afirmar que um sistema de
informaotobomquantoosistemadeclassificaooulinguagemdeindexaocomo
auxlio dos quais suas informaes so identificadas, organizadas e recuperadas. Deste
ponto de vista, deveramos nos dar conta de que hoje nos encontramos ainda equipados
cominstrumentosdosulopassado.
4.OTRABALHOASERREALIZADO
Uma grande quantidade de trablho se nos depara, referente no s s tarefas esboadas
nas recomendaes do relatrio do UNISTST, mas sobretudo criao de uma maior
conscientizaodanecessidadedetrabalhoedeorganizaodotrabalhonessarea.Se
continuarmoscomumaatitudedenointerferncia,nochamado"desenvolvimentonatural",
como tem ocorrido nos ltimos anos, confiando cada vez mais na linguagem dos
documentoseutilizandoapenasaspalavrasdosttulosdosdocumentose/oualgunstermos
no relacionados para indexao dos assuntos, nossos sistemas no sero capazes, no
futuro, de manipular adequadamente grandes quantidades de informao. Fugmann (15)
mostrouqueexisteumaleiparaarecuperaodainformaosegundoaqualquantomaior
foraquantidadedeinformaesasermanipuladaporumsistema,maisrigorosadevesera
ordem nessa quantidade de informao, se se quiser encontrar algo novamente neste
volume crescente. E todos sabemos que bibliotecas e sistemas de informao so
organismoscrescentes.
poristoque,sedeixarmosaconstruodethesaurisedesenvolverdamaneiracomotem
sido feita at agora, no fomentaremos a ordem, mas estaremos contribuindo para a
desordem, pois cada novo sistema que no for baseado em princpios slidos apenas
contribuirparaisto.
O futuro das linguagens de indexao no deve ser julgado do ponto de vista de um
http://www.conexaorio.com/biti/dahlberg/

5/8

30/03/2015

Futurodaslinguagensdeindexao

"desenvolvimento natural" necessrio ou desnecessrio, mas de preferncia de um ponto


de vista de responsabilidade social e intelectual. Os recursos humanos e financeiros em
cadapasdeveriamserutilizadosparaessefimn.
Podemossemdvidainterferirno"desenvolvimentonatural"eutilizarnossoscrebrospara
criarconscienciosamenteossistemasdeconceitosquenecessitamosparaaexpressode
novos conhecimentos e informaes. Suas "linguagens" deveriam ser compreendidas por
todo o mundo, isto , atravs de sistemas de sinais, como a notao numrica que
representadiretamenteosconceitos.
Muitos de ns tm conscincia da necessidade de compatibilidade entre sistemas de
informaoparaqueexistaumacooperaoentreestessistemas.Osinstrumentosparao
estabelecimentodessacompatibilidadeaindaprecisamserelaborados.
Deverseia estabelecer regras para a construo de lxicos intermedirios (thesauri
mestres) deverseia levar em considerao a idia de um ThesaurusFonteUniversal
como ela proposta por Soergel (16) e deverseia estabelecer princpios para a
construo de um sistema universal de ordenao e utilizlos na subsequente
implementaodestenovosistema.
Umlampejodeesperanaparecevirdo"desenvolvimentonatural":ofatodeque,cadavez
mais, thesauri multilinges devem ser estabelecidos em sistemas de informao
cooperativos, leva ao reconhecimento de que no se pode traduzir termos em ordem
alfabtica para outra lngua sem se conhecer as definies e as anotaes das relaes
entre os conceitos desses termos. Alm disso, quando se quer encontrar esses conceitos
numa lista de termos, precisase de uma linguagem intermediria, de uma notao que
correlacioneostermosnasdiferenteslnguas.Anotao,ento,alinguagemconceptual
desses termos. Portanto, usandose uma notao consistente que reflita o sistema
conceptual em uma determinada rea, no s localizarseo os termos diretamente nas
diferentes lnguas de um thesaurus multilinge, mas tambm encontrarseia os termos
relacionadosdeumadeterminadahierarquiamuitomaisfcilerapidamente.
Esperemos pois que, pelo menos desse desenvolvimento de sistemas de informao
cooperativos surja uma compreenso geral da necessidade de um arranjo sistemtico de
"linguagensdeindexao",eapartirdaumapossibilidademelhoremuitomaiseconmica
deorganizaodainformaoedoconhecimento.
Quemesejapermitidoconcluirdaseguintemaneira:ofuturodaslinguagensdeindexao
ser determinado pela fora e pelo poder de nossa percepo da necessidade de
classificao.

Refernciasbibliogrficas
(1)SOERGEL,D.Indexinglanguagesandthesauri:constructionandmaintenance.Los
Angeles,Cal.,MelvillePUbl.,1974.632p.
(2) YUGOSLAV CENTER FOR TECHNICAL AND SCIENTIFIC DOCUMENTATION &
INTERNATIONALFEDERATIONFORDOCUMENTATION.Proceedingsoftheinternational
symposium"UDCinrelationtootherintexinglanguages.HercegNovi,Yugoslavia,June28
July1,1971.Beograd,1972.
(3)UNESCO.UNISISTindexingprinciples.Paris,1975.Firstdraft.10p.
http://www.conexaorio.com/biti/dahlberg/

6/8

30/03/2015

Futurodaslinguagensdeindexao

(4)AITCHISON,J.&GILCHRIST,A.Thesaurusconstructionapracticalmanual.London,
ASLIB,1972.95p.
(5)VertambmoresumodolivroemInformationProcessingandManagement11:255257,
1975.
(6)RANGANATHAN,S.R.ColonRanganathan.Bombay,AsiaPubl.House,19332.ed
1939,4.ed.1950,5.ed.1957,6.ed1960,reimpr.1963e1964.
(7)NEELAMEGHAN,A.ColonClassification.In:EncyclopediaofLibraryandInformation
Science5:316340,1971.
(8)INTERNATIONALSTUDYCONFERENCEONCLASSIFICATIONFORINFORMATION
RETRIEVAL,Dorking,1957.Proceedings.London,ASLIBNewYork,PergamonPress,
1957.p.137147.
(9)VeracontribuiodeRanganathanem:Perrault,J.M.(ed).Proceedingsofthe
InternationalSymposiumonRelationalFactorsinClassification.UniversityofMaryland,811
June1966.InformationStorageandRetrieva,3:177410,1967.
(10)GARDIN,J.C.SYNTOL.NewBrunswick,N.J.GraduateSchoolofLibraryScience,
Rutgers,TheStateUniversity,1965.106p.
(11)DAHLBERG,I.SomereflectionsontheBombayConference.Internationalclassification
2:4144,1971.
(12)AUSTIN,D.ThedevelopmentofPRECIS:atheoricalandtechnicalhistory.Journalof
documentation30(1):97102,1974.
(13)ZINGEL,M.J.Thecomputerspeaksfourlanguages.[ComputersprichtvierSprachen]
[emalemo]:VDINachrichten,16:2,1974.(relatrioresumidosobreosistemaTITUS.Para
estarefernciaverDucrotnaLISA)
(14)UNESCO.UNISIST.Studyreportonthefeasibilityofaworldscienceinformation
system.Paris,UNESCO,1971,161p.
(15)FUGMANN,R.ThetheoreticalfoundationoftheIDCSystem:Sixpostulatesfor
informationretrieval.ASLIBProceedings"24(2):123138,1972.VertambmseuartigoThe
glamourandthemiseryofthethesaurusapproach.TreatiseIVonInformationretrieval
theory.Internationalclassification2(2):7686,1974.20refs.
(16)SOERGEL,D.Auniversalsourcethesaurusasaclassificationgenerator.Journalofthe
ASIS23(5):299305,1972.

*TraduodoinglsporHenryB.Cox.PalestraapresentadaConfernciaBrasileirade
ClassificaoBibliogrfica,RiodeJaneiro,1217desetembrode1972.Anais.Brasilia,
IBICT/ABDF,1979.v.1,p.323334.

HOME

http://www.conexaorio.com/biti/dahlberg/

7/8

30/03/2015

Futurodaslinguagensdeindexao

PginamantidaporConexoRio

http://www.conexaorio.com/biti/dahlberg/

8/8

Você também pode gostar