Escolar Documentos
Profissional Documentos
Cultura Documentos
NUCLEO DE DOCUMENTAO
E-mail: jmarques@vm.uff.br
POR
1
RESUMO
2
1. Introduo
4
CAVALCANTI, C. R. Indexao e tesauro: metodologia e tcnica, Braslia, ABDF, 1978. 89p. p.27.
3
Nestes sistemas, entretanto, ou mais precisamente nos Sistemas de Recuperao da
Informao, vrios so, os instrumentos utilizados para representar o conhecimento de uma
dada rea do saber, e um deles denominado Tesauro, uma linguagem documentria, que
apresenta algumas peculiaridades, pois sua hierarquia de assuntos possui uma relao
associativa e sua estrutura no se baseia em conceito de palavras simplesmente, mas sim de
termos conceituados e relacionados. Logo, no processo de recuperao, o potencial
informativo deve ser avaliado no s pela quantidade, mas sobretudo pela qualidade e
possibilidades de acesso informao, pois, a rapidez com que se pode obter a informao,
depende do uso de instrumentos adequados realidade da clientela.
4
2. Relevncia do Estudo
5
Contudo, a estratgia de recuperao da informao entre as relaes conceituais, est
numa ferramenta que traduz o conhecimento em autoconhecimento, e que proporciona a
liberdade de associao entre termos de forma variada, tendo em vista as possibilidades
infinitas de explorao do mundo da informao, do contedo e dos objetivos da pesquisa.
2.1 Tesauro
O termo tesauro tem origem no dicionrio analgico de Peter Mark Roget, intitulado
Thesaurus of English words and phrases, publicado, pela primeira vez, em Londres, em
1852. Roget pretendia com obra facilitar sua atividade literria, pois em seu dicionrio as
palavras no foram agrupadas segundo a ordem alfabtica, como ocorre com os dicionrios
da lngua, mas de acordo com as idias que elas exprimem, isto , as palavras deveriam
ser encontradas pelas idias que elas poderiam expressar. Com este objetivo, as palavras
esto aqui arranjadas estritamente de acordo com seu significado.
6
Uma pesquisa na rea de representao e recuperao de informao (Campos,
1994), mostrou a existncia de princpios comuns entre aspectos tericos de
instrumentos como esses, que tm por base a Teoria da Classificao Facetada, a
Teoria do Conceito e a Teoria Geral da Terminologia, para a formao de
estruturas sistemticas, pois os conceitos de uma rea de conhecimento se
encontram relacionados entre si. Estes princpios so constitudos por elementos
que esto na base da formao de tal estrutura, que so os conceitos, a relaes
3
entre os conceitos e a prpria apresentao do sistema de conceitos. CAMPOS,
1995
3
CAMPOS, Maria Luiza Almeida. Perspectiva para o estudo da rea de representao da informao. Cincia da Informao, Braslia,
7
O tesauro que tem sido amplamente adotado para controle de terminologia nos sistemas
ps-coordenados, tanto na estrutura como na organizao, sendo bastante similar s
convencionais listas de cabealhos de assunto, pois ambos controlam sinnimos e
homgrafos. A principal diferena entre os dois instrumentos consiste na maneira de
aplicao. O cabealho de assunto apresenta-se sozinho no catlogo alfabtico de
assunto, enquanto o descritor usado em conjuno com outros descritores.
5
CURRS (1995, p. 222) aconselha utilizar situaes reais de uso na indexao de
documentos e na recuperao da informao; planejar situaes fictcias de indexao e
de busca de informao; solicitar aos usurios que sugiram buscas de documentos ou
assuntos de trabalho e remeter o tesauro para colegas na rea do assunto, para que
comprove o seu uso, como algumas estratgias para comprovar a eficcia de um tesauro.
5
CURRS, Emlia. Tesauros: linguagem terminolgica. Braslia : IBICT, 1995.
8
Trabalhar com tesauros na indexao muito importante, para que os termos sejam
combinados inicialmente, e no posteriormente, o que significa que a forma do termo a ser
procurado deve ser idntica forma sob a qual foi utilizado na indexao.
Veja o exemplo abaixo:
Um termo longo deve ser subdividido em dois ou mais termos, que sero combinados para
recuperar a informao sobre o assunto desejado.
LINGUAGEM BIBLIOTECA
DOCUMENTRIA UNIVERSITRIA
LINGUAGEM BIBLIOTECA
DOCUMENTOS UNIVERSIDADE
9
Portanto, deve-se definir se o vocabulrio ser mais superficial ou mais especfico, pois o
mais importante disponibilizar um vocabulrio de entrada adequado, isto , quando
ocorrer busca do termo, o usurio dever ser imediatamente conduzido ao conceito
estando este sob um cabealho geral ou especfico. Logo, conclui-se que, um vocabulrio
de entrada bem estruturado ajuda a reduzir o esforo intelectual na busca e na indexao,
pois uma vez tomadas s decises e registradas, no precisam mais ser tomadas cada vez
que um conceito aparece.
7
GOMES, Hagar Espanha. Org. Manual de elaborao de tesauros monolnges. Braslia : Programa Nacional de Bibliotecas de
10
2.2 Sistema de Recuperao da Informao
INDEXAR
ARMAZENAR
RECUPERAR
11
Na Era da Informao, as habilidades mais importantes tm a ver com o conhecimento,
entretanto, necessrio est atento ao ciclo da produo do conhecimento, o que nos faz
despertar para a necessidade de entender o processo. Esse processo passa primeiramente
pela coleta de dados, que devem ser organizados para dar sentido a informao. Depois
precisamos considerar todas as informaes existentes para gerar finalmente o
conhecimento, que ao ter relaes com outros conhecimentos poder gerar novos dados,
novas informaes e novos conhecimentos, isso o ciclo da produo do conhecimento.
Contudo, o que realmente precisa ser feito, organizar o imenso volume de dados e
informaes disponveis de maneira mais eficaz possvel para transformar essa informao
em conhecimento, o que significa possibilitar o compartilhamento. No entanto, apesar de
no termos um sistema especial que capture o conhecimento na sua forma mais completa,
temos sim, que adotar sistemas e processos que organizem e disseminem essa
informao, para que haja captura de informao; e isso s acontece atravs dos
Sistemas de Recuperao.
Entretanto, a lgica de busca ponderada, ou seja, nos enunciados de busca onde possvel
indicar que certos conceitos so mais importantes do que outros, tm proporcionado a
criao de perfis de buscas formulados por meio de uma lista de termos, na qual para cada
um se atribui um peso e uma classificao de relevncia, combinando termos e pesos de
itens avaliados como sendo adequados para recuperao, o que significa um servio
especial para o qual podemos chamar de Disseminao Seletiva da Informao (DSI).
12
Logo, quando os parmetros de um sistema de informao esto estabelecidos, devemos
nos preocupar com o tipo de linguagem de recuperao dever ser adotado, para cumprir
seu desempenho de maneira mais efetiva e num ambiente especfico, isto , utilizando um
dos principais instrumentos de controle de vocabulrio, para fins de indexao e
recuperao da informao: o Tesauro.
\ ]_^@`&acbed]
23465178+9 :+;3<$=+>9$:+;4637+!83@"#?A
$% :=B@&C
97'D@(=
D@*3)4=%D1=E+:+=F,4G CH33-7I2"9 J=L+./KM4N"D0$=4
$OP79 =Q1D=.
RSTUVRWX6V1TYS[Z
fhg[ji@k@ml[jnpochn qArtsutv[wx
+y@z1{MF|#zMM}Iz~+#-|+ +1~z$e$z1~ F+|H}1tz z|( ~++}M}-}~+}
e_[_mjhc 1tA@tt1 [j[_@ _11[@t
eP1t[ _hc_
[t11j[j[j[[_[ t ePtthce_ &[[[_
13
O tratamento da informao no uma funo isolada, ao contrrio, depende de vrias
outras funes que ocorrem nos sistemas de informao e de recuperao, pois pode variar
de acordo com o nvel de detalhamento desejado num determinado sistema, ou de acordo
com o instrumental utilizado. Essas decises vo ser determinadas, em parte, pelo tipo de
sistema ou recuperao de informao em que ocorre esse tratamento.
TRATAMENTO DA INFORMAO
t_mI+t61++[jtt
*+-,.0/2143
56
1h@[j@m_
Mm
_ h 7 .8%9<'6 ):= ,>6? ;:4*!:
7 .9'1
1h@[j@m_
j )k-l
mxonBp qy
Rrstkz
ur%qBnBv
w j) m @BAC2DECFG%HIE4A;J
@
KILAME
m1@h
!" #%$'&
NPORQ
SNTQPUWVYX=N[Z \TQ ]^Xg
`_h
^ZaOi
bUW
cQedSfeZ
14
O argumento a favor da linguagem natural e do processamento automtico na indexao
dos recursos eletrnicos utilizados atualmente na Internet, tem uma viso muito
generalizada, pois parece haver uma interpretao de que a gerao do conhecimento
cientfico, ocorre na mesma velocidade com que uma enorme gama de informaes, sem
qualquer valor, so geradas e disponibilizadas na Internet. Isso revela uma enorme
ignorncia do processo de gerao do conhecimento cientfico, e da falsa compreenso da
Internet como um sistema de informao, ou de recuperao, quando no uma coisa nem
a outra. A Internet um sistema de comunicao que facilita muito o acesso a sistemas de
informao e de recuperao da informao, sejam aqueles j existentes h tempo, sejam
outros que tm sido desenvolvidos para aproveitar essa capacidade de comunicao.
8
KURAMOTO, Hlio. Uma abordagem alternativa para o tratamento e a recuperao de informao textual: os sintagmas nominais.
15
2.3 Concluso
Os sistemas de informao devem ser gerenciados de forma que o seu ciclo de vida inclua
anlise, projeto, implementao, evoluo operacional, deteriorao e substituio,
possibilitando assim a criao de um sistema novo. Entretanto, as metodologias de
sistemas de informao foram desenvolvidas para oferecer uma abordagem metdica de
anlise e projeto de sistemas, no qual, o planejamento estratgico de sistemas de
informao seja um componente essencial da organizao, e que, uma vez implantado
exigir manuteno constante.
A anlise conceitual, vista aqui, diz respeito interpretao do que o usurio na verdade
est a procura, enquanto traduo a representao de suas necessidades; pois os termos
selecionados do vocabulrio do sistema, est na representao dessa necessidade de
informao, que poder ser considerada uma estratgia de busca.
16
Aps o estabelecimento de um sistema de informao e da definio do tipo de linguagem
de recuperao adequada a cumprir efetivamente sua funo, podemos considerar que para
um bom desempenho, o tesauro precisa de uma estrutura aceitvel, e est adaptado ao
campo de interesse, a fim de permitir as alteraes necessrias, sem a qual certas reas de
assunto no poderiam ser desenvolvidas com maiores detalhes. No entanto, caso no
exista uma linguagem de recuperao adequada, ser necessrio construir um novo
tesauro, sem desprezar o j existente, que poderia fornecer termos para utilizao com o
novo sistema.
Contudo, sob o ponto de vista do uso das tecnologias de informao e comunicao, todos
que lidam com estes recursos devem estar atentos ao novo cenrio e acompanhar as
transformaes, utilizando a tecnologia como ferramenta essencial ao desempenho de sua
funo de socializar e democratizar as informaes produzidas pela humanidade.
17
1. BARIT, Mario Guido. Glosario sobre Organizacin y Representacin del
Indice, 1997
set./dez., 1992.
1990.
na Internet http://genesis.nce.ufrj.br/dataware/Seminarios/Ontologia/
18