Escolar Documentos
Profissional Documentos
Cultura Documentos
vocabulário controlado
como instrumentos
efetivos para a
recuperação da
informação arquivística
Renato Tarciso Barbosa de Sousa et Rogério
Henrique de Araújo Júnior
p. 420-442
Résumé
Trata do processo de classificação no âmbito da prática arquivística e discute os requisitos básicos
para a concepção de um vocabulário controlado associado à classificação de documentos com a
finalidade de aperfeiçoar o processo de busca e recuperação da informação. Para tanto, apoia-se na
representação da informação para a construção de um protótipo, que relacione o controle de
vocabulário a uma estrutura de classificação. O resultado final foi a proposição de uma metodologia
que associou e complementou a atividade de classificação, que abrange as áreas funcionais, aos temas
dos documentos que deverão estar coligidos em descritores a serem selecionados e padronizados em
uma taxonomia das funções administrativas. Desse modo, pretendeu-se firmar concepção de
classificação de documentos de arquivo, com o aporte da classificação dos temas dos mesmos
documentos, trazendo novos pontos de acesso, benéficos à melhoria do processo de busca e
recuperação da informação.
This classification process within the archival practice and discusses the basic requirements for the
design of a controlled vocabulary associated with document classification in order to improve the
process of search and retrieval of information. To this end, rests on the representation of information
for the construction of a prototype, which relates the vocabulary control a classification structure. The
end result was to propose a methodology and associated complemented the classification activity,
covering functional areas, the themes of the documents should be collected in descriptors to be
selected and standardized on a taxonomy of administrative functions. Thus, it sought to establish
recordkeeping classification design, with the contribution of the classification of subjects of the same
documents, bringing new access points, beneficial to the improvement of the search and retrieval of
information.
Entrées d'index
Keywords :
indexing, classification of records, controlled vocabulary, information archival
Palavras-chave :
Indexação, classificação de documentos de arquivo, vocabulário controlado, informação arquivística
Texte intégral
Introdução
Desafios constantes à busca e recuperação da informação, a organização e a
representação do conhecimento têm sido cada vez mais considerados como solução
para a representação de quantidades crescentes de acervos arquivísticos nas
organizações brasileiras.
Esses acervos, apesar de imprescindíveis à gestão estratégica, vêm se constituindo em
um problema para as organizações dada a falta de espaço físico para guarda de
quantidades consideráveis de documentos em suporte de papel, além do alto custo de
armazenamento daqueles em formato digital. O valor da manutenção de espaços nas
dependências das organizações, bem como nos sistemas informatizados, vem
desequilibrando a relação entre custo e benefício da guarda dos acervos arquivísticos,
sem contar as despesas envolvidas na contratação de profissionais especialistas no
tratamento desses acervos, que elevam sobremaneira o dispêndio de recursos
financeiros nas corporações que atuam na esfera pública e privada do Brasil.
Por outro lado, a tecnologia da informação tem possibilitado avanços nas áreas que
tratam de grandes volumes de documentos, enfatizando o processo de busca e
recuperação da informação arquivística. Entretanto, o uso da tecnologia da
informação, em alguns momentos, é entendido como solução definitiva para a gestão
de documentos, mas, na realidade, trata-se de mais um instrumento, para a gestão de
documentos.
A classificação de documentos de arquivo tem três objetivos: manter o vínculo
arquivístico, fundamentar a avaliação e a descrição e possibilitar a recuperação da
informação contida nos documentos. Diversos autores, tais como Foscarini1, chegam
a entender que a recuperação dos documentos armazenados é somente um benefício
colateral da classificação, sendo seu propósito básico integrar os documentos
individuais nos conjuntos a que pertencem, baseando-se no mandato e nas funções
do criador, como defendem Duranti, Eastwood e Macneil2. Uma das características
principais dos documentos de arquivo é a relação que mantêm entre si e que precisa
ser preservada para dar-lhes sentido, assim como as atividades e ações que lhes
deram origem. A compreensão e a manutenção desse contexto, representada pelas
relações entre os documentos, é um elemento destacado nas pesquisas que versam
sobre a autenticidade de documentos digitais.
A classificação é uma função arquivística, tanto quanto a avaliação, a descrição, a
preservação, a aquisição e a difusão (disseminação), onde a tríade formada pela
avaliação, descrição e classificação são atividades capitais da prática da organização
arquivística. Podemos considerar a classificação como uma função matricial, pois é
por meio dela que se realiza a avaliação, que em uma etapa posterior, vai possibilitar
a gestão dos prazos de guarda e da destinação final (tabela de temporalidade) e
independentemente da metodologia aplicada e de sua configuração, sempre terá
como ponto de partida os conjuntos documentais definidos na classificação.
Na etapa da descrição, a norma do Conselho Internacional de Arquivos, ISAD(G) e a
Norma Brasileira de Descrição Arquivística do Conselho Nacional de Arquivos,
NOBRADE, definem como primeiro elemento a ser descrito o conjunto documental,
representado pelo fundo, série ou subsérie, isto é, os agrupamentos documentais
resultados do processo de classificação. Assim, a classificação ganha uma
envergadura, que sustenta toda a construção da prática arquivística. Desse modo, a
definição precisa dos conjuntos documentais e as suas relações é imprescindível para
o que-fazer arquivístico3.
A classificação, como operação matricial de todo o trabalho arquivístico, é uma etapa
relevante para a transparência e o compartilhamento das informações, que por sua
vez, são caminhos seguros para o processo de tomada de decisão e para a preservação
da memória técnico-administrativa das organizações, franqueando o pleno exercício
da cidadania. Nessa altura a classificação se associa à atividade de indexação, que por
estar no âmbito das funções de um sistema de recuperação da informação, dá suporte
à descrição e a representação da informação arquivística, por meio da indexação de
documentos. A identificação dos conceitos de que tratam os documentos, por meio de
termos, descritores ou palavras-chave, vai complementar a classificação dos
documentos, ensejando a construção de linguagens documentárias para padronizar a
escolha dos termos e definir as relações entre os descritores e os conteúdos de que
tratam os documentos. Esse mecanismo de representação deverá refletir as
funções/atividades e conduzir os usuários dos sistemas arquivísticos à recuperação
da informação.
O acesso, consubstanciado pela recuperação da informação, deve ser considerado sob
dois níveis: o legal (corpus de leis) e o técnico-científico. No nível legal, a entrada em
vigor da Lei 12.527/2011 alterou as condições e regras de acesso à informação no
Brasil. A lei inverteu a lógica transformando a exceção em regra, isto é, existe agora
uma lei que garante o acesso à informação pública e a exceção é o sigilo. A restrição é
tudo aquilo que pode colocar em risco a segurança do Estado e da sociedade, além da
privacidade das pessoas.
Todavia, o maior entrave ao pleno acesso à informação não é o conjunto de restrições
impostas pela lei, mas as condições inadequadas de organização da informação
pública, que não permitem o estabelecimento de um processo de busca e recuperação
da informação. Tal situação é agravada por conta dos desafios tecnológicos que hoje
se colocam, dentre eles o documento digital, a profusão de bases de dados e a
dispersão de informações.
Além dos desafios tecnológicos, deve-se ter em conta também o desconhecimento dos
gestores públicos para com os aspectos relacionados à cultura da organização da
informação, que devem envolver a análise da informação no nível profissional, ou
seja, um tipo de mediação especializada que se torna necessária entre produtores e
usuários da informação, sempre para fins de esclarecimento e de facilitação do acesso
a fontes e conteúdos4.
Nessa investigação, partimos do pressuposto de que as organizações, por
apresentarem uma produção documental crescente, necessitam de instrumentos de
gestão informacional que possibilitem o controle da produção documental nas
atividades de tratamento técnico do acervo em três dimensões, conforme proposição
de Baptista, Araújo Júnior e Carlan5:
Classificação arquivística
A classificação é parte integrante de um Programa de Gestão de Documento e de
acordo com refere-se a três aspectos básicos6:
A Norma ISO 15.489/2001, que trata da gestão de documentos, define sete processos
de gestão, dentre eles o de organização lógica para a recuperação, ou seja,
classificação e indexação. A norma internacional e o Modelo de Requisitos para
Sistemas Informatizados de Gestão Arquivística de Documentos do Conselho
Nacional de Arquivos, E-Arq Brasil7, apontam como instrumento obrigatório de
gestão de documentos o plano de classificação de documentos.
Empiricamente, podemos afirmar que a excelência na prática arquivística pode ser
atestada pela existência das seguintes condições na instituição: política arquivística,
existência de unidade político-administrativa responsável pela gestão dos
documentos, recursos humanos qualificados, recursos materiais, recursos financeiros
e instrumentos de gestão arquivística (plano de classificação, tabela de
temporalidade, etc.).
A classificação aparece como uma preocupação há vários anos. A importância
apontada pela literatura da área não teve, no mesmo nível, o estabelecimento de um
instrumental teórico-metodológico consolidado. Fala-se e trabalha-se com
classificação sem agregar o desenvolvimento desse conceito proporcionado pela
Filosofia e pela Teoria da Classificação. Apresenta-se o caminho sem discutir os
meios necessários para percorrê-lo. Adotam-se, sem qualquer avaliação crítica,
métodos desenvolvidos para objetos de características e natureza diferentes dos da
Arquivística. E tudo isso tendo como pano de fundo a imprecisão terminológica, que
parece ser uma marca da área.
A organização dos documentos tem sido um dos grandes desafios da Arquivística
contemporânea. Lidar com massas tão grandes de documentos acumulados
diariamente pelas instituições exige uma maior sofisticação dos esquemas de
classificação. O documento arquivístico é um artefato de conhecimento humano com
pressupostos e características específicas e o ambiente e o conteúdo são delimitados e
definidos pelo sujeito acumulador, que pode ser uma pessoa física ou jurídica
(organização). Ao contrário daqueles encontrados em bibliotecas, por exemplo, os
documentos arquivísticos não constituem um conjunto formado em vista de uma
finalidade específica: eles representam o produto da atividade do sujeito acumulador.
Entender o modo como as organizações estruturam-se e como executam suas funções
e atividades é compreender como os documentos são acumulados, como devem ser
classificados e indexados, visando a sua posterior recuperação8.
O documento é resultado de um ato desenvolvido e, na maioria dos casos,
cotidianamente repetido. A gênese se dá quando a organização tem algo a cumprir, a
provar, a determinar. Surge naturalmente como resultado das ações desenvolvidas
pelo sujeito acumulador. Após o registro das informações em suportes (papel, mídia
magnética, microfilme, películas fotográficas, películas cinematográficas etc.), é
necessário mantê-las pelos valores administrativos, técnicos, legais, fiscais,
probatórios, culturais e históricos que possam conter. À medida que os documentos
vão sendo acumulados, estabelecem relações entre si. Eles estão unidos pela mesma
finalidade com que são produzidos e recebidos, determinados pela razão de sua
elaboração e que é necessário à própria existência e a capacidade de cumprir seus
objetivos, por isso formam um conjunto indivisível de relações intelectuais e
orgânicas.
A explosão do volume de documentos arquivísticos ocorreu de forma paralela com o
aumento geral da informação registrada pelas sociedades. Talvez, em um ritmo mais
lento, mas nem por isso menos significativo. Os fenômenos da industrialização e da
urbanização, o crescimento da presença dos estados nacionais e da complexidade de
seus aparatos e, secundariamente, a banalização dos meios tecnológicos de
reprodução de documentos explicam em parte a afirmação anterior. A partir da
década de 1980, a consolidação da microinformática fez aparecer e tornar
extremamente comum nas organizações um novo tipo de documento arquivístico: o
eletrônico. Não é simplesmente um novo suporte para o registro de informações
originadas das funções e atividades das instituições; ele tem características próprias,
que impõem a definição de modos específicos de criá-lo, classificá-lo, avaliá-lo,
descrevê-lo e de atestar sua autenticidade9.
De todo modo, o aparato utilizado para a classificação dos conjuntos documentais,
em última análise, devem apoiar o armazenamento e a rastreabilidade dos
documentos, permitindo aos usuários dos sistemas arquivísticos a possibilidade de
buscar e encontrar os documentos demandados. Esta finalidade é a mesma que se
apresenta no âmbito da gestão estratégica da informação, onde a acessibilidade
física se traduz nas etapas de identificação da existência, localização e obtenção do
documento, conforme ilustra a Figura 1:
Fig. 1 – Etapas da acessibilidade física do documento
Recuperação da informação
A recuperação da informação é a última etapa do ciclo documentário, conforme pode
ser cotejado na Figura 2, e constitui a finalidade do trabalho documentário. Ela é o
resultado das operações realizadas no processo de busca. Segundo Araújo Júnior17,
esta etapa é reconhecida como a recuperação de referências de documentos em
resposta às solicitações ou demandas expressas por informação. A recuperação da
informação faz parte do processo de busca e recuperação da informação e dentre as
inúmeras definições propostas, podemos destacar que se trata do processo de
localização de documentos e itens informacionais que tenham sido objeto de
armazenamento a fim de permitir o acesso de usuários, por meio de solicitações
específicas.
Fig. 2 – Etapas do ciclo documentário18
Enfim, cabe ainda a advertência de que, conforme propõe Araújo Júnior22, o processo
de busca e recuperação da informação só poderá ser viabilizado por completo, por
meio da avaliação dos usuários, ou seja, os sistemas de recuperação da informação,
além de atender às necessidades informacionais dos usuários, dependem destes para
aferição da qualidade dos seus resultados. Daí a proposição da presente pesquisa de
associar um vocabulário controlado (taxonomia) à classificação de documentos de
arquivo, a fim de congregar o vínculo arquivístico com a descrição temática dos
conjuntos documentais para aperfeiçoar a recuperação da informação.
I. Como linguagem:
Agilizar a comunicação;
Aumentar a relevância na recuperação da informação; e
Melhorar a estrutura de conteúdos de portais corporativos.
a. Flexibilidade de uso dos termos, por meio de uma oferta adequada de pontos de
acesso, refletindo as áreas funcionais, temas relacionados às atividades de apoio
e finalísticas, bem como a nomenclatura utilizada na classificação dos
documentos da instituição;
b. Normalização e padronização dos descritores a serem empregados na indexação
dos documentos;
c. Uso da taxonomia em conjunto com o código de classificação de documentos,
objetivando criar mais pontos de acesso aos documentos, providência que
facilitar a busca e recuperação dos documentos; e
d. Instrumento complementar às funções e aplicações do código de classificação de
documentos da instituição.
Considerações Finais
Entendemos que a grande contribuição da pesquisa em tela é a possibilidade de
interrelacionar saberes de várias áreas do conhecimento, com o objetivo de um
processamento técnico dos documentos de arquivo eficiente, eficaz e que gere
segurança nos processos de representação, organização, busca e avaliação desses
registros documentais. Desse modo, o aporte de conhecimentos deve ser oriundo não
apenas da ciência da informação e da arquivologia, mas também das áreas de ciência
da computação, sobretudo no que se refere ao processamento automático da
informação, por meio de técnicas de mineração de dados e textos.
Além disso, o resultado propõe as bases para uma metodologia de elaboração de
taxonomias a serem utilizadas como vocabulário controlado para a indexação
documentos de arquivo, o mapeamento da produção sobre classificação de
documentos de arquivo e a definição de um modelo para vinculação automática entre
classificação, avaliação e indexação de documentos, a fim de aprimorar o processo de
busca e recuperação da informação.
A produção de informações orgânicas registradas é a base da constituição dos
arquivos e esta atividade está diretamente ligada à produção de informações
estratégicas, que por sua vez, tem como finalidade subsidiar as decisões dos gestores
no posicionamento das corporações frente aos desafios impostos pela ambiência
organizacional. A elaboração de diretrizes estratégicas e dos planos de negócios
devem contar com o aporte de informações orgânicas que somente o arquivo poderá
fornecer. Entretanto, para que essa função seja desempenhada a contento será
necessário incluir a arquivística, como propõem Rousseau e Couture24, no interior da
organização e da gestão da informação.
O resultado investigação culmina com a discussão e a proposição de uma
metodologia que associa e complementa a atividade de classificação aos temas dos
documentos que deverão estar coligidos em descritores a serem selecionados e
padronizados em uma taxonomia, objetivando trazer novos pontos de acesso para a
melhoria do processo de busca e recuperação da informação e cumprindo com a
proposta formulada por Robertson apud Araújo Júnior25, sobre as principais
características de um “bom” sistema de recuperação da informação: efetividade que
diz respeito ao quão bem ele desempenha uma tarefa delegada; benefício o quanto se
ganha com a sua utilização em determinado contexto; e eficiência que relaciona-se
com o custo de toda a operação, isto é, equilíbrio entre custo e benefício. Cabe
ressaltar, que a proposta aqui desenvolvida apenas introduz o tema da recuperação
de documentos de arquivo em um sistema, não houve a pretensão, em nenhum
momento, de esgotar o assunto, mas de trazer para o debate um tema ainda carente
de discussão e proposições no âmbito da arquivística moderna.
A continuidade dos estudos no âmbito da temática proposta, certamente passa pela
integração de uma taxonomia construída em função de um contexto arquivístico e a
proposição um sistema informatizado de recuperação da informação que considere,
como vocabulário controlado, esta taxonomia. No presente trabalho, foi discutida
uma proposta metodológica que deverá ser desenvolvida, a fim de criar um protótipo
de aplicação em um estudo de caso a ser selecionado e que se desdobrará em
inúmeras tarefas e providências consideradas como parte de estudos futuros.
Bibliographie
ARAÚJO JÚNIOR, Rogério Henrique de - Precisão no processo de busca e
recuperação da informação. Brasília: Thesaurus, 2007. 175 p. ISBN 978-857062-655-
4.
BAPTISTA, Dulce Maria; ARAÚJO JÚNIOR, Rogério Henrique de; CARLAN, Eliana
- O escopo da análise da informação [Em linha] In ROBREDO, Jaime; BRÄSCHER,
Marisa, org. - Passeios pelo bosque da informação: estudos sobre a representação e
organização da informação e do conhecimento. Brasília: IBICT, 2010. [Consult. 24
Out. 2014], 336 p. Pt. 3, p. 61-80. Disponível
em http://www2.senado.leg.br/bdsf/bitstream/handle/id/189812/eroic.pdf?
sequence=3. ISBN 978-85-7013-072-3.
Notes
1 FOSCARINI, Fiorella - La clasificación de documentos basada en funciones: comparación de la teoria
y la práctica. Tabula. Salamanca. ISSN 1132-6506. Nº 13, (2010), p. 41-58.
2 DURANTI, Luciana; EASTWOOD, Terry; MACNEIL, Heather - Preservation of the integrity of
electronic records. Dordrecht: Kluwer Academic Publishers, 2003. 172 p. ISBN 1-4020-0991-7.
3 SOUSA, Renato Tarciso Barbosa de - Os princípios da teoria da classificação e o processo de
organização de documentos de arquivo. Arquivo e Administração. Rio de Janeiro. ISSN 0100-2244. V.
6, nº 1, (2007), p. 5-26.
4 BAPTISTA, Dulce Maria; ARAÚJO JÚNIOR, Rogério Henrique de; CARLAN, Eliana - O escopo da
análise da informação [Em linha] In ROBREDO, Jaime; BRÄSCHER, Marisa, org. - Passeios pelo
bosque da informação: estudos sobre a representação e organização da informação e do conhecimento.
Brasília: IBICT, 2010. [Consult. 24 Out. 2014], 336 p. Pt. 3, p. 61-80. Disponível
em http://www2.senado.leg.br/bdsf/bitstream/handle/id/189812/eroic.pdf?sequence=3. ISBN 978-
85-7013-072-3.
5 Ib.id.
6 SOUSA, Renato Tarciso Barbosa de; ARAÚJO JÚNIOR, Rogério Henrique de - A produção científica
da arquivologia em classificação, descrição e recuperação: o estado da arte. Rio de Janeiro: Associação
dos Arquivistas Brasileiros, 2013. 40 p. ISBN 978-85-85800-08-6.
7 CONSELHO NACIONAL DE ARQUIVOS - E-ARQ Brasil: modelo de requisitos para sistemas
informatizados de gestão arquivística de documentos. Rio de Janeiro: Arquivo Nacional, 2011. 136 p.
ISBN 978-85-60207-30-5.
8 SOUSA, Renato Tarciso Barbosa de - Os princípios da teoria da classificação e o processo de
organização de documentos de arquivo. Arquivo e Administração. Rio de Janeiro. ISSN 0100-2244. V.
6, nº 1, (2007), p. 5-26.
9 Ib. Id.
10 FOSCARINI, Fiorella - La clasificación de documentos basada en funciones: comparación de la
teoria y la práctica. Tabula. Salamanca. ISSN 1132-6506. Nº 13, (2010), p. 41-58.
11 SCHELLENBERG, Theodore Roosevelt - Arquivos modernos. Princípios e técnicas. 5ª ed. Rio de
Janeiro: FGV, 2008. 388 p. ISBN 852-25-0374-5.
12 SCHELLENBERG, Theodore Roosevelt - Arquivos modernos. Princípios e técnicas. 5ª ed. Rio de
Janeiro: FGV, 2008. 388 p. ISBN 852-25-0374-5.
13 FOSCARINI, Fiorella - La clasificación de documentos basada en funciones: comparación de la
teoria y la práctica. Tabula. Salamanca. ISSN 1132-6506. Nº 13, (2010), p. 41-58.
14 FOSCARINI, Fiorella - La clasificación de documentos basada en funciones: comparación de la
teoria y la práctica. Tabula. Salamanca. ISSN 1132-6506. Nº 13, (2010), p. 41-58.
15 Ib. Id.
16 SCHELLENBERG, Theodore Roosevelt - Arquivos modernos. Princípios e técnicas. 5ª ed. Rio de
Janeiro: FGV, 2008. 388 p. ISBN 852-25-0374-5.
17 ARAÚJO JÚNIOR, Rogério Henrique de - Precisão no processo de busca e recuperação da
informação. Brasília: Thesaurus, 2007. 175 p. ISBN 978-857062-655-4.
18 GUEDES, William; ARAÚJO JÚNIOR, Rogério Henrique de - Estudo das similaridades entre a
teoria matemática da comunicação e o ciclo documentário. Informação & Sociedade: Estudos. João
Pessoa. ISSN 1809-4783. V. 24, nº 2, (2014), p. 71-81.
19 ROBREDO, Jaime - Documentação de hoje e de amanhã: uma abordagem revisitada e
contemporânea da ciência da informação e de suas aplicações biblioteconômicas, documentárias,
arquivísticas e museológicas. Brasília: Edição de autor, 2005. 245 p. ISBN 85-7062-381-X.
20 GUEDES, William.; ARAÚJO JÚNIOR, Rogério Henrique de - Estudo das similaridades entre a
teoria matemática da comunicação e o ciclo documentário. Informação & Sociedade:Estudos. João
Pessoa. ISSN 1809-4783. V. 24, nº 2, (2014), p. 71-81.
21 ARAÚJO JÚNIOR, Rogério Henrique de - Precisão no processo de busca e recuperação da
informação. Brasília: Thesaurus, 2007. 175 p. ISBN 978-857062-655-4.
22 ARAÚJO JÚNIOR, Rogério Henrique de - Precisão no processo de busca e recuperação da
informação. Brasília: Thesaurus, 2007. 175 p. ISBN 978-857062-655-4.
23 Adaptado de ARAÚJO JÚNIOR, Rogério Henrique de - Precisão no processo de busca e
recuperação da informação. Brasília: Thesaurus, 2007. 175 p. ISBN 978-857062-655-4.
24 ROSSEAU, Jean-Yves; COUTURE, Carol - Os fundamentos da disciplina arquivística. Lisboa:
Publicações Dom Quixote, 1998. 356 p. ISBN 972-20-1428-5.
25 ARAÚJO JÚNIOR, Rogério Henrique de - Precisão no processo de busca e recuperação da
informação. Brasília: Thesaurus, 2007. 175 p. ISBN 978-857062-655-4.
Auteurs
Renato Tarciso Barbosa de Sousa
Universidade de Brasília
Universidade de Brasília
© Publicações do Cidehus, 2017
Conditions d’utilisation : http://www.openedition.org/6540