Você está na página 1de 16

ARTIGO

Preservao digital em repositrios institucionais:


prticas na regio Sudeste do Brasil
Digital preservation in institutional repositories: practices in
Southeastern Brazil
Simone da Rocha Weitzel
Marco Aurlio Alencar de Mesquita**

RESUMO

ABSTRACT

Tem por objetivo a identificao das boas


prticas de preservao digital aplicada
aos repositrios institucionais (RIs), em
instituies pblicas de ensino e de
pesquisa na regio Sudeste do Brasil.
Ressalta o papel da poltica de
preservao digital nas prticas de
preservao.
Utiliza
a
pesquisa
documental como mtodo de coleta de
dados
nos
RIs
selecionados,
e
questionrio de perguntas fechadas
aplicados s instituies. Realiza anlise
quantitativa dos resultados, destacando
as divergncias aferidas entre os
resultados das pesquisas. Estabelece,
baseado na literatura e nos resultados
obtidos,
subsdios
para
o
desenvolvimento
de
poltica
de
preservao digital.

Aims to identify good practices of digital


preservation applied to institutional
repositories (IRs) in public institutions of
education and research in the Southeast
of Brazil. Highlights the benefits of digital
preservation policy in the establishment
of preservation practices. It is based on
documental research methods such as
data collection in selected IRs, and
questionnaires in a closed questionnaire
format, applied to institutions. Based on
the technical literature and research
results, it establishes a contribution
towards the development of digital
preservation policy.
Keywords:
Digital
Preservation;
Institutional Repository; DSpace; Digital
Preservation Strategies

Palavras-chave:
Preservao
Digital;
Repositrio
Institucional;
DSpace;
Estratgias de Preservao Digital.

INTRODUO
Os benefcios que a introduo das tecnologias da informao e comunicao (TIC)
trouxeram para os sistemas de comunicao e produo cientfica so inegveis e
inovadores. Estes benefcios alcanam tambm os repositrios institucionais (RIs),
que contribuem para a disseminao e democratizao do acesso informao.
Contudo, a facilidade na divulgao de documentos proporcionada pela TIC por meio

Professora associada da Universidade Federal do Estado do Rio de Janeiro. Doutora em Cincia da


Informao. Endereo: Avenida Pasteur, 458, prdio do CCH, sala 404, CEP 22290-240, Rio de Janeiro, RJ.
Telefone (21) 2542-1656. E-mail: sweitzel@unirio.br.
**

Bacharel em Biblioteconomia pela Universidade Federal do Estado do Rio de Janeiro (Unirio) e


Bibliotecrio do Banco de Imagens Tyba Online. E-mail: marcoaum@gmail.com.

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

181

dos RIs pode esconder percalos prprios ao de um acervo, tal como o bibliogrfico,
no tocante preservao e garantia do acesso.
Conforme aponta Cunha (1999), a preservao material do papel requer espao
fsico, condies climticas, cuidados no manuseio, controle de emprstimo, alm de
custos com a biblioteca (manuteno do prdio, gua, luz). Parece certo que com o
novo paradigma digital ou hyper-paradigm, como define Goicoechea (2007), em que
o prefixo hyper representa os hipertextos , a concentrao do acervo em um RI
aparenta, em um primeiro momento, a soluo para diversos desses problemas. Ela
representa, na verdade, a modificao de alguns aspectos de preservao que no
podem ou no devem ser ignorados, como o estabelecimento de protocolos
gerais de backup dos arquivos de sistema ou at mesmo de um mdulo hbrido de
trabalho, no caso de uma interrupo parcial do servio.
O Instituto Brasileiro de Informao em Cincia e Tecnologia (Ibict) investiu em vrias
iniciativas alinhadas ao Movimento do Acesso Aberto para apoiar a implantao de
repositrios institucionais no Brasil nas ltimas dcadas seja desenvolvendo a
traduo do software livre DSpace e incentivando sua ampla adoo, seja com o
lanamento de editais da Finep garantindo a distribuio de kits tecnologicos e apoio
tecnico-operacional para as instituies contempladas pelos editais na implantao
de RIs.
Essas estratgias geraram frutos importantes para o pas, tanto no sentido de
potencializao da produo cientfica nacional, quanto em termos de participao
mundial com contedos em portugus, especialmente de acesso aberto. No entanto,
dados do OpenDOAR revelam que entre 2.509 repositrios ali cadastrados somente,
7,4% possuem uma poltica de preservao digital formalizada, ao passo que no Brasil
h mais de 80% de RIs sem uma poltica de preservao definida e cerca de 10,8% sem
poltica formalizada. Considerando que, de acordo com Sayo (2007), a preservao
digital pode ser entendida como o conjunto de estratgias e protocolos na unidade
da informao que visam manuteno do banco de dados e dos objetos digitais
disponibilizados, devidamente formalizados, no h como desenvolver ambientes
com contedos digitais sem pensar em sua preservao. Este conjunto de estratgias
e protocolos representa um compromisso de longo prazo com o acesso e a
preservao (SAYO, 2007), sendo sua formalizao imprescindvel para a garantia da
eficcia do sistema. Assim, o interesse em identificar quais seriam as principais aes
de preservao que os RIs brasileiros vm desenvolvendo configurou o problema de
pesquisa.
Tendo em vista esse contexto, o presente estudo analisou as polticas de preservao
digital em repositrios institucionais (RIs) situadas na regio Sudeste brasileira que
utilizam como base tecnolgica o DSpace, por meio de pesquisa documental nos RIs
selecionados e questionrio de perguntas fechadas aplicados s instituies. Para
estabelecer uma amostra das instituies a serem pesquisadas, partiu-se dos mesmos
critrios de seleo de instituies elegveis adotados para um edital de apoio a
projetos de implantao de repositrios institucionais. Neste caso, foram utilizados
os critrios do Edital Finep/PCAL/XBDB 003/2009, a saber:
a) Ser uma instituio pblica de ensino e pesquisa com atuao em territrio
nacional.
b) Manter programas de ps-graduao reconhecidos pelo MEC/Capes.
c) Ter o compromisso com o modelo de interoperabilidade Open Archives.

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

182

Devido s restries de cobertura do tema, a amostra limitou-se regio Sudeste.


A pesquisa teve como objetivo principal a identificao das boas prticas de
preservao digital aplicada aos repositrios institucionais das instituies pblicas
de ensino e pesquisa na regio Sudeste do Brasil, a fim de contribuir com subsdios
para a elaborao de uma poltica especfica para os RIs. Para isso, foi necessrio:
a) Identificar as estratgias de preservao digital usada isoladamente ou
combinadas nos RIs das instituies pblicas de ensino e de pesquisa.
b) Identificar se a poltica de preservao digital est formalizada.
c) Identificar como esta poltica est estabelecida: se uma poltica da unidade
de informao; se da organizao ou de parte de uma rede de colaborao.
d) Identificar a interao dos RIs com iniciativas de preservao digital;
A partir dos resultados identificados, confirma-se a situao dos RIs brasileiros em
relao inexistncia de poltica, uma vez que dentre os nove RIs pesquisados,
somente um possui a poltica formalizada. Esse fato pode ser responsvel por
prticas pobres, tais como o baixo ndice do uso de extenses de arquivos de alta
adequao de preservao digital e a falta de diversificao nas estratgias de
preservao digital, privilegiando: backup; incluso de metadados; e preservao da
tecnologia.
Espera-se que o presente estudo possa contribuir para futuras pesquisas, sobretudo
para a anlise do status quo dos RIs em relao preservao digital, bem como para
sensibilizar gestores de RIs da necessidade de engajamento nessa rea, alm de
orientar na elaborao de polticas para fomentar as melhores prticas em
preservao digital.

PRESERVAO DIGITAL EM REPOSITRIOS INSTITUCIONAIS


O conhecimento produzido, preservado e transmitido s geraes futuras pode ser
considerado um dos grandes diferenciais da humanidade. O conhecimento
preservado possibilitou o avano da cincia, que se caracteriza por ser uma
instituio social, dinmica, contnua, cumulativa (TARGINO, 2000, p. 2).
Devido a essas caractersticas, a preservao e o acesso do conhecimento cientfico
produzido ao longo de geraes de pesquisadores impulsiona a criao de um novo
conhecimento para as geraes futuras. A ressignificao de um objeto na cincia
moderna pressupe avano, confirmao ou refutao de uma pesquisa j realizada,
conforme nos explica Abrantes e Martins:
A construo prxica [sic] do conhecimento nos remete, portanto,
realidade histrica a se conhecer, visto que os indivduos se
desenvolvem em relaes de apropriao da histria contida nos
objetos produzidos pelo homem e nas relaes estabelecidas entre
eles na base de tais produes (ABRANTES; MARTINS, 2007, p.
315).

A necessidade de se salvaguardar o conhecimento registrado remonta s mais


antigas civilizaes. Vidal (2010, p. 146) destaca o fato de que desde a antiguidade a
Humanidade procurou, nos mais diversos suportes, guardar, conservar e preservar a
sua memoria. Independentemente do suporte do registro da informao, a
necessidade de preserv-los sempre foi um sentimento comum aos homens.

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

183

Apesar de a prpria palavra biblioteca designar um local onde se armazenam livros


(MORIGI; SOUTO, 2005, p. 190) e, ainda povoar, no imaginrio popular, o papel da
biblioteca clssica, definida como aquela onde a maioria dos itens do seu acervo e
constituda de documentos em papel (CUNHA, 1999, p. 258), pouco se imagina que
as bibliotecas sempre atuaram na vanguarda da tecnologia, pois:
A biblioteca possui, como instituio social, uma longa e complexa
histria pouco conhecida pela maioria das pessoas. As tecnologias
da imprensa, mquina de escrever, telefone, telex, mimegrafo,
microfilme, carto perfurado nas margens, computador, disco
tico e redes eletrnicas afetaram e alteraram a biblioteca ao
longo do tempo. Algumas dessas tecnologias, tais como o
microfilme e o disco tico, tiveram suas primeiras aplicaes
testadas dentro de uma biblioteca (CUNHA, 1999, p. 257).

Atualmente, conforme aponta Sayo (2005), grande parte dos documentos


gerados j nasce digitalmente, mesmo no havendo estrategias consolidadas para
garantir o acesso de longo prazo s informaes digitais (SAYO, 2005, p. 116). Isso
se d pela facilidade em produzir o que Sayo chama de compulso e compartilhar
os documentos, que infinitamente superior capacidade de preserv-los. A
sociedade contempornea traz em si a urgncia do acesso, da produo e do
compartilhamento. Talvez seja esta uma hiptese para explicar porque os
documentos atuais nascem digitalmente, e os que no nasceram digitalmente so
convertidos ao novo formato.
Uma srie de polticas que visam modificao da relao entre os produtores da
informao e os usurios vem sendo discutida, entre elas o Copyleft e o Movimento
de Acesso Aberto. Este ltimo responsvel pela criao de servios, protocolos e
polticas que visam, entre outros objetivos, interoperabilidade dos provedores de
dados e servios. Um desses sistemas so os Repositrios Institucionais que
Inseridos no corao do movimento mundial em favor do acesso
aberto informao cientfica, [...] constituem de fato inovao no
sistema de comunicao da cincia e no modo como a informao
aquela que alimenta e resulta das atividades acadmicas e
cientficas gerenciada. (LEITE et al., 2012, p. 7).

Os repositorios institucionais so, segundo Santos Jnior (2010, p. 36), colees


digitais que armazenam, preservam, divulgam e do acesso produo intelectual de
uma determinada comunidade, onde os documentos so disponibilizados
irrestritamente na web. Ou seja, destaca-se entre as formas atuais de dinamizao e
democratizao do acesso informao, por suas caractersticas genricas um tipo
de coleo que conta com diversos tipos de documentos e formatos divulgados na
web, alm de ser gerenciado por uma instituio que garante verificao e
tratamento da informao prestada.
Os repositrios nascem da necessidade da criao de um espao nico de acesso s
informaes produzidas sobre uma determinada instituio, portanto
multidisciplinar, sendo um ponto confivel de coleta de dados e informaes, num
ambiente controlado, hierarquizado e ordenado, associando as vantagens dos
acervos digitais, como acesso aberto, por exemplo. Alm disso, ele segue a lgica da
Iniciativa dos Arquivos Abertos, em que os resultados de pesquisa produzidos com
financiamento pblico por intermdio de agncias de fomento, por exemplo, devem
ser disponibilizados gratuitamente na web, caracterizando o que se convencionou
denominar de Acesso Aberto Verde, por meio dos RIs (SANTOS JNIOR, 2010).

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

184

A PRESERVAO DIGITAL
A preservao um fator primordial, tanto para os documentos impressos, entre
outros materiais, quanto para os digitais. A garantia de acesso futuro no pode ser
considerada um item inerente automatizao dos processos, mas, assim como nos
documentos em papel, deve surgir a partir da adoo de ferramentas que protejam
e garantam a sua manuteno (MRDERO ARELLANO, 2004, p. 17).
A preservao digital e um esforo que exige polticas, estrategias e aes para
garantir, no decorrer dos anos, acesso a contedo vlido apesar dos desafios
impostos pelos suportes (mdias) e mudanas tecnologicas (CORRA, 2010, p. 23).
No , portanto, fruto de uma ao isolada, mas de um esforo institucional para
garantir o acesso futuro aos documentos digitais. Estas polticas devem existir,
preferencialmente, por escrito, pois independentemente de serem utilizadas de
modo individual, entre instituies que trabalham por cooperao, elas
documentam o compromisso de uma instituio com a
conservao de contedo digital para uso futuro; especificam os
formatos de arquivos a serem mantidos e o nvel de preservao a
ser providenciado; e documentam o compromisso de organizar o
processo de preservao de acordo com padres e melhores
prticas que garantam uma custdia responsvel (CORRA, 2010,
p. 23-24).

Ao contrrio dos documentos que apresentam suportes materiais, como o papel ou


pergaminho, por exemplo, que em condies especficas podem ficar anos, dcadas,
sculos preservados, prontos para transferir a informao ali depositada prxima
pessoa que o acessar, os documentos digitais necessitam de vrios elementos
externos para realizar esta mesma transferncia. Sendo assim, para muitos
documentos analgicos, a preservao do suporte e sua forma fsica garantem a
conservao de seu contedo (CORRA, 2010, p. 24), o que no pode ser garantido
com os objetos digitais. Um livro pode ficar dcadas sobre uma mesa em condies
especficas e ser relido nos dias futuros, quando dificilmente uma msica em uma
fita K7 ser ouvida hoje em dia, em lares onde j existem rdios com entradas USB. A
preservao digital deve ter como principal meta garantir recuperao e visibilidade
do documento digital no futuro (SANTHANAGOPALAN; FOX; McMILLAN, 2006, p. 1).
Isso tende a no acontecer devido ao fato de que a informao tem um fator de
dependncia do seu ambiente tecnico (SANTHANAGOPALAN; FOX; McMILLAN,
2006, p. 1). Garantir a existncia de um arquivo/formato pode no significar
automaticamente a garantia de acesso aos arquivos nas mesmas condies em que
foram produzidos, pois o software reprodutor daquele contedo pode ter sido
atualizado, imputando modificaes considerveis ao arquivo. Essa obsolescncia
natural ou provocada (GRANGER, 2002) traz uma grande fragilidade aos documentos
nascidos digitalmente.

ESTRATGIAS E INICIATIVAS EM PRESERVAO DIGITAL


As diversas estratgias de preservao digital (PD) existentes visam contribuir para a
preservao do objeto digital e garantir o acesso futuro. As estratgias no
comportam todos os itens previstos para uma PD, esto sempre focadas em um item
especfico do tema, evidenciando a complexidade do problema da preservao
digital. Parece no haver uma estratgia nica capaz dar conta de todos os processos

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

185

de preservao digital (SAYO, 2005), mas ainda assim possvel salientar pontos
comuns para a preservao digital.
Na literatura, possvel identificar diversas estratgias de preservao digital, tais
como: preservao da tecnologia, emulao, migrao, encapsulamento, metadados
(descritivos, estruturais e administrativos), identificadores persistentes, backup,
redes de distribuio de preservao digital, por exemplo. Tambm se deve levar em
considerao os tipos e extenses que povoaro o RI, para que seja minimizada a
necessidade de migraes em massa.
As iniciativas em PD so aes conjuntas que visam produzir uma maneira racional e
colaborativa de preservao digital. O esforo pela preservao digital envolve
diversos fatores, sendo possvel que fatores financeiros possam ser sinalizados como
obstculos na sua execuo. As iniciativas de preservao digital surgem como um
auxlio na tarefa extremamente trabalhosa e custosa para apenas uma instituio
desenvolver.
Dentre estas iniciativas, podemos citar o LOCKSS (Lots of Copies Keeps Stuff Safe
em ingls, Muitas copias mantm os materiais a salvo, em traduo livre) que e um
software de cdigo aberto que permite a criao de redes privadas locais, em
traduo livre para Private LOCKSS Network em ingls (PLN). As PLNs preservam
cpias de contedos digitais criados localmente por organizaes cientficas e
culturais (MRDERO ARELLANO, 2012, p. 85).
A Rede Cariniana e uma iniciativa do Ibict, que tem o objetivo de propor a
construo e customizao de uma rede nacional de servios de preservao digital
(MRDERO ARELLANO, 2012, p. 87), contando com a parceria de instituies de
ensino e pesquisa e com a colaborao de especialistas brasileiros, nesta construo.
Sua atuao refora a necessidade da criao de iniciativas de preservao que
garantam a salvaguarda dos registros digitais em mbito nacional. Trata-se de uma
importante iniciativa que busca orientar as instituies na prtica da preservao
digital de publicaes de acesso aberto, oferecendo pacotes de softwares,
aplicaes e ambientes multimdia para a implementao e desenvolvimento de
documentos digitais preservveis (MRDERO ARELLANO, 2012, p. 87).
A operacionalizao da rede baseada no LOCKSS, adotando o modelo de DDP com
pretenses de atingir redes de mbito nacional. Proporciona um espao para a busca
de melhores metodologias e prticas em preservao digital, de forma colaborativa.

Estudos de casos
Para identificar as melhores prticas em preservao digital (PD) nos repositrios
Institucionais (RIs) das instituies pblicas de ensino e de pesquisa na regio
Sudeste, verificando de que maneira estas aes esto formalizadas como poltica,
empregaremos dois mtodos combinados para descrever os estudos de caso: a)
pesquisa documental, para a coleta de dados nos RIs sobre as informaes bsicas
referente s polticas e aos demais aspectos gerais da estratgia de PD; e b)
questionrio com questes fechadas para coletar dados mais especficos.
Posteriormente, foi realizada uma anlise quantitativa das respostas para identificar
as boas prticas em relao PD em RIs.
Os RIs foram selecionados para a amostra da pesquisa baseados nos critrios de
instituies elegveis do Edital Finep/PCAL/XBDB 003/2009, presentes na regio
Sudeste do Brasil. Estes critrios delimitam um escopo do perfil das instituies

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

186

selecionadas pela amostra, tendo em vista a diversidade de assuntos e atividades dos


repositrios institucionais existentes, e garantindo a homogeneidade das instituies
selecionadas e o uso de uma ferramenta comum: o DSpace, atendendo ao quesito da
utilizao do modelo de interoperabilidade Open Archives.
Os nove repositrios selecionados para a amostra esto assim distribudos:
Quadro 1 Amostra de Repositrios Institucionais.
tec

UF

Tamanho da Coleo

SP

43.350

MG

2.588

SP

338

SP

1.374

RJ

425

MG

4.237

SP

126

SP

231

RJ

225

Fonte: Elaborado pelos autores.

A pesquisa documental baseou-se na visita ao endereo eletrnico dos nove


repositrios institucionais selecionados e listados acima para avaliar a disponibilidade
de recursos e informaes bsicas aos usurios dos sistemas. Foram selecionados
cinco perguntas baseados nos critrios do edital de fomento aos RIs e na literatura
tcnica referente ao assunto, com o objetivo de identificar a coleo, as polticas e
estratgias de preservao digital, a saber: tamanho da coleo; poltica de
preservao digital acessvel; relao dos formatos de arquivos aceitos; identificao
da participao em redes de preservao distribuda e se apresenta identificao
persistente no link de endereo aos objetos digitais.
Foi desenvolvido um questionrio com 12 questes fechadas, elaboradas com o
objetivo de identificar as prticas das instituies com relao preservao digital.
Suas questes foram agrupadas em trs blocos: identificao da instituio, poltica
de preservao digital e estratgias de preservao digital.
O questionrio foi desenvolvido por meio de um formulrio online, utilizou recursos
online Google.docs para a tabulao dos resultados e a coleta de dados,
permitindo o acompanhamento das respostas em tempo real e ficando disponvel
para resposta durante um ms.
Apesar da receptividade dos bibliotecrios em relao ao questionrio, em alguns
casos a resposta foi enviada aps troca de diversas mensagens sobre a necessidade
do levantamento para a concluso desta pesquisa.

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

187

TABULAO E ANLISE DOS DADOS


Os resultados apresentados correspondem a uma amostra total de nove repositrios
da regio Sudeste, de instituies pblicas de ensino e de pesquisa com atuao em
territrio nacional, mantenedoras de programas de ps-graduao reconhecidos pelo
MEC/Capes, conforme o critrio de instituies elegveis do Edital Finep/PCAL/XBDB
003/2009. Os resultados sero apresentados em duas sees: pesquisa documental e
questionrio.
O primeiro ponto a ser avaliado na pesquisa documental diz respeito ao tamanho da
coleo. Foi possvel identificar um grande nmero cinco a nove RIs que
apresentam uma coleo menor que 500 registros, divergindo do resultado aferido
no questionrio, respondido pelos gestores dos RIs, conforme veremos mais frente.
Os resultados foram obtidos por meio do somatrio dos valores encontrados nos
endereos eletrnicos dos repositrios selecionados na amostra. Cada comunidade
inserida no repositrio traz o total de registros cadastrados em sua categoria,
formando assim o nmero total de registros daquele repositrio.
O segundo item avaliado na pesquisa documental foi a publicidade da poltica de
preservao digital. Dos nove RIs visitados, oito no tornam acessveis suas polticas
de preservao digital. Apenas um dos repositrios pesquisados torna a sua poltica
disponvel, mas em forma de resoluo, no se aprofundando em questes tcnicas.
A mesma instituio, em resposta ao questionrio, informou que h uma poltica de
PD vlida para toda a instituio, porm no tivemos acesso, por ser um documento
interno. No possvel descartar a possibilidade que essa poltica de fato exista nos
demais RIs pesquisados, mas no por escrito.
Outro item analisado corresponde indicao aos formatos autorizados para
incluso no RI. No foi possvel identificar em nenhum dos RIs pesquisados quais so,
de fato, os formatos de arquivos disponveis e passveis de povoamento nos
repositrios, sendo possvel mensur-los apenas no questionrio.
Tambm por meio da pesquisa documental, foi possvel identificar que no h
qualquer participao dos RIs em redes de preservao distribuda. Mesmo que dois
dos nove RIs pesquisados tenham declarado realizar este modo de preservao
digital durante a resposta do questionrio, como veremos a seguir no possvel
identificar de maneira clara esta parceria no endereo eletrnico dos RIs pesquisados.
O ltimo item analisado na pesquisa documental foi apresentao de link
persistente nos endereos dos objetos digitais, onde foi possvel identificar um uso
de 100% do Handle System.
Os dados apresentados a seguir foram coletados atravs de questionrio de
perguntas fechadas com nove RIs. Dos quatro estados da federao que compe a
regio Sudeste do Brasil, apenas o Esprito Santo no possui RI contemplado na
amostra. Ento, a distribuio geogrfica dos RIs pesquisados dividida entre: duas
unidades no Rio de Janeiro, duas em Minas Gerais e cinco no estado de So Paulo,
conforme foi mostrado no Quadro 1.
H uma concentrao de RIs no estado do So Paulo. Este percentual composto
pelo maior nmero de unidades que correspondem aos critrios de seleo da
pesquisa, distribuda tambm pelo interior do estado, ao contrrio aos demais, que se
concentram apenas na capital ou cidades-chave.
O questionrio revelou que cinco dos nove RIs pesquisados possui um acervo
superior 2.000 registros, sendo um total divergente com o resultado aferido na
pesquisa documental.
Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,
http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

188

A amostra revelou tambm que oito dos nove RIs pesquisados no possuem uma
poltica de preservao digital formalizada. A falta deste documento, formalizado
escrito de fato pode evidenciar problemas em relao padronizao de critrios,
mtodos ou periodicidade definida para o desenvolvimento do processo de
preservao digital. O conhecimento tcito no deve ser a nica fonte de
conhecimento para aes de poltica de preservao digital, conforme foi
evidenciado pelos resultados obtidos. Somente um dos nove RIs possui uma poltica
de preservao digital institucionalizada. A poltica de preservao digital, quando
formalizada e pblica, ajuda a sedimentar um posicionamento transparente do
repositrio em relao preservao digital, orientando os autores (depositantes) a
respeito dos procedimentos adotados e reforando a garantia de perpetuao e
acesso.
A participao em iniciativas em preservao digital em rede demostrou um
percentual negativo em sete dos nove RIs pesquisados. Dos dois que responderam
positivamente, apenas a iniciativa da Rede Cariniana foi citada, sendo uma delas
mencionada como a do Ibict, mesmo constando a Rede Cariniana entre as opes
de resposta.
Em relao s estratgias de preservao digital utilizadas, um nmero significativo
de RIs sete declararam utilizar o backup como estratgia de preservao digital,
seguido de quatro menes incluso de metadados, sendo que apenas uma
unidade declarou realizar as duas estratgias ao mesmo tempo, e um RI declarou
realizar as duas anteriores e, ainda, a preservao da tecnologia. Assim, possvel
identificar que as estratgias de backup e incluso de metadados esto mais
difundidas nos RIs, sendo citadas apenas trs estratgias nos resultados. No
receberam nenhuma citao estratgias como migrao, encapsulamento ou
preservao digital distribuda.
A identificao persistente tambm revelou um resultado divergente ao apresentado
na pesquisa documental. Houve a declarao de uso preferencial de dois sistemas de
identificao: o Handle System trs RIs e o DOI dois RIs , com os demais
declarando no utilizar nenhum sistema de identificao persistente, o que
representa uma considervel divergncia com os resultados da pesquisa documental,
que apresentaremos a seguir.
Foi levantada uma extensa relao de formatos de texto, imagem, udio e vdeo,
submetendo as extenses no questionrio, para que os gestores dos RIs
identificassem quais delas so aceitas no povoamento do RI.
Para a apresentao dos resultados dos arquivos utilizados, precisou-se de um
arranjo diferenciado, devido grande opo de respostas. Para isso, foram
selecionados apenas as extenes que receberam alguma meno na resposta do
questionrio. Em seguida, os resultados foram separados em quadros onde aparecem
subdividios em trs, a saber: alta, mdia e baixa adequao para preservao,
classificao baseada na tabela de adequao para a preservao de Munhoz (2011).
Sendo assim, os resultados obtidos correspondem aos quadros a seguir:
Quadro 2 Resultados Tipos de Arquivos Texto (todos os RIs).

Alta

Extenso

Uso (N do RI)

PDF/A

1, 3, 4, 6, 8 e 9

TXT

2, 3, 6 e 9

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

189

Alta

Mdia

Baixa

HTML, XHTML ou XML

2e3

ODT

PDF

Todos

DOCX

3, 4, 6 e 9

RTF

6e9

CSS

DOC

3, 4, 6 e 9

Todos os formatos

Fonte: elaborado pelos autores.

possvel identificar uma forte tendncia na utilizao dos arquivos em PDF/A e PDF,
mesmo sendo de classificao de adquao para preservao diferentes, alta e
mdia, respectivamente.
A anlise de extenses de imagens levou em considerao os cinco RIs que no
aceitam imagens (os RIs 1, 5, 7, 8 e 9), no classificando seu resultado em nenhum
categoria. Tambm se levou em considerao os RIs que declararam aceitar qualquer
tipo de imagem, classificando esse resultado como de baixa adequao para a
preservao digital, por ser uma prtica nociva ao prprio RI.
Quadro 3 Resultados Tipos de arquivos Imagem.

Alta

Mdia

Baixa

Extenso

Uso (N do RI)

TIF

2e3

PNG

JPG

2, 3, 4, 6

GIF

3e6

BMP

PSD

TIFF

Todos os formatos

Fonte: elaborado pelos autores.

Assim, possvel identificar uma disparidade entre o uso das extenses com alta e
mdia adequao. Alm disso, das quatro opes de extenso disponveis para alta
adequao, conforme Munhoz (2011), apenas duas foram citadas.
A anlise dos resultados para as extenses de vdeo no considerou os RIs que no
aceitam este tipo de mdia (RIs 5, 7, 8 e 9). Os resultados demonstram uma maior
tendncia no uso de arquivos de mdia adequao, apesar do tambm elevado ndice
de alta adequao.

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

190

Quadro 4 Resultados Tipos de arquivo Vdeo.

Alta

Mdia
Baixa

Extenso

Uso (N do RI)

MOV

2e3

AVI

2e4

MPEG

2, 3, 4 e 6

MP4

1, 2, 4

Todos os formatos

Fonte: elaborado pelos autores.

O resultado tambm demonstra que apenas quatro dos dez formatos disponveis
(sem levar em considerao as variaes), conforme Munhoz (2011), foram citados
nas respostas, o que sinaliza a baixa adeso deste formato nos RIs. Grande parte das
extenses de vdeos declaradas em resposta ao questionrio foi de mdia
adequao.
Desse modo, os formatos citados durante o questionrio correspondem ao quadro a
seguir apresentado, culminando na amostra consolidada dos formatos utilizados nas
instituies pblicas de ensino e pesquisa com atuao em territrio nacional,
mantenedora de programas de ps-graduao reconhecidos pelo MEC/Capes,
conforme critrio de edital de fomento aos RIs.
Quadro 5 Resultado Consolidado.
Texto

Imagem

Alta

HTML,
XML
TXT
PDF/A
ODT

Mdia

PDF
CSS
RTF
DOCX

GIF
JPG
BMP

MPEG
MP4

DOC

PSD
TIFF

---

Baixa

XHTML

ou PNG
TIF

Uso (N do RI)
MOV
AVI

Fonte: elaborado pelos autores.

Entre os resultados obtidos durante o estudo de caso, importante ressaltar a


discrepncia em dois: tamanho da coleo e identificador persistente.
Por intermdio da pesquisa documental e dos resultados do questionrio, possvel
identificar uma polarizao inversa entre os resultados do quesito tamanho da
coleo. Enquanto na pesquisa documental e revelado o maior ndice de
Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,
http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

191

repositrios com uma coleo menor que 500 registros, os resultados do


questionrio revelam o maior ndice de repositrios com uma coleo acima de 2.000
registros, conforme grfico abaixo.
Grfico Resultados Tamanho da coleo.

Fonte: elaborado pelos autores.

Por meio do grfico comparativo, possvel identificar uma acentuada divergncia


entre o que os gestores declaram como sendo o acervo integral que povoa os RIs e o
total que est de fato disponvel para consulta
A identificao persistente tambm revelou um resultado divergente entre a
pesquisa documental e o questionrio. Confrontando os resultados obtidos na
resposta ao questionrio em que o Handle System obteve trs menes, e o DOI,
duas, ao passo que os outros declararam no utilizar nenhum tipo de identificao
persistente com os resultados da pesquisa documental, verificou-se uma grande
diferena. Durante a pesquisa documental, foi possvel identificar 100% de uso do
Handle System como mtodo de identificao persistente dos objetos digitais, pelo
uso do endereo .../handle/ nas URLs dos que foram depositados nos RIs
selecionados pela amostra.

BOAS PRTICAS DE PRESERVAO DIGITAL


Este trabalho teve por objetivo identificar as boas prticas de preservao digital.
Baseando-se nos resultados obtidos e no conjunto de objetivos genricos
apresentados por Bullock (1999), define-se que a poltica de preservao digital
prescindiria de trs elementos bsicos para sua esquematizao: o objeto digital, os
metadados e a poltica.
O objeto digital que faz parte de um RI precisa ter a garantia de sua preservao em
longo prazo, sem perda de contedo ou modificao na sua apresentao. Para
tanto, necessrio que se estabeleam critrios durante o processo de povoamento
desses objetos, com a escolha de formatos que possibilitem um bom grau de
adequao s prticas de preservao.

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

192

Os metadados devem ter uma participao ainda maior no processo de preservao


digital, ampliando seu uso para alm dos metadados descritivos. necessrio o uso
de metadados estruturais e administrativos, complementando a funo descritiva do
objeto digital no contexto do RI.
A poltica de preservao formalizada deve ser o instrumento para orientar as
prticas de preservao digital, sendo institucionalizadas ou no. Uma vez
formalizada, ela explicitar para a comunidade atendida pelo RI os procedimentos de
preservao, garantindo sua sistematizao e continuidade em longo prazo. Poder,
ainda, garantir a autenticidade e a provenincia de termos de publicao e outros
instrumentos que podem ser associados a ela.
Dessa forma, a presente pesquisa identificou os seguintes critrios que devem ser
considerados nas propostas de polticas de preservao digital:

Escolha de formatos de alta e mdia adequao (visando minimizar a


necessidade de migrao).

Uso de estratgias de preservao como, por exemplo, a incluso de


metadados descritivos (como ttulo, autor e palavras-chave), de backup e,
se possvel, de estratgias de formas combinadas.

Uso de metadados estruturais (auxiliam-nos na estruturao dos


documentos digitais, preservando a sua apresentao) e administrativos
(que auxiliam na gesto do ciclo de vida dos objetos digitais,
possibilitando a incluso de informaes de criao, especificidades e
dependncias tcnicas).

Uso de identificao persistente.

Adeso a uma rede distribuda para preservao digital.

Uso de uma poltica de preservao formalizada.

Esses elementos podero ser utilizados como subsdios para a elaborao de uma
poltica de preservao digital.

CONSIDERAES FINAIS
A pesquisa realizada buscou ressaltar aspectos importantes das estratgias de
preservao digital utilizadas pelos RIs, com o objetivo de mapear, da maneira mais
fiel possvel, as prticas de preservao digital utilizadas no dia a dia, evidenciando
possveis contribuies para a formalizao de um subsdio para polticas de
preservao em repositrios institucionais.
Destacam-se a colaborao de todos os bibliotecrios responsveis pelos RIs na
construo desta pesquisa e no esforo contnuo para, cada vez mais, possibilitar o
acesso informao de forma gil, completa e irrestrita.
Os resultados obtidos por meio da pesquisa documental e do questionrio
demonstraram ser suficientes na identificao dos objetivos da pesquisa, ajudando a
delimitar as estratgias de preservao digital das unidades selecionadas.
Foi possvel tambm identificar que oitos dos nove RIs pesquisados no possuem
uma poltica de preservao digital formalizada, e apenas um RI pesquisado
apresenta uma poltica institucionalizada. Esse percentual atesta o uso inexpressivo
de um recurso to importante como a poltica de preservao digital, estando aqum
dos resultados desejados e demonstrando o distanciamento dessa poltica dos
Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,
http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

193

demais objetivos da universidade/instituio para qual ela presta servio, e que,


certamente, tem interesse na preservao do conhecimento produzido. O baixo
ndice no uso de extenses de arquivos de alta adequao de preservao digital
pode refletir a falta de polticas na escolha desses arquivos.
A poltica de preservao digital um importante instrumento para a garantia do
cumprimento da estratgia de preservao digital. Porm, ficou evidente que este
instrumento no est presente em grande parte dos RIs pesquisados. possvel
presumir que haja atividades de preservao digital nas unidades pesquisadas;
contudo, no foi possvel mensurar sob quais circunstncias ela se d ou se realmente
as aes so cumpridas.
Apurou-se um alto o percentual de RIs que no participam de redes de preservao
digital: sete de nove RIs. A politica de preservao em redes oferece enormes
benefcios, tais como a garantia perene de acesso aos objetos digitais, uma vez que
eles se encontrariam salvaguardados em mais de uma unidade participante da rede.
Tambm ficou evidente nos resultados da amostra a falta de diversificao nas
estratgias de preservao digital. Apenas trs estratgias so citadas: backup,
incluso de metadados e preservao da tecnologia. Alm disso, apenas dois RIs
pesquisados declararam utilizar mais de uma estratgia como medidas
complementares.
Considerando o baixo nmero de polticas institucionais formalizadas, a baixa adeso
s estratgias de preservao em rede e a falta de diversificao das estratgias de
preservao digital, os resultados apresentados comprovam a fragilidade das
colees digitais no que se refere preservao digital.
necessrio um esforo em nvel nacional nas instituies que mantm algum RI, a
fim de que se estabeleam diretrizes slidas para os critrios de criao de uma
poltica de preservao digital.
Cabe ressaltar que mesmo no Edital Finep/PCAL/XBDB 003/2009, usado como
parmetro no critrio para a escolha de instituies elegveis para a amostra desta
pesquisa, o tema da preservao digital no abordado ou mesmo uma garantia de
manuteno mnima do contedo , ainda que o objetivo do edital seja selecionar
projetos de apoio implantao de RIs. certo que o mesmo edital estabelece
compromissos tais como a conexo permanente na internet e a criao de uma
poltica institucional de informao que vise garantir a alimentao do RI por parte
dos pesquisadores das instituies , mas estas medidas garantem, respectivamente,
apenas o acesso e o povoamento, e no a preservao digital. Por consequncia, elas
no se constituem em garantia da manuteno do conhecimento produzido para as
geraes futuras.
A necessidade em produzir por parte dos autores e de organizar e promover
acesso a essa produo por partes dos RIs deve encontrar o equilbrio com a
preservao digital, para garantir que o esforo dispensado hoje esteja acessvel no
futuro.
Os recursos eletrnicos representam, de fato, um avano na comunicao cientfica,
possibilitando acesso rpido e contnuo aos acervos dos RIs. Entretanto, necessrio
lembrar que os recursos tecnolgicos no esto imunes a problemas, tanto no que se
refere aos softwares quanto aos hardwares. Estes problemas podem comprometer o
acesso parcial ou total ao acervo, limitando o seu uso. necessria a criao de
estratgias que visem garantia da permanncia de acesso aos objetos digitais, do
modo como foram desenvolvidos, e, tambm, aos registros dos bancos de dados dos
Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,
http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

194

RIs, para que, havendo qualquer falha, o restabelecimento possa se dar da forma
mais rpida possvel.
As estratgias apresentadas neste trabalho no correspondem, necessariamente,
necessidade de um elevado investimento financeiro para que a preservao digital
seja realizada a contento, mas elas dependem de polticas formalizadas e
sedimentadas nas prticas das instituies que detenham um RI. O homem atribui ao
computador a responsabilidade pela preservao, como se a migrao para o suporte
digital j representasse este fim. necessria a criao de espaos de discusso e
troca de experincias para reforar a importncia das prticas de preservao digital.
Artigo recebido em 31/01/2015 e aprovado em 10/04/2015.

REFERNCIAS
ABRANTES, A. A; MARTINS, L.M. A produo do conhecimento cientfico: relao
sujeito-objeto e desenvolvimento do pensamento. Interface: comunicao, sade e
educao, Botucatu, SP, v. 11, n. 22, p. 313-325, maio/ago. 2007.
BULLOCK, A. Preservation of digital information: issues and current status. Network
Notes, Ottawa, n. 60, abr. 1999. Disponvel em: <http://epe.lacbac.gc.ca/100/202/301/netnotes/netnotes-h/notes60.htm>. Acesso em: 1 maio 2014.
CORRA, A.M.G. Preservao digital: autenticidade e integridade de documentos em
bibliotecas digitais de teses e dissertaes. 2010. 96 f. Dissertao (Mestrado em
Cincia da Informao) Escola de Comunicaes e Artes, Universidade de So Paulo,
So
Paulo,
2010.
Disponvel
em:
<http://www.teses.usp.br/teses/disponiveis/27/27151/tde-05112010105831/publico/2916162.pdf>. Acesso em: 12 abr. 2014.
CUNHA, M.B. Desafios na construo de uma biblioteca digital. Revista Cincia da
Informao, Braslia, v. 28, n. 3, p. 257-268, set./dez. 1999.
GOICOECHEA, M. Hyper-paradigm. In. SANZ, A.; ROMERO, D. (Edit.). Literatures in the
digital age: theory and praxis. Newcastle, UK: Cambridge Scholars Publishing, 2007. p.
18-21.
GRANGER, S. Digital preservation and deep infrastructure. D-Lib Magazine, v. 8, n. 2,
fev.
2002.
Disponvel
em:
<http://www.dlib.org/dlib/february02/granger/02granger.html>. Acesso em: 10 fev.
2014.
LEITE, F. et al. Boas prticas para a construo de repositrios institucionais da
produo
cientfica.
Braslia:
Ibict.
2012.
p.
34.
Disponvel
em:
<http://livroaberto.ibict.br/handle/1/703>. Acesso em: 24 abr. 2014.
MRDERO ARELLANO, M. A. Cariniana: uma rede nacional de preservao digital.
Revista Cincia da Informao, Braslia, v. 41, n. 1, p. 83-91. jan./abr. 2012. Disponvel em:
<http://revista.ibict.br/ciinf/index.php/ciinf/article/view/2127>. Acesso em: 23 jul. 2014.
MRDERO ARELLANO, M. A. Preservao de documentos digitais. Revista Cincia da
Informao, Braslia, v. 33, n. 2, p. 15-27. maio/ago. 2004.
MORIGI, V.J; SOUTO, L.R. Entre o passado e o presente: as vises de biblioteca no
mundo contemporneo. Revista ACB: biblioteconomia em Santa Catarina,

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

195

Florianpolis, v. 10, n. 2, p. 189-206. jan./dez. 2005. Disponvel em:


<http://revistaacb.emnuvens.com.br/racb/article/view/432>. Acesso em: 26 abr. 2014.
MUNHOZ, A. M. Preservao digital de acervos: uma anlise das polticas e estratgias
utilizadas pelas universidades do Rio Grande do Sul. 2011. 63 f. Trabalho de Concluso
de Curso (Graduao em Biblioteconomia) Faculdade de Biblioteconomia e
Comunicao, Universidade Federal do Rio Grande do Sul. Porto Alegre, 2011.
Disponvel em: <http://hdl.handle.net/10183/37473>. Acesso em: 10 set. 2014.
SANTHANAGOPALAN, K; FOX, E.A; McMILLAN, G. A prototype for preservation and
harvesting of international ETDs using LOCKSS and OAI-PMH. In: INTERNATIONAL
SYMPOSIUM ON ELECTRONIC THESES AND DISSERTATIONS, 9., 2006. ,Qubec,
Canad. Anais eletrnicos... Quebec City: NDLTD, 2006. Disponvel em:
<http://scholar.lib.vt.edu/theses/presentations/ETD_2006_Kamini_Santhanagopalan.
doc>. Acesso em: 12 abr. 2014.
SANTOS JUNIOR, E. R. Repositrios institucionais de acesso livre no Brasil: estudos
delfos. 2010. 177 f. Dissertao (Mestrado em Cincia da Informao) Universidade
de
Braslia.
Braslia,
2010.
Disponvel
em:
<
http://repositorio.unb.br/bitstream/10482/5343/6/2010_ErnaniRufinodosSantosJunior.
pdf>. Acesso em: 12 abr. 2014.
SAYO, L.F. Preservao digital no contexto das bibliotecas digitais: uma breve
introduo. In. MARCONDES, Carlos Henrique et al. (Org.). Bibliotecas digitais: saberes
e prticas. Salvador: Ufba; Braslia: Ibict, 2005. p. 115-146.
SAYO, L.F. Conservao de documentos eletrnicos. In. GRANATO, M.; SANTOS, C.
P.; ROCHA, C. R. A. (Org.). Conservao de acervos. Rio de Janeiro: Mast, 2007. p. 181204.
(Mast
Colloquia;
9).
Disponvel
em:
<http://www.mast.br/livros/mast_colloquia_9.pdf>. Acesso em: 10 fev. 2014.
TARGINO, M.G. Comunicao cientfica: uma reviso de seus elementos bsicos.
Revista Informao & Sociedade, Joo Pessoa, v. 10, n. 2, p. 1-27, 2000. Disponvel em:
<http://www.ies.ufpb.br/ojs/index.php/ies/article/view/326>. Acesso em: 26 abr. 2014.
VIDAL, A. A conservao e a preservao de documentos digitais: um desafio na era
da sociedade de informao. Revista da Faculdade de Cincias Humanas e Sociais,
Porto, v. 7, p. 144-154, 2010. Disponvel em: <http://hdl.handle.net/10284/2809>.
Acesso em: 9 abr. 2014

Liinc em Revista, Rio de Janeiro, v.11, n.1, p. 181-196, maio 2015,


http://www.ibict.br/liinc
doi: http://dx.doi.org/10.18225/liinc.v11i1.778

196

Você também pode gostar