Você está na página 1de 14

Traduzido do Inglês para o Português - www.onlinedoctranslator.

com

Computadores e Humanidades3s1:189-202, 1998. 189


c 1998Editores Acadêmicos Kluwer. Impresso na Holanda.

Preservação digital: uma bomba-relógio para bibliotecas


digitais

MARGARET HEDSTROM

?
Escola de Informação, Universidade de Michigan, Ann Arbor, Michigan 48109-1092, EUA

Resumo.A dificuldade e o custo de preservar a informação digital é um impedimento potencial para


o desenvolvimento de bibliotecas digitais. A preservação de materiais tradicionais tornou-se mais
bem-sucedida e sistemática depois que bibliotecas e arquivos integraram a preservação no
planejamento geral e na alocação de recursos. A preservação digital é amplamente experimental e
repleta de riscos associados a métodos não testados. As estratégias de preservação digital são
moldadas pelas necessidades e restrições dos repositórios com pouca consideração pelos requisitos
dos usuários atuais e futuros de recursos acadêmicos digitais. Este artigo discute o estado atual da
preservação digital, articula os requisitos de usuários e custodiantes e sugere necessidades de
pesquisa em mídia de armazenamento, migração, conversão e estratégias gerais de gerenciamento.

1. Os Desafios da Preservação Digital

O propósito da preservação é proteger a informação de valor duradouro para acesso pelas


gerações presentes e futuras (Conway, 1990: 206). Bibliotecas e arquivos têm servido como
foco institucional central para preservação, e ambos os tipos de instituições incluem a
preservação como uma de suas funções centrais. Nas últimas décadas, muitas bibliotecas e
arquivos importantes estabeleceram programas formais de preservação de materiais
tradicionais em papel, microformas, fotográficos e, em menor grau, formatos audiovisuais.
Os programas de preservação incluem áreas administrativas e técnicas

Margaret Hedstrom é Professora Associada da School of Information, University of Michigan, onde leciona
?
nas áreas de arquivos, gerenciamento de registros eletrônicos e preservação digital. Antes de ingressar no corpo
docente de Michigan em 1995, ela trabalhou por dez anos na Administração de Arquivos e Registros do Estado
de Nova York, onde foi Chefe dos Serviços de Consultoria de Registros Estaduais e Diretora do Centro de
Registros Eletrônicos. Dr. Hedstrom tem um Ph.D. em História pela Universidade de Wisconsin em Madison. Ela
publicou amplamente sobre muitos aspectos do gerenciamento de arquivos e registros eletrônicos e atualmente
está escrevendo um livro sobre preservação digital. Seus atuais interesses de pesquisa incluem estratégias de
preservação digital, o impacto das comunicações eletrônicas na memória e documentação organizacional, e
acesso remoto a materiais de arquivo. Ela é membro da Society of American Archivists e foi a primeira a receber
o prêmio anual de Excelência em Serviços de Informação do Governo do Estado de Nova York.

Este artigo foi revisado a partir de um artigo preparado para Reconnecting Science and Humanities in
Digital Libraries: A Symposium Sponsored by the University of Kentucky and the British Library, 19–21 de
outubro de 1995, Lexington, Kentucky.
190 MARGARET HEDSTROM

componentes, como contratar pessoal especializado em administração de preservação, usar


medidas preventivas para impedir a deterioração de materiais, tomar ações corretivas para
restaurar a usabilidade de materiais selecionados e incorporar necessidades e requisitos de
preservação no planejamento geral do programa e alocação de recursos. Os preservacionistas
da comunidade bibliotecária e arquivística têm sido fundamentais no desenvolvimento de
uma série de ferramentas e metodologias para reduzir a deterioração de materiais
tradicionais e restaurar livros e documentos que se deterioraram a tal ponto que sua
longevidade e usabilidade estão ameaçadas. Provisões para proteção contra incêndio e
controles ambientais adequados são frequentemente incorporadas às novas instalações de
biblioteca e arquivo. A realocação de materiais de papel à base de ácido é uma tarefa comum
em muitos repositórios, e a microfilmagem é usada extensivamente como um meio
econômico para preservar materiais ameaçados de extinção. Empresas como a Brittle Books
Initiative, o American Newspapers Project e o programa de microfilmagem financiado pelo
National Endowment for the Humanities (NEH) salvaram milhões de itens únicos e em perigoP(
reservando o Patrimônio Intelectual).eMuitas bibliotecas e arquivos reduziram seu apetite
voraz por adquirir novos materiais em um esforço para equilibrar a amplitude e a
profundidade de seus acervos com as responsabilidades de administração de longo prazo. A
pressão da comunidade de preservação forneceu o catalisador para muitos editores mudarem
de papel ácido para papel neutro na produção de trabalhos publicados. A introdução de
materiais mais estáveis no início do processo de produção da informação representa uma
vitória significativa para os interesses de preservação que, a longo prazo, reduzirão a
necessidade de esforços de salvamento.

Ainda há muito a ser feito para preservar os recursos culturais, intelectuais e


acadêmicos em formatos tradicionais que formam a base para a pesquisa e o
ensino em humanidades. Estima-se que 80 milhões de livros quebradiços
residam em bibliotecas americanas, 10 milhões dos quais são únicos; e inúmeros
periódicos, jornais, fotografias e documentos requerem tratamento de
preservação para sobreviver até o próximo século. Milhares de repositórios
carecem de meios para prevenção de desastres ou controles ambientais
adequados para evitar a perda catastrófica de seus acervos. As histórias de
sucesso e o uso regular de métodos de preservação estabelecidos são
encontrados quase exclusivamente em países desenvolvidos. Nos países
desenvolvidos,P
(reserva de material de arquivo)ls.
A preservação digital adiciona um novo conjunto de desafios para bibliotecas e arquivos à
tarefa existente de preservar um legado de materiais em formatos tradicionais. Eu defino
preservação digital como o planejamento, alocação de recursos e aplicação de métodos e
tecnologias de preservação necessários para garantir que a informação digital de valor
contínuo permaneça acessível e utilizável. Uso intencionalmente o termo “contínuo” em vez
de valor “permanente” para evitar tanto o absolutismo quanto o idealismo que o termo
“permanente” implica (O'Toole). Meu conceito de preservação digital abrange tanto material
que começa sua vida em formato digital quanto material que é
PRESERVAÇÃO DIGITAL: UMA BOMBA-RELÓGIO PARA BIBLIOTECAS DIGITAIS 191

convertidos de formatos tradicionais para digitais. Embora os preservacionistas lutem há


décadas com papéis à base de ácido, fax térmico, filme de nitrato e outros meios frágeis, a
ameaça representada pelos meios magnéticos e ópticos é qualitativamente diferente. Essas
novas mídias de gravação são vulneráveis à deterioração e perda catastrófica e, mesmo em
condições ideais, têm vida curta em relação à mídia de armazenamento tradicional. Eles são
os primeiros meios reutilizáveis e podem se deteriorar rapidamente, tornando o prazo para
decisões e ações para evitar perdas em questão de anos, não décadas.

Mais insidioso e desafiador do que a deterioração da mídia é o problema da obsolescência nas


tecnologias de recuperação e reprodução. A inovação nas indústrias de hardware, armazenamento e
software de computador continua em ritmo acelerado, geralmente gerando maiores capacidades de
armazenamento e processamento a um custo menor. Dispositivos, processos e software para
registrar e armazenar informações estão sendo substituídos por novos produtos e métodos em um
ciclo regular de três a cinco anos, impulsionados principalmente pelas forças do mercado. Trabalhos
digitais que são criados usando aplicativos de software novos ou emergentes são especialmente
vulneráveis à obsolescência de software porque os padrões para codificação, representação,
recuperação e outras funções levam tempo para serem desenvolvidos. Novos formatos também
tendem a ser mais complexos porque podem lidar com uma variedade maior de representações de
informações e funções de processamento de informações. Novos aplicativos multimídia precisam
lidar com múltiplas representações de texto, dados, imagens, som e movimento, bem como
gerenciar os relacionamentos entre os componentes de objetos digitais complexos. Registros
criados em formato digital em primeira instância e aqueles convertidos retrospectivamente de papel
ou microfilme para formato digital são igualmente vulneráveis à obsolescência tecnológica.

A preservação digital é restringida pela ausência de padrões estabelecidos,


protocolos e métodos comprovados para preservar a informação digital e pela
tendência de considerar questões de preservação apenas no final de um projeto
ou após uma perda sensacional. Com poucas exceções, a pesquisa em bibliotecas
digitais tem se concentrado em arquiteturas e sistemas para organização,
recuperação, apresentação e visualização da informação e na administração de
direitos de propriedade intelectual (Levy e Marshall). O papel crítico das
bibliotecas e arquivos digitais em garantir a acessibilidade futura de informações
com valor duradouro ficou em segundo plano para melhorar o acesso a
materiais atuais e usados ativamente. Como consequência, a preservação digital
permanece amplamente experimental e repleta de riscos associados a métodos
não testados.

A justaposição de armazenamento em massa e preservação de longo prazo oferece um terreno


fértil para discutir os desafios conceituais e metodológicos enfrentados pelas bibliotecas e arquivos
digitais. Os dois termos “armazenamento em massa” e “preservação a longo prazo” incorporam uma
contradição no estado atual do desenvolvimento de bibliotecas digitais, representando uma bomba-
relógio que ameaça a viabilidade a longo prazo desse novo tipo de recurso de conhecimento. Novas
tecnologias para armazenamento em massa de informações digitais
192 MARGARET HEDSTROM

abundam, mas as tecnologias e métodos para preservação a longo prazo do vasto e crescente
estoque de informações digitais ficam muito para trás. As estratégias, métodos e tecnologias para
preservação de longo prazo de informações digitais que existem não são necessariamente viáveis
tecnologicamente para preservação em grande escala, nem são acessíveis devido à grande
quantidade de informações digitais que estão sendo geradas. Nossa capacidade de criar, acumular
e armazenar materiais digitais excede em muito nossa capacidade atual de preservar até mesmo
essa pequena quantidade com valor contínuo.

2. Requisitos de Preservação Digital

Para preservar os materiais digitais em escala compatível com as capacidades de


armazenamento em massa e em formatos acessíveis e usáveis, é necessário
articular alguns requisitos básicos. Existem duas perspectivas diferentes sobre os
requisitos de preservação digital: as dos usuários de materiais digitais e as de
bibliotecas, arquivos e outros guardiões que assumem a responsabilidade por
sua manutenção, preservação e distribuição. Bibliotecas e arquivos não
cumprirão suas missões de preservação se não atenderem aos requisitos de
seus usuários preservando materiais em formatos que permitam os tipos de
análises que os usuários desejam realizar. Ao mesmo tempo, bibliotecas e
arquivos podem não ser capazes de satisfazer todos os requisitos de todos os
usuários em potencial devido a restrições de recursos, prioridades concorrentes
e falta de conhecimento técnico.

As necessidades potenciais de informação são variadas, imprevisíveis e quase infinitas


(Gould). Quaisquer generalizações, mesmo que restritas a uma comunidade de usuários, como
acadêmicos de humanidades, correm o risco de ignorar e subestimar as necessidades
potenciais dos usuários. Embora os requisitos precisos variem entre as disciplinas, algumas
necessidades básicas transcendem campos e disciplinas. A capacidade de estabelecer a
autenticidade e integridade de uma fonte é fundamental para todos os usuários,
independentemente de a fonte ter sido criada por um indivíduo, gerada na condução de
negócios institucionais ou produzida por meio de um processo formal de publicação (Lynch).
Mecanismos que permitirão aos usuários estabelecer a origem, proveniência e autenticidade
dos documentos digitais exigem que os arquivos e bibliotecas preservem informações
contextuais e descritivas, além do conteúdo dos documentos digitais. Atributos como estruturas
de documentos formais, metadados que documentam o histórico de manutenção e uso do
documento, carimbos de data e hora e referências entre documentos são essenciais para
determinar a autenticidade, entender a proveniência das fontes e colocá-las em um contexto
maior (Graham) . Embora esses requisitos também sejam importantes para materiais
tradicionais, eles são ainda mais significativos para materiais digitais que são facilmente
alterados, copiados e removidos de seu contexto original.
Michelson e Rothenberg (1992) argumentam que a rede e o acesso a fontes digitais
mudarão todas as dimensões do processo de trabalho acadêmico, incluindo
PRESERVAÇÃO DIGITAL: UMA BOMBA-RELÓGIO PARA BIBLIOTECAS DIGITAIS 193

identificando fontes, comunicando-se com colegas, interpretando e analisando dados, divulgando resultados de pesquisas e ensinando. Se suas projeções

estiverem corretas, os programas de preservação digital devem permitir um alto grau de integração entre o material de origem e os processos analíticos,

acoplando as fontes de pesquisa com as ferramentas necessárias para analisá-las; mantendo vínculos entre os resultados da pesquisa e as fontes em que se

baseiam; e fornecendo um meio para incorporar fontes primárias ao ensino. Os usuários buscarão documentos que sejam facilmente recuperados e

manipulados, transmissíveis e transportáveis de um repositório para os locais de pesquisa, apresentação e ensino. Parece seguro supor que os acadêmicos

de humanidades precisarão da capacidade de pesquisar e selecionar fontes relevantes de grandes corpos de materiais heterogêneos, para comparar fontes

entre si e visualizar documentos específicos em altos níveis de granularidade. A preservação digital agregará pouco valor ao processo de pesquisa se servir

apenas como uma forma alternativa de armazenamento a partir do qual são produzidas réplicas analógicas para uso com métodos analíticos convencionais.

A preservação de materiais digitais em formatos confiáveis e utilizáveis, no entanto, exigirá manutenção de longo prazo de características estruturais,

metadados descritivos e recursos de exibição, computacionais e analíticos que exigem muito do armazenamento em massa e do software para recuperação

e interpretação. A preservação digital agregará pouco valor ao processo de pesquisa se servir apenas como uma forma alternativa de armazenamento a

partir do qual são produzidas réplicas analógicas para uso com métodos analíticos convencionais. A preservação de materiais digitais em formatos

confiáveis e utilizáveis, no entanto, exigirá manutenção de longo prazo de características estruturais, metadados descritivos e recursos de exibição,

computacionais e analíticos que exigem muito do armazenamento em massa e do software para recuperação e interpretação. A preservação digital

agregará pouco valor ao processo de pesquisa se servir apenas como uma forma alternativa de armazenamento a partir do qual são produzidas réplicas

analógicas para uso com métodos analíticos convencionais. A preservação de materiais digitais em formatos confiáveis e utilizáveis, no entanto, exigirá

manutenção de longo prazo de características estruturais, metadados descritivos e recursos de exibição, computacionais e analíticos que exigem muito do

armazenamento em massa e do software para recuperação e interpretação.

Arquivos, bibliotecas e outros tipos de repositórios que estão lutando para atender às
crescentes expectativas dos usuários com recursos financeiros e técnicos limitados podem
expressar os requisitos de preservação digital de forma diferente dos usuários finais. Do ponto de
vista de um repositório, os sistemas de armazenamento devem ser capazes de lidar com
informações digitais em uma ampla variedade de formatos, incluindo texto, dados, gráficos, vídeo
e som. O armazenamento digital não é simplesmente um meio alternativo para armazenar
formatos de impressão. Muitos tipos de objetos digitais não possuem equivalentes impressos e
não podem ser preservados em formatos não digitais. Idealmente, a mídia de armazenamento terá
uma longa expectativa de vida, um alto grau de resistência a desastres, durabilidade suficiente
para suportar o uso regular e capacidades de armazenamento muito grandes. A conversão de
formatos analógicos para digitais e a migração para novas gerações de tecnologia serão rápidas,
precisas e baratas o suficiente para permitir transferências em grande escala de materiais
heterogêneos. Os requisitos de espaço de armazenamento serão mínimos e não exigirão controles
ambientais altamente sensíveis. Para tornar a preservação digital acessível ao maior número
possível de organizações e indivíduos, os custos de equipamentos, mídia e manutenção devem ser
modestos.

3. Estratégias de Preservação Atuais e Suas Limitações

A maioria dos bibliotecários e arquivistas aceitaram a sabedoria básica de que a preservação


digital depende da cópia, não da sobrevivência da mídia física (Lesk). Mas a cópia, também
chamada de “atualização” ou “migração”, é mais complexa do que simplesmente transferir
um fluxo de bits da mídia antiga para a nova ou de uma geração de sistemas para a próxima.
Transformações complexas e caras de objetos digitais muitas vezes são necessárias para
preservar materiais digitais para que eles permaneçam legítimos.
194 MARGARET HEDSTROM

representações imate das versões originais e fontes úteis para análise e pesquisaP(
reservando informações digitais)n. Os métodos atuais de preservação de materiais
digitais não apoiam totalmente a realização desses objetivos. Diante da responsabilidade
pela preservação de materiais digitais, arquivos e bibliotecas enfrentam uma série de
escolhas complexas e difíceis baseadas no formato dos materiais originais, nos usos
previstos para eles e nos recursos técnicos e financeiros disponíveis para investir em
iniciativas de preservação que vão desde desde métodos muito elementares e
estabelecidos até propostas que ainda não foram testadas.
A transferência de informações digitais de mídias magnéticas e ópticas menos
estáveis por meio da impressão de imagens de páginas em papel ou microfilme é
provavelmente a estratégia de preservação mais utilizada. Parece irônico que, assim
como bibliotecas e arquivos estão descobrindo a conversão digital como um método de
preservação econômico para certos materiais em deterioração, muitas informações que
começam sua vida em formato eletrônico são impressas em papel ou microfilme para
armazenamento seguro a longo prazo. No entanto, o papel neutro em ácido de alta
qualidade pode durar um século ou mais, enquanto o microfilme de qualidade
arquivística é projetado para durar 500 anos ou mais. Papel e microfilme têm a
vantagem adicional de não exigir hardware ou software especial para recuperação ou
visualização. Talvez isso explique por que em muitos projetos de conversão digital,

Outra estratégia de preservação digital é preservar a informação digital nos formatos digitais
mais simples possíveis, a fim de minimizar os requisitos de recuperação de software específico e
evitar problemas de obsolescência de software. As informações digitais podem ser transferidas por
sucessivas gerações de tecnologia em um formato “independente de software” como arquivos de
texto ASCII ou como arquivos planos com estruturas simples e uniformes. Vários arquivos de dados
contêm grandes coleções de dados numéricos que foram capturados em cartões perfurados nas
décadas de 1950 ou 1960, migrados para dois ou três formatos diferentes de fita magnética e
agora residem em mídia óptica. À medida que novos formatos de mídia e armazenamento são
introduzidos, os dados podem ser migrados sem nenhuma alteração significativa em sua estrutura
lógica. Essa abordagem tem a vantagem distinta de ser universal e fácil de implementar. É uma
estratégia econômica para preservar informações digitais nos casos em que a retenção do
conteúdo é primordial, mas as características de exibição, indexação e computacionais não são
críticas. Enquanto a comunidade de preservação não tiver estratégias de migração mais robustas e
econômicas, a impressão em papel ou filme e a preservação de arquivos planos continuarão sendo
os métodos de último recurso para muitas instituições e para certos formatos de informação
digital.
Bibliotecas e arquivos com coleções grandes, complexas e diversificadas de materiais digitais
estão apenas começando a testar estratégias que normalizam vários tipos de acervos,
convertendo registros digitais da grande multiplicidade de formatos em um número menor e mais
gerenciável de formatos padrão (“Pilot Accessioning Relatório de Resumo de Projetos”). Um
repositório pode aceitar documentos textuais apenas em um ou alguns formatos de
processamento de texto comerciais comumente disponíveis ou exigir que os documentos estejam
em conformidade com padrões como SGML (ISO 8879). Estável e padrão-
PRESERVAÇÃO DIGITAL: UMA BOMBA-RELÓGIO PARA BIBLIOTECAS DIGITAIS 195

métodos padronizados para marcação, como o uso de SGML como uma ferramenta para representar a
estrutura lógica de textos, podem preservar recursos estruturais, de apresentação e recuperação sem se
tornarem dependentes da longevidade de aplicativos de software específicos. Os bancos de dados
podem ser armazenados em um ou alguns formatos comuns ou convertidos para um formato
compatível com SQL (Structured Query Language), enquanto os arquivos de imagem podem estar em
conformidade com o formato de arquivo de imagem marcado (TIFF) ou outro formato de imagem
comum com algoritmos de compactação padrão.
Essa abordagem tem a vantagem de preservar mais a exibição, a disseminação e as
características computacionais dos materiais originais, ao mesmo tempo em que reduz a grande
variedade de transformações personalizadas que, de outra forma, seriam necessárias para migrar
o material para as futuras gerações de tecnologia. A estratégia baseia-se na suposição de que os
produtos de software que estão em conformidade com os padrões amplamente adotados ou
amplamente dispersos no mercado são menos voláteis do que o mercado de software como um
todo. Os produtos comerciais mais comuns atualmente fornecem utilitários para compatibilidade
com versões anteriores e para troca de documentos, bancos de dados e objetos mais complexos
entre sistemas de software. Embora essa estratégia simplifique a migração e possa reduzir os
custos de preservação digital, reduzindo a quantidade de reformatação personalizada necessária à
medida que a tecnologia muda, não elimina a necessidade de migração regular de materiais
digitais. Tanto o software quanto os padrões continuam a evoluir e até mesmo repositórios com
acervos estruturalmente homogêneos podem esperar que migrem seus materiais digitais
periodicamente.
Os métodos atuais estão muito aquém do que é necessário para preservar materiais
digitais. Todos os métodos de preservação atuais envolvem compromissos entre o que é
desejável do ponto de vista da funcionalidade, confiabilidade e custo e o que é possível e
acessível com as tecnologias e métodos atuais. Consequentemente, a maioria dos repositórios
está lidando com o emprego de estratégias provisórias e menos do que desejáveis, se eles
estão abordando questões de preservação digital. Por exemplo, a simplicidade e a
universalidade da impressão em papel ou microfilme vêm à custa de grandes perdas no
potencial de recuperação e reutilização da informação digital. As estratégias de migração que
envolvem a reformatação de materiais digitais para um formato padrão simples geralmente
eliminam a estrutura de documentos e relacionamentos embutidos em bancos de dados.
Capacidades de computação, exibição gráfica, indexação e outros recursos muitas vezes são
perdidos, limitando assim o potencial analítico futuro. A normalização para formatos padrão
nem sempre é tecnicamente viável e geralmente é bastante cara. Arquivos e bibliotecas
também devem lidar com formas inteiramente novas de discurso habilitado eletronicamente e
novas formas de expressão artística e cultural que não têm predecessores no mundo
analógico. Nenhum método de preservação atual é adequado para preservar objetos de
dados dinâmicos de sistemas complexos. Não há modelos conceituais estabelecidos ou
processos técnicos para a preservação de obras multimídia, hipermídia interativa, diálogos on-
line ou muitas das novas formas eletrônicas que estão sendo criadas hoje. Os requisitos de
arquivamento para preservar conteúdo, contexto e estrutura de documentos digitais e a
necessidade de manter a capacidade de exibir, vincular e manipular
196 MARGARET HEDSTROM

objetos digitais para satisfazer os requisitos do usuário apenas aumentam a dependência de software em
repositórios digitais.
A comunidade de preservação está apenas começando a explorar possíveis alternativas
para armazenar informações digitais em formato “independente de software”. Rothenberg
(1995) propôs uma abordagem para manter o conteúdo de materiais digitais intacto sem
perder a capacidade de recuperar fontes ricas em significado. Ele recomendou manter o
documento original em seu formato original encapsulado em um “envelope” virtual que
contém instruções de software para recuperação, exibição e processamento da mensagem
no envelope. Os envelopes conteriam informações contextuais e a história transformacional
de cada objeto. A execução das instruções dependeria de um arquivo de emuladores de
hardware e software ou de instruções no envelope com especificações sobre como construir
emuladores.
As estratégias de preservação digital discutidas até agora são baseadas no pressuposto de
que bibliotecas e arquivos serão receptores passivos de materiais digitais. Uma estratégia
complementar busca colocar as preocupações de preservação mais a montante no processo
de geração de informação digital, desenvolvendo ou recomendando padrões para o formato,
estrutura e descrição de objetos digitais para que sejam mais passíveis de preservação a longo
prazo. A pesquisa sobre requisitos de gerenciamento de registros eletrônicos definiu padrões
de metadados para evidências que apoiarão a necessidade de integridade, autenticidade,
confiabilidade e arquivamento por meio de padrões para “objetos encapsulados de
metadados” (Bearman e SocB ha ).
vocêtllse;lata de ASIS
Arquivos, bibliotecas e outras instituições com responsabilidades de preservação se beneficiarão se os sistemas de informação que geram informação digital forem projetados para dar

suporte às necessidades de preservação de longo prazo, como migração, descrição adequada e ligações entre o conteúdo de materiais digitais e suas organizações ou organizações mais

amplas. contexto intelectual. A adoção em larga escala de padrões de dados e comunicação pelos originadores de informações digitais para dar suporte às suas necessidades comerciais

atuais também pode facilitar a preservação a longo prazo. A rápida implementação do comércio eletrônico depende do amplo desenvolvimento e adoção de padrões para intercâmbio

eletrônico de dados e transações seguras. Muitas organizações estão adotando padrões para formatos e definições para permitir troca, reutilização, e venda de informação digital e reduzir

os custos de conversão e manutenção. As iniciativas de padrões que atendem às necessidades de negócios para a troca segura e confiável de informações digitais entre a geração atual de

sistemas imporão padronização e normalização de dados que, em última análise, facilitarão migrações para novas gerações de tecnologia. No entanto, para se beneficiar totalmente da

sinergia entre as necessidades de negócios e os requisitos de preservação, as preocupações com o patrimônio cultural devem estar ligadas a objetivos sociais igualmente críticos, como

monitorar as mudanças ambientais globais, localizar locais de resíduos nucleares e estabelecer direitos de propriedade, todos também dependentes de acesso a longo prazo a provas

electrónicas fiáveis. As iniciativas de padrões que atendem às necessidades de negócios para a troca segura e confiável de informações digitais entre a geração atual de sistemas imporão

padronização e normalização de dados que, em última análise, facilitarão migrações para novas gerações de tecnologia. No entanto, para se beneficiar totalmente da sinergia entre as

necessidades de negócios e os requisitos de preservação, as preocupações com o patrimônio cultural devem estar ligadas a objetivos sociais igualmente críticos, como monitorar as

mudanças ambientais globais, localizar locais de resíduos nucleares e estabelecer direitos de propriedade, todos também dependentes de acesso a longo prazo a provas electrónicas fiáveis.

As iniciativas de padrões que atendem às necessidades de negócios para a troca segura e confiável de informações digitais entre a geração atual de sistemas imporão padronização e

normalização de dados que, em última análise, facilitarão migrações para novas gerações de tecnologia. No entanto, para se beneficiar totalmente da sinergia entre as necessidades de

negócios e os requisitos de preservação, as preocupações com o patrimônio cultural devem estar ligadas a objetivos sociais igualmente críticos, como monitorar as mudanças ambientais

globais, localizar locais de resíduos nucleares e estabelecer direitos de propriedade, todos também dependentes de acesso a longo prazo a provas electrónicas fiáveis.

Muita pesquisa e desenvolvimento são necessários antes que bibliotecas e arquivos possam
garantir que mesmo uma pequena parte de nossa herança digital sobreviva. É justo dizer que o
estado de desenvolvimento da preservação digital permanece amplamente experimental.
PRESERVAÇÃO DIGITAL: UMA BOMBA-RELÓGIO PARA BIBLIOTECAS DIGITAIS 197

Apenas algumas bibliotecas, arquivos e outras instituições estabeleceram programas de


preservação digital, enquanto a maioria das pesquisas e inovações vem de projetos-piloto e
protótipos. Métodos testados que se mostraram eficazes em pequena escala em um número
limitado de repositórios não são viáveis para a preservação de muitos dos tipos de materiais
digitais que arquivos e bibliotecas enfrentarão em seus esforços de preservação.

4. Áreas de Pesquisa e Desenvolvimento

O estado atual da preservação digital sugere várias áreas frutíferas para pesquisa e
desenvolvimento. Discutirei quatro áreas: mídia de armazenamento, migração, conversão e
ferramentas de gerenciamento. Esses quatro domínios são mutuamente dependentes e, em última
análise, devem ser integrados a uma infraestrutura para preservação digital. No entanto, soluções
melhores são necessárias em todas as quatro áreas antes que essa integração possa ocorrer.
Finalmente, compartilharei algumas observações sobre as questões de escala e custo que devem
ser consideradas para que bibliotecas e arquivos alcancem algum grau de preservação sistemática.

5. Mídia de armazenamento

A vida limitada das mídias magnéticas e ópticas representa um problema


significativo, embora este não seja o principal fator limitante para a preservação
digital. Pesquisas recentes sobre a longevidade dos meios magnéticos indicam
uma vida útil de 10 a 30 anos se forem manuseados e armazenados
adequadamente. Algumas tecnologias de disco óptico prometem uma vida útil
de até 100 anos. A maioria das autoridades argumenta que a longevidade
aprimorada da mídia é de pouco valor porque a mídia atual dura mais do que o
software e os dispositivos necessários para recuperar as informações gravadas.
Como Conway afirmou, a cadeia de elementos inter-relacionados necessários
para a preservação digital é tão forte quanto seu elo mais fraco (Conway, 1996:
13). No entanto, melhorias na estabilidade, capacidade, e longevidade da mídia
de armazenamento de base são necessários para reduzir drasticamente a
vulnerabilidade dos materiais digitais à perda e alteração e para diminuir os
custos de armazenamento e manutenção. Ampla pesquisa e experiência
fornecem evidências do que pode dar errado com a mídia magnética como
resultado da degradação do ligante, instabilidades das partículas magnéticas e
deformação do substrato (Van Bogart). A mídia óptica é suscetível a danos
causados por alta umidade, flutuações rápidas e extremas de temperatura e
contaminação por material particulado no ar (Arquivos Nacionais dos EUA e
Administração de Registros). Para evitar esses problemas, é imperativo
armazenar mídia magnética e óptica sob rígidos controles ambientais que nem
sempre estão disponíveis, acessíveis ou convenientes.
198 MARGARET HEDSTROM

Isso levanta a questão, no entanto, se a pesquisa sobre melhorias incrementais nas


tecnologias de armazenamento atuais beneficiará a preservação a longo prazo ou se
abordagens alternativas ao armazenamento digital atenderão aos requisitos de
arquivamento de maneira mais adequada. Como referência, vale lembrar que o microfilme,
considerado o único meio de armazenamento arquivístico aceitável, dura pelo menos 500
anos com manutenção mínima se armazenado adequadamente. Novas tecnologias de
armazenamento, como a tecnologia experimental de memória somente leitura de alta
densidade (HD-ROM), que usa um feixe de íons para registrar informações em pinos de aço
inoxidável ou irídio, podem valer a pena investigar. O HD-ROM é capaz de armazenar 180
vezes mais informações do que a tecnologia de CD-ROM atual, por aproximadamente meio
por cento dos custos do CD-ROM. De acordo com uma versão sobre esta tecnologia, o HD-
ROM é impermeável à degradação do material e não requer nenhum intérprete de fluxo de
bits porque a tecnologia pode descrever de forma legível todas as instruções necessárias
para interpretar os dados (LANL Ion Beam Storage). Essa abordagem ilustra o potencial de
soluções construídas em tecnologias de armazenamento totalmente novas.

6. Migração

Melhores métodos de migração de materiais digitais para novas gerações de hardware e


software são muito necessários para a preservação digital, independentemente dos avanços
nas tecnologias de armazenamento em massa. O planejamento da migração é difícil porque
há experiência limitada com os tipos de migração necessários para manter o acesso a objetos
digitais complexos por longos períodos de tempo. Quando um custodiante assume a
responsabilidade de preservar um objeto digital, pode ser difícil prever quando a migração
será necessária, quanta reformatação será necessária e quanto custará a migração. Não há
dados confiáveis ou abrangentes sobre os custos associados às migrações, seja para
tecnologias e formatos específicos ou para coleções específicas, e há pouca pesquisa em
andamento sobre metodologias que reduzam os custos e os encargos da migração.

As organizações com responsabilidades de preservação se beneficiariam enormemente com o


desenvolvimento de caminhos de compatibilidade com versões anteriores que seriam incluídos como
um recurso padrão de todos os softwares. A compatibilidade com versões anteriores ou caminhos de
migração permitiriam que uma nova geração de software “ler” dados de sistemas mais antigos sem
reformatação substancial e sem perda de recuperação, exibição e recursos computacionais. Embora a
compatibilidade com versões anteriores seja cada vez mais comum em uma linha de produtos de
software específica, os caminhos de migração não são normalmente fornecidos entre produtos de
software concorrentes ou para produtos que falham no mercado.
Os administradores de material digital têm uma gama de opções para preservar a
informação digital. Pode-se preservar uma réplica exata de um registro digital com exibição,
recuperação e funcionalidade computacional completas, ou uma representação do registro
com recursos computacionais apenas parciais, ou um substituto para o registro, como um
resumo, resumo ou agregação. O detalhe ou o ruído de fundo podem ser eliminados
PRESERVAÇÃO DIGITAL: UMA BOMBA-RELÓGIO PARA BIBLIOTECAS DIGITAIS 199

intencionalmente por sucessivas gerações de migração, e os guardiões podem alterar o


formato ou a mídia de armazenamento. Os aprimoramentos são tecnologicamente possíveis
por meio de limpeza, marcação e vinculação, ou pela adição de indexação e outros recursos.
Essas possibilidades tecnológicas, por sua vez, impõem novas e sérias responsabilidades de
apresentar materiais digitais aos usuários de uma forma que lhes permita determinar a
autenticidade da informação e sua relação com a fonte original. Métodos para documentar
mudanças em objetos digitais durante sua vida útil precisam ser incorporados como parte
integrante dos métodos de migração aprimorados.
Existem poucos métodos bem desenvolvidos para preservar e migrar software
para que ele possa ser usado para recriar documentos digitais que tenham a
“aparência” das fontes originais. A manutenção de repositórios de hardware e
software obsoletos tem sido discutida periodicamente, mas geralmente
descartada como muito cara e não comprovadamente viável. Essa abordagem
merece uma consideração mais séria como estratégia para manter o acesso
contínuo a certos tipos de materiais digitais. Estudos de viabilidade e análises de
custo/benefício devem ser realizados para determinar a viabilidade tecnológica,
econômica e comercial de manter sistemas de software legados selecionados e
realizar migrações especializadas ou, alternativamente, de construir e manter
emuladores de software.

7. Conversão
Tecnologias de conversão mais rápidas, baratas e de maior resolução são outro elemento
crítico necessário para viabilizar a preservação digital em larga escala. A maioria dos
arquivistas e bibliotecários aceita o fato de que vivemos em um ambiente híbrido onde papel,
microfilme, vídeo e mídias magnéticas e ópticas precisam interoperar de forma mais
integrada e transparente. A grande maioria das fontes primárias hoje ainda reside em papel
e/ou microfilme com pouca chance de vermos a conversão em massa de acervos arquivísticos
e bibliotecários existentes para formatos digitais. A pesquisa e o planejamento para
preservação digital devem reconhecer que os repositórios lidarão com a conversão por um
longo tempo e que os investimentos na melhoria das taxas de captura, precisão, resolução e
verificação terão benefícios de longo prazo. Além disso, melhorias nas tecnologias de
conversão podem apoiar soluções híbridas para problemas de preservação e acesso,
permitindo que os repositórios armazenem certos formatos de material digital em mídia
estável, como microfilme, com conversão sob demanda para formato digital para análise e
reutilização. Os esforços para capturar e armazenar marcações descritivas no filme para
conversão subsequente são prejudicados por taxas de erro inaceitáveis na tecnologia OCR e
processos de conversão complicados (Giguere).

8. Ferramentas de Gestão

Uma quarta área de pesquisa é o desenvolvimento de ferramentas de gestão para


bibliotecas e arquivos digitais que integrem controle descritivo e manutenção com
200 MARGARET HEDSTROM

sistemas de armazenamento. Objetos digitais dinâmicos, como aqueles encontrados em


sistemas de hipertexto, apresentam problemas especiais de gerenciamento para recuperação e
reutilização atuais e futuras. Os limites das fontes de hipertexto, como os encontrados na World
Wide Web hoje, são difíceis de determinar porque nenhuma parte ou instituição controla as
alterações em todos os documentos e links que tornam os objetos de hipertexto ativos e
recursos de informação altamente responsivos. Um alto grau de volatilidade acompanha esses
objetos porque o conteúdo dos documentos muda, os locais onde os recursos de informação
são armazenados mudam e os links entre os documentos mudam, mudam e desaparecem.
Algumas ferramentas recentes, como o software “rastreador” que é capaz de percorrer uma
parte da Web e notar problemas de manutenção como links quebrados, documentos movidos,
documentos modificados, e objetos que ultrapassaram suas datas de validade, têm aplicações
potenciais no gerenciamento de grandes arquivos digitais (Ackerman e Fielding; Kahle). Se
essas ferramentas fossem ampliadas para resolver problemas de preservação, elas teriam o
potencial de servir como filtros para avaliação e seleção, monitorar repositórios quanto à
deterioração física e identificar objetos ameaçados por causa da obsolescência da tecnologia.

A pesquisa e o desenvolvimento de ferramentas que embutissem mais inteligência sobre


o status de preservação do material digital nos próprios objetos tornariam mais automático o
monitoramento e a manutenção de grandes coleções digitais. Os métodos atuais para
monitorar o estado físico de materiais digitais são trabalhosos, não confiáveis e
potencialmente prejudiciais aos próprios materiais. Os procedimentos recomendados para
monitorar a deterioração física de mídia magnética, por exemplo, envolvem a leitura de uma
pequena amostra de itens periodicamente para determinar se ocorreu alguma perda de
dados (Eaton). Existe o potencial de construir mecanismos de monitoramento e relatório em
objetos digitais, sistemas de armazenamento e arquiteturas de rede que possam suportar
auto-relato de status físico e iniciar procedimentos automáticos de manutenção.

Apesar das diferenças importantes, algumas lições da preservação tradicional


são transferíveis para o ambiente digital. Para evitar compromissos que excedem
em muito os recursos disponíveis e esforços dispendiosos de resgate e
restauração, a preservação deve se tornar parte integrante do planejamento,
design e alocação de recursos para bibliotecas e arquivos digitais. A integração
de requisitos e métodos de preservação com sistemas de acesso e manutenção é
essencial para gerenciar de forma completa e eficiente os processos de
migração, regeneração e documentação da vida dos objetos digitais. O
planejamento para preservação deve se tornar parte integrante do projeto e
gerenciamento de bibliotecas e arquivos digitais. Se deixado como uma reflexão
tardia,
Ao desenvolver novas ferramentas e métodos para preservação digital, pesquisadores e
desenvolvedores devem ter em mente as questões de escalabilidade, acessibilidade e facilidade de
implementação. A comunidade de preservação tem à sua disposição uma variedade de táticas de
preservação digital que parecem funcionar efetivamente para tipos específicos de materiais em
determinados ambientes restritos, mas os métodos atuais não são escaláveis
PRESERVAÇÃO DIGITAL: UMA BOMBA-RELÓGIO PARA BIBLIOTECAS DIGITAIS 201

ao problema geral da preservação digital. Isso não quer dizer que exista ou deva existir
uma solução única para a preservação digital. Os métodos usados variam dependendo
da complexidade dos objetos digitais originais, da extensão em que a funcionalidade de
computação, exibição, indexação e autenticação deve ser mantida e dos requisitos dos
usuários atuais ou previstos. Mas qualquer solução deve ser escalável desde o
laboratório, protótipo ou projeto piloto até a ampla gama de indivíduos e instituições
que têm a responsabilidade de garantir que os materiais digitais durem mais do que a
atual geração de tecnologia permite.
Outra questão intimamente relacionada é a questão da acessibilidade.
Independentemente de como a responsabilidade pela preservação digital é
distribuída, as sociedades alocam apenas uma quantidade pequena e finita de
recursos para preservar recursos acadêmicos e culturais. No ambiente digital,
parece provável que as responsabilidades de preservação sejam distribuídas
entre criadores individuais, detentores de direitos, distribuidores, pequenas
instituições e repositórios estabelecidos. As decisões tomadas no processo de
produção e disseminação sobre formatos, estruturas de dados, padrões, mídia de
armazenamento e afins influenciarão quais informações digitais sobreviverão e
quanto custará mantê-las. Portanto,

Finalmente, seria benéfico tanto para a comunidade de preservação quanto


para aqueles que realizam pesquisas sobre questões de longevidade, migração e
conversão se houvesse mais locais para troca de ideias, requisitos e
desenvolvimentos recentes. Sem um diálogo contínuo entre humanistas,
preservacionistas e a comunidade científica, é difícil incluir os requisitos de
preservação nos esforços de pesquisa científica, e é um desafio para aqueles que
estão fora da comunidade científica acompanhar e avaliar novos produtos. Hoje,
as estratégias de preservação digital são moldadas principalmente pelos
requisitos e restrições dos repositórios estabelecidos que buscam soluções e
métodos acessíveis e práticos. No futuro,

Referências

Ackerman, Mark S. e Roy T. Fielding. “Manutenção de Acervo na Biblioteca Digital”.


<http://csdl.tamu.edu/DL95> (1995).
Bearman, David e Ken Sochats. “Requisitos de metadados para evidências”. <www.lis.pitt.edu/
nhprc/meta96.html> (1995).
Boletim da Sociedade Americana para a Ciência da Informação.n“cSeEdição especial sobre Sistemas Eletrônicos e
Gestão de Registros na Era da Informação”. 23(5) (junho/julho de 1997).
Conway, Paulo.Preservação no Mundo Ditigal.dWashington, DC: Comissão de Preservação
e Acesso, 1996.
Conway, Paulo. “Digitalizando a preservaçãoeu.”Jornal da Biblioteca, (1 de fevereiro de 1994),
42-45. Conway, Paulo. “Preservação de Arquivos em um Conte NacionalUMA xt.m”erican Archivis,t53(2) (1990),
204-222.
202 MARGARET HEDSTROM

Eaton, Fynnette L. “Os Arquivos Nacionais e Registros Eletrônicos para PreservaçãoP n.r”eeusnerva-
ção de Formatos Eletrônicos: Formatos Eletrônicos para Preservação.ioEnd. Janice Mohlhenrich. pés
Atkinson, WI: Highsmith Press, 1993, pp. 41-61.
Giguere, Mark D. “Padrões de Descrição de Documentos Eletrônicos: Uma Viabilidade Técnica de Seu Uso
no aumento da preservação de microformas de pistas contextuais incorporadas em documentos
eletrônicos estruturados durante a reformatação digital/analógica/digital sucessiva”. Ph.D.
Dissertação, School of Information Science and Policy Studies, State University of New York at
Albany, 1995.
. Setnumatnford, CA: A Pesquisa
Gould, ConstançaDentro.Necessidades de formação em Humanidades: Uma Avaliação
Grupo de Bibliotecas, 1988.
Graham, Peter S. “Requisitos para a Digital Research LibrC aroyeu.eu”ege e Pesquisa Universitária
Bibliotecas, 56(4) (julho de 1995), 331-339.
Kahle, Brewster. “Preservando a InternaS t.c”América cientifica,n276 (março de 1997), 82-83.
“Armazenamento de feixe de íons LANL contém 180 vezes mais informações do que CD-ROMs.c”ciencia e Engenharia
Notícias, 23 de junho de 1995, baixado do HPCwire e redistribuído para <PACS-HUPVM1.EDU>. Lesk,
Michael.Preservação de Novas Tecnologias: Um Relatório da Assessoria de Avaliação de Tecnologia
Comitê para a Comissão de Preservação e Ac.cC eumassHington, DC, Comissão de
Preservação e Acesso, 1992.
Levy, David M. e Catherine C. Marshall. “Tornar-se digital: um olhar sobre as premissas subjacentes
Bibliotecas Digitais”.Comunicações do AC,M58(4) (1995), 77-84.
Lynch, Clifford. “A Integridade da Informação Digital: Mecânica e Questão de DefiniçãoJso.você ”rnal
da Sociedade Americana para a Ciência da Informação,n4c5 e(10) (1994), 737-744.
Michelson, Avra e Jeff Rothenberg. “Comunicação acadêmica e tecnologia da informação:
Explorando o Impacto das Mudanças no Processo de Pesquisa em ArchiUMAvmese.”arquivo rico,t
55(2) (1992), 236-315.
O'Toole, James M. “Sobre a ideia de permanênciaUMAem . ”erican Archivis,t52(1) (1989), 10-25.
“Relatório Resumido de Projetos de Adesão Piloto.” Universidade do Estado de Nova York, Educação do Estado
Departamento, Arquivos Estaduais e Administração de Registros. Construindo Parcerias para Manutenção
de Registros Eletrônicos: O Relatório Final e Documentos de Trabalho do Projeto Construindo Parcerias.
Albany, NY, 1995. <http://unix6.nysed.gov/pubs/build.htm>.
A Preservação da Matéria de Arquivo.euCsashington, DC: Comissão de Preservação e Acesso,
1993.
Preservando a Informação Digital: Relatório da Força Tarefa de Arquivamento de Informação Digital.tRioenporta
encomendado pela Comissão de Preservação e Acesso e The Research Libraries Group,
Washington, DC: Comissão de Preservação e Acesso, 1º de maio de 1996.
Preservando o Patrimônio Intelectual: Um Relatório da Conferência Bellagio.eCncumaeshington, DC: O
Comissão de Preservação e Acesso, 1993. Rothenberg, Jeff.
“Garantindo a Longevidade do Documento DigitalS tsc.eu”América Latina,n272(1) (1995),
24-29.
Administração de Arquivos e Registros Nacionais dos EUA. Sistemas de Imagem Digital e Armazenamento em
Disco Digital Óptico: Estratégias de Acesso de Longo Prazo para Órgãos Federais. Documento de
Informação Técnica No. 12. Serviço Nacional de Informação Técnica, Washington, DC, 1994. <gopher://
gopher. nara.gov:70/11/managers/archival/papers/postscri>.
Van Bogart, John WCM. Armazenamento e Manuseio de Fita Agnetic: Um Guia para Bibliotecas e Arch,ives
Washington, DC: Comissão de Preservação e Acesso e o Laboratório Nacional de Mídia, 1995.

Você também pode gostar