Escolar Documentos
Profissional Documentos
Cultura Documentos
com
MARGARET HEDSTROM
?
Escola de Informação, Universidade de Michigan, Ann Arbor, Michigan 48109-1092, EUA
Margaret Hedstrom é Professora Associada da School of Information, University of Michigan, onde leciona
?
nas áreas de arquivos, gerenciamento de registros eletrônicos e preservação digital. Antes de ingressar no corpo
docente de Michigan em 1995, ela trabalhou por dez anos na Administração de Arquivos e Registros do Estado
de Nova York, onde foi Chefe dos Serviços de Consultoria de Registros Estaduais e Diretora do Centro de
Registros Eletrônicos. Dr. Hedstrom tem um Ph.D. em História pela Universidade de Wisconsin em Madison. Ela
publicou amplamente sobre muitos aspectos do gerenciamento de arquivos e registros eletrônicos e atualmente
está escrevendo um livro sobre preservação digital. Seus atuais interesses de pesquisa incluem estratégias de
preservação digital, o impacto das comunicações eletrônicas na memória e documentação organizacional, e
acesso remoto a materiais de arquivo. Ela é membro da Society of American Archivists e foi a primeira a receber
o prêmio anual de Excelência em Serviços de Informação do Governo do Estado de Nova York.
Este artigo foi revisado a partir de um artigo preparado para Reconnecting Science and Humanities in
Digital Libraries: A Symposium Sponsored by the University of Kentucky and the British Library, 19–21 de
outubro de 1995, Lexington, Kentucky.
190 MARGARET HEDSTROM
abundam, mas as tecnologias e métodos para preservação a longo prazo do vasto e crescente
estoque de informações digitais ficam muito para trás. As estratégias, métodos e tecnologias para
preservação de longo prazo de informações digitais que existem não são necessariamente viáveis
tecnologicamente para preservação em grande escala, nem são acessíveis devido à grande
quantidade de informações digitais que estão sendo geradas. Nossa capacidade de criar, acumular
e armazenar materiais digitais excede em muito nossa capacidade atual de preservar até mesmo
essa pequena quantidade com valor contínuo.
identificando fontes, comunicando-se com colegas, interpretando e analisando dados, divulgando resultados de pesquisas e ensinando. Se suas projeções
estiverem corretas, os programas de preservação digital devem permitir um alto grau de integração entre o material de origem e os processos analíticos,
acoplando as fontes de pesquisa com as ferramentas necessárias para analisá-las; mantendo vínculos entre os resultados da pesquisa e as fontes em que se
baseiam; e fornecendo um meio para incorporar fontes primárias ao ensino. Os usuários buscarão documentos que sejam facilmente recuperados e
manipulados, transmissíveis e transportáveis de um repositório para os locais de pesquisa, apresentação e ensino. Parece seguro supor que os acadêmicos
de humanidades precisarão da capacidade de pesquisar e selecionar fontes relevantes de grandes corpos de materiais heterogêneos, para comparar fontes
entre si e visualizar documentos específicos em altos níveis de granularidade. A preservação digital agregará pouco valor ao processo de pesquisa se servir
apenas como uma forma alternativa de armazenamento a partir do qual são produzidas réplicas analógicas para uso com métodos analíticos convencionais.
A preservação de materiais digitais em formatos confiáveis e utilizáveis, no entanto, exigirá manutenção de longo prazo de características estruturais,
metadados descritivos e recursos de exibição, computacionais e analíticos que exigem muito do armazenamento em massa e do software para recuperação
e interpretação. A preservação digital agregará pouco valor ao processo de pesquisa se servir apenas como uma forma alternativa de armazenamento a
partir do qual são produzidas réplicas analógicas para uso com métodos analíticos convencionais. A preservação de materiais digitais em formatos
confiáveis e utilizáveis, no entanto, exigirá manutenção de longo prazo de características estruturais, metadados descritivos e recursos de exibição,
computacionais e analíticos que exigem muito do armazenamento em massa e do software para recuperação e interpretação. A preservação digital
agregará pouco valor ao processo de pesquisa se servir apenas como uma forma alternativa de armazenamento a partir do qual são produzidas réplicas
analógicas para uso com métodos analíticos convencionais. A preservação de materiais digitais em formatos confiáveis e utilizáveis, no entanto, exigirá
manutenção de longo prazo de características estruturais, metadados descritivos e recursos de exibição, computacionais e analíticos que exigem muito do
Arquivos, bibliotecas e outros tipos de repositórios que estão lutando para atender às
crescentes expectativas dos usuários com recursos financeiros e técnicos limitados podem
expressar os requisitos de preservação digital de forma diferente dos usuários finais. Do ponto de
vista de um repositório, os sistemas de armazenamento devem ser capazes de lidar com
informações digitais em uma ampla variedade de formatos, incluindo texto, dados, gráficos, vídeo
e som. O armazenamento digital não é simplesmente um meio alternativo para armazenar
formatos de impressão. Muitos tipos de objetos digitais não possuem equivalentes impressos e
não podem ser preservados em formatos não digitais. Idealmente, a mídia de armazenamento terá
uma longa expectativa de vida, um alto grau de resistência a desastres, durabilidade suficiente
para suportar o uso regular e capacidades de armazenamento muito grandes. A conversão de
formatos analógicos para digitais e a migração para novas gerações de tecnologia serão rápidas,
precisas e baratas o suficiente para permitir transferências em grande escala de materiais
heterogêneos. Os requisitos de espaço de armazenamento serão mínimos e não exigirão controles
ambientais altamente sensíveis. Para tornar a preservação digital acessível ao maior número
possível de organizações e indivíduos, os custos de equipamentos, mídia e manutenção devem ser
modestos.
representações imate das versões originais e fontes úteis para análise e pesquisaP(
reservando informações digitais)n. Os métodos atuais de preservação de materiais
digitais não apoiam totalmente a realização desses objetivos. Diante da responsabilidade
pela preservação de materiais digitais, arquivos e bibliotecas enfrentam uma série de
escolhas complexas e difíceis baseadas no formato dos materiais originais, nos usos
previstos para eles e nos recursos técnicos e financeiros disponíveis para investir em
iniciativas de preservação que vão desde desde métodos muito elementares e
estabelecidos até propostas que ainda não foram testadas.
A transferência de informações digitais de mídias magnéticas e ópticas menos
estáveis por meio da impressão de imagens de páginas em papel ou microfilme é
provavelmente a estratégia de preservação mais utilizada. Parece irônico que, assim
como bibliotecas e arquivos estão descobrindo a conversão digital como um método de
preservação econômico para certos materiais em deterioração, muitas informações que
começam sua vida em formato eletrônico são impressas em papel ou microfilme para
armazenamento seguro a longo prazo. No entanto, o papel neutro em ácido de alta
qualidade pode durar um século ou mais, enquanto o microfilme de qualidade
arquivística é projetado para durar 500 anos ou mais. Papel e microfilme têm a
vantagem adicional de não exigir hardware ou software especial para recuperação ou
visualização. Talvez isso explique por que em muitos projetos de conversão digital,
Outra estratégia de preservação digital é preservar a informação digital nos formatos digitais
mais simples possíveis, a fim de minimizar os requisitos de recuperação de software específico e
evitar problemas de obsolescência de software. As informações digitais podem ser transferidas por
sucessivas gerações de tecnologia em um formato “independente de software” como arquivos de
texto ASCII ou como arquivos planos com estruturas simples e uniformes. Vários arquivos de dados
contêm grandes coleções de dados numéricos que foram capturados em cartões perfurados nas
décadas de 1950 ou 1960, migrados para dois ou três formatos diferentes de fita magnética e
agora residem em mídia óptica. À medida que novos formatos de mídia e armazenamento são
introduzidos, os dados podem ser migrados sem nenhuma alteração significativa em sua estrutura
lógica. Essa abordagem tem a vantagem distinta de ser universal e fácil de implementar. É uma
estratégia econômica para preservar informações digitais nos casos em que a retenção do
conteúdo é primordial, mas as características de exibição, indexação e computacionais não são
críticas. Enquanto a comunidade de preservação não tiver estratégias de migração mais robustas e
econômicas, a impressão em papel ou filme e a preservação de arquivos planos continuarão sendo
os métodos de último recurso para muitas instituições e para certos formatos de informação
digital.
Bibliotecas e arquivos com coleções grandes, complexas e diversificadas de materiais digitais
estão apenas começando a testar estratégias que normalizam vários tipos de acervos,
convertendo registros digitais da grande multiplicidade de formatos em um número menor e mais
gerenciável de formatos padrão (“Pilot Accessioning Relatório de Resumo de Projetos”). Um
repositório pode aceitar documentos textuais apenas em um ou alguns formatos de
processamento de texto comerciais comumente disponíveis ou exigir que os documentos estejam
em conformidade com padrões como SGML (ISO 8879). Estável e padrão-
PRESERVAÇÃO DIGITAL: UMA BOMBA-RELÓGIO PARA BIBLIOTECAS DIGITAIS 195
métodos padronizados para marcação, como o uso de SGML como uma ferramenta para representar a
estrutura lógica de textos, podem preservar recursos estruturais, de apresentação e recuperação sem se
tornarem dependentes da longevidade de aplicativos de software específicos. Os bancos de dados
podem ser armazenados em um ou alguns formatos comuns ou convertidos para um formato
compatível com SQL (Structured Query Language), enquanto os arquivos de imagem podem estar em
conformidade com o formato de arquivo de imagem marcado (TIFF) ou outro formato de imagem
comum com algoritmos de compactação padrão.
Essa abordagem tem a vantagem de preservar mais a exibição, a disseminação e as
características computacionais dos materiais originais, ao mesmo tempo em que reduz a grande
variedade de transformações personalizadas que, de outra forma, seriam necessárias para migrar
o material para as futuras gerações de tecnologia. A estratégia baseia-se na suposição de que os
produtos de software que estão em conformidade com os padrões amplamente adotados ou
amplamente dispersos no mercado são menos voláteis do que o mercado de software como um
todo. Os produtos comerciais mais comuns atualmente fornecem utilitários para compatibilidade
com versões anteriores e para troca de documentos, bancos de dados e objetos mais complexos
entre sistemas de software. Embora essa estratégia simplifique a migração e possa reduzir os
custos de preservação digital, reduzindo a quantidade de reformatação personalizada necessária à
medida que a tecnologia muda, não elimina a necessidade de migração regular de materiais
digitais. Tanto o software quanto os padrões continuam a evoluir e até mesmo repositórios com
acervos estruturalmente homogêneos podem esperar que migrem seus materiais digitais
periodicamente.
Os métodos atuais estão muito aquém do que é necessário para preservar materiais
digitais. Todos os métodos de preservação atuais envolvem compromissos entre o que é
desejável do ponto de vista da funcionalidade, confiabilidade e custo e o que é possível e
acessível com as tecnologias e métodos atuais. Consequentemente, a maioria dos repositórios
está lidando com o emprego de estratégias provisórias e menos do que desejáveis, se eles
estão abordando questões de preservação digital. Por exemplo, a simplicidade e a
universalidade da impressão em papel ou microfilme vêm à custa de grandes perdas no
potencial de recuperação e reutilização da informação digital. As estratégias de migração que
envolvem a reformatação de materiais digitais para um formato padrão simples geralmente
eliminam a estrutura de documentos e relacionamentos embutidos em bancos de dados.
Capacidades de computação, exibição gráfica, indexação e outros recursos muitas vezes são
perdidos, limitando assim o potencial analítico futuro. A normalização para formatos padrão
nem sempre é tecnicamente viável e geralmente é bastante cara. Arquivos e bibliotecas
também devem lidar com formas inteiramente novas de discurso habilitado eletronicamente e
novas formas de expressão artística e cultural que não têm predecessores no mundo
analógico. Nenhum método de preservação atual é adequado para preservar objetos de
dados dinâmicos de sistemas complexos. Não há modelos conceituais estabelecidos ou
processos técnicos para a preservação de obras multimídia, hipermídia interativa, diálogos on-
line ou muitas das novas formas eletrônicas que estão sendo criadas hoje. Os requisitos de
arquivamento para preservar conteúdo, contexto e estrutura de documentos digitais e a
necessidade de manter a capacidade de exibir, vincular e manipular
196 MARGARET HEDSTROM
objetos digitais para satisfazer os requisitos do usuário apenas aumentam a dependência de software em
repositórios digitais.
A comunidade de preservação está apenas começando a explorar possíveis alternativas
para armazenar informações digitais em formato “independente de software”. Rothenberg
(1995) propôs uma abordagem para manter o conteúdo de materiais digitais intacto sem
perder a capacidade de recuperar fontes ricas em significado. Ele recomendou manter o
documento original em seu formato original encapsulado em um “envelope” virtual que
contém instruções de software para recuperação, exibição e processamento da mensagem
no envelope. Os envelopes conteriam informações contextuais e a história transformacional
de cada objeto. A execução das instruções dependeria de um arquivo de emuladores de
hardware e software ou de instruções no envelope com especificações sobre como construir
emuladores.
As estratégias de preservação digital discutidas até agora são baseadas no pressuposto de
que bibliotecas e arquivos serão receptores passivos de materiais digitais. Uma estratégia
complementar busca colocar as preocupações de preservação mais a montante no processo
de geração de informação digital, desenvolvendo ou recomendando padrões para o formato,
estrutura e descrição de objetos digitais para que sejam mais passíveis de preservação a longo
prazo. A pesquisa sobre requisitos de gerenciamento de registros eletrônicos definiu padrões
de metadados para evidências que apoiarão a necessidade de integridade, autenticidade,
confiabilidade e arquivamento por meio de padrões para “objetos encapsulados de
metadados” (Bearman e SocB ha ).
vocêtllse;lata de ASIS
Arquivos, bibliotecas e outras instituições com responsabilidades de preservação se beneficiarão se os sistemas de informação que geram informação digital forem projetados para dar
suporte às necessidades de preservação de longo prazo, como migração, descrição adequada e ligações entre o conteúdo de materiais digitais e suas organizações ou organizações mais
amplas. contexto intelectual. A adoção em larga escala de padrões de dados e comunicação pelos originadores de informações digitais para dar suporte às suas necessidades comerciais
atuais também pode facilitar a preservação a longo prazo. A rápida implementação do comércio eletrônico depende do amplo desenvolvimento e adoção de padrões para intercâmbio
eletrônico de dados e transações seguras. Muitas organizações estão adotando padrões para formatos e definições para permitir troca, reutilização, e venda de informação digital e reduzir
os custos de conversão e manutenção. As iniciativas de padrões que atendem às necessidades de negócios para a troca segura e confiável de informações digitais entre a geração atual de
sistemas imporão padronização e normalização de dados que, em última análise, facilitarão migrações para novas gerações de tecnologia. No entanto, para se beneficiar totalmente da
sinergia entre as necessidades de negócios e os requisitos de preservação, as preocupações com o patrimônio cultural devem estar ligadas a objetivos sociais igualmente críticos, como
monitorar as mudanças ambientais globais, localizar locais de resíduos nucleares e estabelecer direitos de propriedade, todos também dependentes de acesso a longo prazo a provas
electrónicas fiáveis. As iniciativas de padrões que atendem às necessidades de negócios para a troca segura e confiável de informações digitais entre a geração atual de sistemas imporão
padronização e normalização de dados que, em última análise, facilitarão migrações para novas gerações de tecnologia. No entanto, para se beneficiar totalmente da sinergia entre as
necessidades de negócios e os requisitos de preservação, as preocupações com o patrimônio cultural devem estar ligadas a objetivos sociais igualmente críticos, como monitorar as
mudanças ambientais globais, localizar locais de resíduos nucleares e estabelecer direitos de propriedade, todos também dependentes de acesso a longo prazo a provas electrónicas fiáveis.
As iniciativas de padrões que atendem às necessidades de negócios para a troca segura e confiável de informações digitais entre a geração atual de sistemas imporão padronização e
normalização de dados que, em última análise, facilitarão migrações para novas gerações de tecnologia. No entanto, para se beneficiar totalmente da sinergia entre as necessidades de
negócios e os requisitos de preservação, as preocupações com o patrimônio cultural devem estar ligadas a objetivos sociais igualmente críticos, como monitorar as mudanças ambientais
globais, localizar locais de resíduos nucleares e estabelecer direitos de propriedade, todos também dependentes de acesso a longo prazo a provas electrónicas fiáveis.
Muita pesquisa e desenvolvimento são necessários antes que bibliotecas e arquivos possam
garantir que mesmo uma pequena parte de nossa herança digital sobreviva. É justo dizer que o
estado de desenvolvimento da preservação digital permanece amplamente experimental.
PRESERVAÇÃO DIGITAL: UMA BOMBA-RELÓGIO PARA BIBLIOTECAS DIGITAIS 197
O estado atual da preservação digital sugere várias áreas frutíferas para pesquisa e
desenvolvimento. Discutirei quatro áreas: mídia de armazenamento, migração, conversão e
ferramentas de gerenciamento. Esses quatro domínios são mutuamente dependentes e, em última
análise, devem ser integrados a uma infraestrutura para preservação digital. No entanto, soluções
melhores são necessárias em todas as quatro áreas antes que essa integração possa ocorrer.
Finalmente, compartilharei algumas observações sobre as questões de escala e custo que devem
ser consideradas para que bibliotecas e arquivos alcancem algum grau de preservação sistemática.
5. Mídia de armazenamento
6. Migração
7. Conversão
Tecnologias de conversão mais rápidas, baratas e de maior resolução são outro elemento
crítico necessário para viabilizar a preservação digital em larga escala. A maioria dos
arquivistas e bibliotecários aceita o fato de que vivemos em um ambiente híbrido onde papel,
microfilme, vídeo e mídias magnéticas e ópticas precisam interoperar de forma mais
integrada e transparente. A grande maioria das fontes primárias hoje ainda reside em papel
e/ou microfilme com pouca chance de vermos a conversão em massa de acervos arquivísticos
e bibliotecários existentes para formatos digitais. A pesquisa e o planejamento para
preservação digital devem reconhecer que os repositórios lidarão com a conversão por um
longo tempo e que os investimentos na melhoria das taxas de captura, precisão, resolução e
verificação terão benefícios de longo prazo. Além disso, melhorias nas tecnologias de
conversão podem apoiar soluções híbridas para problemas de preservação e acesso,
permitindo que os repositórios armazenem certos formatos de material digital em mídia
estável, como microfilme, com conversão sob demanda para formato digital para análise e
reutilização. Os esforços para capturar e armazenar marcações descritivas no filme para
conversão subsequente são prejudicados por taxas de erro inaceitáveis na tecnologia OCR e
processos de conversão complicados (Giguere).
8. Ferramentas de Gestão
ao problema geral da preservação digital. Isso não quer dizer que exista ou deva existir
uma solução única para a preservação digital. Os métodos usados variam dependendo
da complexidade dos objetos digitais originais, da extensão em que a funcionalidade de
computação, exibição, indexação e autenticação deve ser mantida e dos requisitos dos
usuários atuais ou previstos. Mas qualquer solução deve ser escalável desde o
laboratório, protótipo ou projeto piloto até a ampla gama de indivíduos e instituições
que têm a responsabilidade de garantir que os materiais digitais durem mais do que a
atual geração de tecnologia permite.
Outra questão intimamente relacionada é a questão da acessibilidade.
Independentemente de como a responsabilidade pela preservação digital é
distribuída, as sociedades alocam apenas uma quantidade pequena e finita de
recursos para preservar recursos acadêmicos e culturais. No ambiente digital,
parece provável que as responsabilidades de preservação sejam distribuídas
entre criadores individuais, detentores de direitos, distribuidores, pequenas
instituições e repositórios estabelecidos. As decisões tomadas no processo de
produção e disseminação sobre formatos, estruturas de dados, padrões, mídia de
armazenamento e afins influenciarão quais informações digitais sobreviverão e
quanto custará mantê-las. Portanto,
Referências
Eaton, Fynnette L. “Os Arquivos Nacionais e Registros Eletrônicos para PreservaçãoP n.r”eeusnerva-
ção de Formatos Eletrônicos: Formatos Eletrônicos para Preservação.ioEnd. Janice Mohlhenrich. pés
Atkinson, WI: Highsmith Press, 1993, pp. 41-61.
Giguere, Mark D. “Padrões de Descrição de Documentos Eletrônicos: Uma Viabilidade Técnica de Seu Uso
no aumento da preservação de microformas de pistas contextuais incorporadas em documentos
eletrônicos estruturados durante a reformatação digital/analógica/digital sucessiva”. Ph.D.
Dissertação, School of Information Science and Policy Studies, State University of New York at
Albany, 1995.
. Setnumatnford, CA: A Pesquisa
Gould, ConstançaDentro.Necessidades de formação em Humanidades: Uma Avaliação
Grupo de Bibliotecas, 1988.
Graham, Peter S. “Requisitos para a Digital Research LibrC aroyeu.eu”ege e Pesquisa Universitária
Bibliotecas, 56(4) (julho de 1995), 331-339.
Kahle, Brewster. “Preservando a InternaS t.c”América cientifica,n276 (março de 1997), 82-83.
“Armazenamento de feixe de íons LANL contém 180 vezes mais informações do que CD-ROMs.c”ciencia e Engenharia
Notícias, 23 de junho de 1995, baixado do HPCwire e redistribuído para <PACS-HUPVM1.EDU>. Lesk,
Michael.Preservação de Novas Tecnologias: Um Relatório da Assessoria de Avaliação de Tecnologia
Comitê para a Comissão de Preservação e Ac.cC eumassHington, DC, Comissão de
Preservação e Acesso, 1992.
Levy, David M. e Catherine C. Marshall. “Tornar-se digital: um olhar sobre as premissas subjacentes
Bibliotecas Digitais”.Comunicações do AC,M58(4) (1995), 77-84.
Lynch, Clifford. “A Integridade da Informação Digital: Mecânica e Questão de DefiniçãoJso.você ”rnal
da Sociedade Americana para a Ciência da Informação,n4c5 e(10) (1994), 737-744.
Michelson, Avra e Jeff Rothenberg. “Comunicação acadêmica e tecnologia da informação:
Explorando o Impacto das Mudanças no Processo de Pesquisa em ArchiUMAvmese.”arquivo rico,t
55(2) (1992), 236-315.
O'Toole, James M. “Sobre a ideia de permanênciaUMAem . ”erican Archivis,t52(1) (1989), 10-25.
“Relatório Resumido de Projetos de Adesão Piloto.” Universidade do Estado de Nova York, Educação do Estado
Departamento, Arquivos Estaduais e Administração de Registros. Construindo Parcerias para Manutenção
de Registros Eletrônicos: O Relatório Final e Documentos de Trabalho do Projeto Construindo Parcerias.
Albany, NY, 1995. <http://unix6.nysed.gov/pubs/build.htm>.
A Preservação da Matéria de Arquivo.euCsashington, DC: Comissão de Preservação e Acesso,
1993.
Preservando a Informação Digital: Relatório da Força Tarefa de Arquivamento de Informação Digital.tRioenporta
encomendado pela Comissão de Preservação e Acesso e The Research Libraries Group,
Washington, DC: Comissão de Preservação e Acesso, 1º de maio de 1996.
Preservando o Patrimônio Intelectual: Um Relatório da Conferência Bellagio.eCncumaeshington, DC: O
Comissão de Preservação e Acesso, 1993. Rothenberg, Jeff.
“Garantindo a Longevidade do Documento DigitalS tsc.eu”América Latina,n272(1) (1995),
24-29.
Administração de Arquivos e Registros Nacionais dos EUA. Sistemas de Imagem Digital e Armazenamento em
Disco Digital Óptico: Estratégias de Acesso de Longo Prazo para Órgãos Federais. Documento de
Informação Técnica No. 12. Serviço Nacional de Informação Técnica, Washington, DC, 1994. <gopher://
gopher. nara.gov:70/11/managers/archival/papers/postscri>.
Van Bogart, John WCM. Armazenamento e Manuseio de Fita Agnetic: Um Guia para Bibliotecas e Arch,ives
Washington, DC: Comissão de Preservação e Acesso e o Laboratório Nacional de Mídia, 1995.