Você está na página 1de 88

2

Introduo

Preservao Digital
Conceitos, estratgias e actuais consensos

MIGUEL FERREIRA
2006

Ttulo

Introduo preservao digital Conceitos,


estratgias e actuais consensos

Autor

Miguel Ferreira

Ano
ISBN
Editora

2006
972-8692-30-7
978-972-8692-30-8
Escola de Engenharia da Universidade do
Minho

Local

Guimares, Portugal

Capa

Miguel Ferreira

Suporte
Dimenses de impresso
Reviso cientfica

Edio electrnica
A: 297mm, L: 210mm (A4)
Ana Alice Baptista
(Universidade do Minho)

Cristina Ribeiro
(Faculdade de Engenharia da Universidade do Porto)

Francisco Barbedo
(Instituto dos Arquivos Nacionais/Torre do Tombo)

Jos Carlos Ramalho


(Universidade do Minho)

Paulo Cortez
(Universidade do Minho)

Idioma

Portugus

Citao. M. Ferreira, Introduo preservao digital Conceitos, estratgias e


actuais consensos. Guimares, Portugal: Escola de Engenharia da Universidade do
Minho, 2006.
Este trabalho est licenciado sob uma Licena Creative Commons Atribuio-Uso
No-Comercial-Vedada a Criao de Obras Derivadas 2.5 Portugal. Para ver uma
cpia desta licena, visite http://creativecommons.org/licenses/by-nc-nd/2.5/pt/ ou
envie uma carta para Creative Commons, 559 Nathan Abbott Way, Stanford,
California 94305, USA.

Dedicado Marta
a minha mais que tudo.

AGRADECIMENTOS

Foram vrias as pessoas que contriburam para a edificao deste livro. A


todos os que directa ou indirectamente participaram ou influenciaram a
realizao deste trabalho, o meu mais sincero obrigado.
H, contudo, um conjunto de pessoas que pela forma incisiva como
colaboraram na concepo deste projecto merece a minha particular
ateno. Gostaria, assim, de agradecer de forma especial s seguintes
individualidades:
Ana Alice Baptista e ao Jos Carlos Ramalho, meus mentores e
orientadores de doutoramento que sempre me indicaram o caminho
mais acertado, tanto no trabalho como na vida.
equipa de revisores, Cristina Ribeiro e Paulo Cortez, pelos
comentrios, correces e sugestes fornecidas durante a apresentao
pblica do meu trabalho de doutoramento.
Ao sempre eloquente Francisco Barbedo, pelas discusses filosficas
em torno de semitica, comunicao e arquivstica.
Ao Rui Castro e Duarte Duque, companheiros de sempre, pelas
inmeras correces de linguagem e conselhos tcnicos que to
acentuadamente elevaram a qualidade final desta obra.
Ao Dr. Eloy Rodrigues, por ter aceite o meu humilde convite para
prefaciar este livro.
A todas estas pessoas, o meu mais profundo obrigado.

SOBRE O AUTOR

Licenciado em Engenharia de Sistemas e Informtica pela Universidade do


Minho, iniciou a sua carreira profissional na Philips Research em Eindhoven,
Holanda, onde trabalhou como investigador no domnio da domtica e
Ambient Intelligence. A, fez parte da equipa de desenvolvimento de um
dispositivo capaz de armazenar e navegar nas memrias colectivas de uma
comunidade, e.g. fotografias, vdeos, sons, aromas.
Regressado a Portugal, mudou radicalmente o rumo da sua vida profissional
ao ingressar a equipa do projecto DigitArq. Um projecto multifacetado
realizado no Arquivo Distrital do Porto, sob coordenao cientfica da
Universidade do Minho, do qual resultou a atribuio do prmio Fernandes
Costa Agncia para a Sociedade do Conhecimento, por ter sido
considerado o trabalho que melhor respondeu inovao e contributo para
o desenvolvimento da Sociedade da Informao em Portugal no ano de
2004.
Regressou Universidade do Minho onde iniciou a sua carreira como
investigador na rea dos Arquivos e Bibliotecas Digitais. Durante um ano
explorou novas formas de navegar sobre repositrios digitais. Parte desses
desenvolvimentos vieram a ser integrados na distribuio oficial da
plataforma DSpace e so agora mantidos pelo Massachusetts Institute of
Technology (MIT) e pela Hewlett-Packard (HP).
Em 2005 iniciou o seu programa de doutoramento na rea da Preservao
Digital, do qual resultou esta publicao.

10

Prefcio
para mim um grande prazer, e tambm uma honra, prefaciar esta obra. Em
primeiro lugar, pela sua relevncia, oportunidade e utilidade.
No mundo de hoje diariamente produzido um volume gigantesco de
informao, registada e/ou transmitida sobre diversos suportes e formatos.
Em resultado da evoluo social escala planetria no ltimo sculo
(crescimento demogrfico, evoluo do acesso educao e s tecnologias,
desenvolvimento e enriquecimento de mltiplas regies e grupos sociais) e
da revoluo tecnolgica dos ltimos 20 anos (em particular da informtica e
das comunicaes), provvel que as geraes actuais produzam e registem
mais informao, do que toda a informao registada pelas milhares de
geraes que nos precederam.
Uma parte crescente desta informao produzida, registada e transmitida
em suportes e formatos digitais. Claro que, tal como no passado, no
possvel, nem til ou relevante, guardar e preservar toda a informao hoje
criada. Mas, do mesmo modo que hoje podemos aceder e consultar um
registo significativo da informao produzida pelas geraes que nos

11

antecederam (em particular as dos ltimos cinco sculos), necessrio


garantir que as geraes futuras iro ter acesso a um registo igualmente
significativo e relevante da produo informativa contempornea.
Por isso, a preservao digital, que de forma feliz definida neste livro como
a actividade que garante que a comunicao entre um emissor e um receptor
possvel, no s atravs do espao, como tambm atravs do tempo,
assume uma importncia fundamental no actual contexto social e
tecnolgico. E da, a extrema oportunidade e relevncia deste livro.
O tema da preservao digital , ao mesmo tempo, um tema novo, vasto e
complexo. um tema novo porque ele apenas se autonomizou e
desenvolveu de forma visvel h pouco mais de dez anos. um tema vasto e
complexo porque o conjunto de questes e problemas, quer de natureza
conceptual e terica, quer de natureza prtica e tecnolgica, imenso. O
volume crescente, a heterogeneidade e as caractersticas da informao digital
(que, do ponto de vista dos seus utilizadores, no apenas pode ser
independente dos suportes, como dos formatos), tais como a facilidade de
manipulao, interligao e reutilizao vo traduzir-se certamente no
alargamento do campo da preservao digital.
A grande utilidade deste livro resulta precisamente de apresentar e mapear,
de forma simples mas nem por isso menos rigorosa, o territrio novo, vasto
e complexo da preservao digital.
O livro comea, de forma muito adequada, por apresentar e discutir a
anatomia dos objectos digitais, cuja preservao se pretende garantir,
chamando a ateno para a existncia de vrios nveis a que podem ser
observados, como que diferentes camadas de que se compem.
Uma das caractersticas essenciais dos objectos digitais, que os distingue de
objectos informativos anteriores, como os livros e outros documentos
registados em papel em que a informao pode ser acedida directamente do

12

objecto, que eles exigem camadas de intermediao tecnolgica


(hardware/equipamento, e software/formato), sem as quais a informao
que contm no pode ser acedida e usada. E apesar de os
leitores/utilizadores s interagirem com a ltima camada (no livro
designada como objecto conceptual),
esta depende das camadas
anteriores, muito vulnerveis obsolescncia tecnolgica.
Partindo deste til enquadramento conceptual, o livro aborda nos captulos
seguintes a problemtica especfica da preservao digital, apresentando de
um modo sinttico, e ao mesmo tempo claro e de fcil compreenso, o
modelo de referncia OAIS, as diferentes estratgias de preservao digital,
os directrios de formatos, a autenticidade, a metainformao de
preservao, concluindo com uma muito til avaliao de estratgias de
preservao.
Este livro fornece portanto uma panormica abrangente e introdutria s
questes da preservao digital que ser certamente preciosa para todos
quantos se queiram iniciar, ou actualizar conhecimentos, neste domnio.
Em segundo lugar, para mim tambm um enorme prazer prefaciar um livro
que o seu autor disponibiliza em Acesso Livre (Open Access).
Como se sabe, o Acesso Livre aplica-se primariamente verso final (aps
peer-review) de artigos de revistas (postprints), mas tambm inclui verses
no revistas (preprints) que os investigadores queiram divulgar para alertar
sobre novos resultados ou para estabelecer a primazia. Mas o Acesso Livre
pode aplicar-se naturalmente a todos os trabalhos, como livros e monografias
especializadas, working papers, e outros, dos quais os autores no esperem
obter rendimento (apesar de serem cada vez mais frequentes exemplos de
livros com verses disponveis em Acesso Livre e, simultaneamente, com
verses vendidas no circuito comercial).

13

Este livro, que o autor agora generosamente disponibiliza, constitui um dos


primeiros exemplos nacionais de livros acessveis em Acesso Livre. Espero
que, tambm sob esse ponto de vista, este seja um livro pioneiro abrindo
caminho a muitos outros que se editaro em Acesso Livre nos prximos
anos em Portugal.
Finalmente, tambm um prazer prefaciar este livro pelo conhecimento e
estima pessoal que tenho pelo Miguel Ferreira, com quem tenho tido o
privilgio de interagir e colaborar, ainda que de forma espordica e fugaz, nos
ltimos dois anos. Ambos somos membros de uma comunidade que se
tem vindo a constituir, de forma mais ou menos informal, na Universidade
do Minho, mas com fortes ligaes nacionais e internacionais, em torno da
informao digital, das bibliotecas e arquivos digitais, dos repositrios
institucionais, dos arquivos abertos (Open Archives Initiative) e do Acesso
Livre literatura cientfica.
Para finalizar este prefcio, deixo um convite e um desafio. O convite a
todos os que se deram ao trabalho de ler estas linhas, para que leiam, usem e
aproveitem intensamente este livro, no se esquecendo do dever bsico do
reconhecimento e atribuio da autoria.
O desafio para o autor: para que esta seja apenas a primeira verso de um
livro, que atravs de mltiplas revises, acrescentos e actualizaes, se
transforme numa obra de referncia sobre a preservao digital em lngua
portuguesa.
Guimares, Novembro de 2006
Eloy Rodrigues

14

CONTEDO

INTRODUO ...............................................................................................17
A ANATOMIA DE UM OBJECTO DIGITAL..................................................21
O MODELO DE REFERNCIA OAIS .........................................................27
ESTRATGIAS DE PRESERVAO DIGITAL..............................................31
Preservao de tecnologia..................................................................32
Refrescamento.....................................................................................33
Emulao..............................................................................................33
Migrao/converso...........................................................................36
Migrao para suportes analgicos...........................................37
Actualizao de verses .............................................................37
Converso para formatos concorrentes...................................38
Normalizao ..............................................................................38
Migrao a-pedido ......................................................................40
Migrao distribuda ...................................................................41
Encapsulamento..................................................................................43
A Pedra de Rosetta digital..................................................................44
DIRECTRIOS DE FORMATOS ...................................................................46
AUTENTICIDADE .........................................................................................49
METAINFORMAO DE PRESERVAO ....................................................54
AVALIAO DE ESTRATGIAS DE PRESERVAO...................................58
SNTESE E CONCLUSO ..............................................................................62
GLOSSRIO ...................................................................................................68
REFERNCIAS...............................................................................................74
NDICE ..........................................................................................................84

15

16

Introduo
Desde a inveno da escrita que existe uma manifesta preocupao pela
preservao dos artefactos que resultam de processos intelectuais e criativos
do ser humano [1]. A preservao desses artefactos permite s geraes
futuras compreender e contextualizar a histria e a cultura dos seus povos
[2]. Os museus, as bibliotecas e os arquivos assumem neste contexto um
papel determinante, responsabilizando-se pela preservao e longevidade
desses artefactos.
Nos dias de hoje, uma parte significativa da produo intelectual realizada
com o auxlio de ferramentas digitais. A simplicidade com que o material
digital pode ser criado e disseminado atravs das modernas redes de
comunicao e a qualidade dos resultados obtidos so factores determinantes
na adopo deste tipo de ferramentas.
No entanto, o material digital carrega consigo um problema estrutural que
coloca em risco a sua longevidade. Embora um documento digital possa ser
copiado infinitas vezes sem qualquer perda de qualidade, este exige a
presena de um contexto tecnolgico para que possa ser consumido de

17

forma inteligvel por um ser humano. Esta dependncia tecnolgica torna-o


vulnervel rpida obsolescncia a que geralmente a tecnologia est sujeita
[3].
O curso da histria tem revelado inmeros exemplos fatdicos de
obsolescncia tecnolgica. Na dcada de 1970 a multinacional japonesa Sony
introduziu um formato de vdeo designado Betamax (Fig. 1 a).
Comparativamente ao comum VHS (Video Home System) (Fig. 1 b), a
cassete Betamax era de menores dimenses e oferecia uma qualidade de
imagem superior. O pico da sua popularidade foi atingido em 1983 quando
cerca de um tero do mercado de vdeo domstico era dominado por este
formato [4].
Apesar do seu sucesso comercial, o facto de a Sony no facilitar o
licenciamento de produo a terceiros foi decisivo para que uma viragem
radical ocorresse no mercado e os consumidores passassem a utilizar
massivamente o formato VHS. Em escassos anos, o formato Betamax
desapareceu do mercado europeu e norte-americano, sendo hoje em dia
praticamente impossvel encontrar um dispositivo capaz de ler a informao
armazenada numa dessas cassetes [4].

a)

b)

Fig. 1 a) Cassete Betamax; b) Cassete VHS.

18

Um exemplo mais recente de obsolescncia tecnolgica, desta vez no


domnio digital, reporta-se ao uso das populares disquetes de 3.5 polegadas (
Fig. 2 - a). Em Maro de 2003, o fabricante Dell Computer Corporation
anunciou que os seus computadores deixariam de integrar dispositivos
capazes de ler este tipo de suportes (Fig. 2 - b). Vrios fabricantes seguiram
de imediato o seu exemplo [5].
Actualmente, ainda possvel adquirir dispositivos capazes de ler disquetes
de 3.5 polegadas. No entanto, o mercado inclina-se rapidamente para o uso
de DVD e flash-drives.

a)

b)

Fig. 2 a) Disquete de 3.5 polegadas; b) Leitor de disquetes de 3.5 polegadas.

A obsolescncia tecnolgica no se manifesta somente ao nvel dos suportes


fsicos. No domnio digital, todo o tipo de material tem obrigatoriamente de
respeitar as regras de um determinado formato. Isto permite que as
aplicaes de software sejam capazes de abrir e interpretar adequadamente a
informao armazenada. medida que o software vai evoluindo, tambm os
formatos por ele produzidos vo sofrendo alteraes.
bastante comum encontrar aplicaes de software capazes de carregar os
ficheiros produzidos por verses anteriores dessa mesma aplicao. No
entanto, essa capacidade raramente vai alm das duas verses precedentes [5].

19

No mundo actual, onde cada vez mais organizaes dependem da


informao digital que produzem, torna-se premente a implementao de
tcnicas e de polticas concertadas que vo no sentido de garantir a
perenidade e a acessibilidade a este tipo de informao.
Designa-se, assim, por p r e s e r v a o d i g i t a l o conjunto de actividades
ou processos responsveis por garantir o acesso continuado a longo-prazo
informao e restante patrimnio cultural existente em formatos digitais [6].
A preservao digital consiste na capacidade de garantir que a informao
digital permanece acessvel e com qualidades de autenticidade suficientes para
que possa ser interpretada no futuro recorrendo a uma plataforma
tecnolgica diferente da utilizada no momento da sua criao.
Ao longo dos ltimos 10 anos, foram muitos os projectos e iniciativas que
contriburam para a edificao da base de conhecimento que actualmente
suporta o domnio cientfico da preservao digital. Desses projectos
resultaram ideias, conceitos e estratgias que conduziram ao reconhecimento
universal do problema e elaborao de possveis solues.
Nos prximos captulos sero apresentados os conceitos e as iniciativas de
maior relevo no domnio da preservao digital.

20

A anatomia
de um objecto digital
Um o b j e c t o d i g i t a l pode ser definido como todo e qualquer objecto de
informao que possa ser representado atravs de uma sequncia de dgitos
binrios1 [7]. Esta definio suficientemente lata para acomodar tanto,
informao nascida num contexto tecnolgico digital (objectos nado-digitais),
como informao digital obtida a partir de suportes analgicos (objectos
digitalizados).
Documentos de texto, fotografias digitais, diagramas vectoriais, bases de
dados, sequncias de vdeo e udio, modelos de realidade virtual, pginas Web
e aplicaes de software so apenas alguns exemplos do que podemos
considerar um objecto digital.

Do ingls bit stream.

21

De modo a promover a compreenso e o enquadramento dos diferentes


processos envolvidos na preservao de objectos digitais, torna-se
fundamental analisar as diferentes formas como os podemos observar.
Para que um ser humano seja capaz de decifrar um objecto digital, h um
conjunto de transformaes que tm necessariamente de ocorrer. Um
objecto digital comea por ser um objecto fsico, i.e. um conjunto de
smbolos ou sinais inscritos num suporte fsico (e.g. disco rgido, CD, DVD,
disquete).
O suporte fsico define o domnio dos smbolos a utilizar. Vejamos um
exemplo. Uma fotografia digital pode encontrar-se inscrita numa vasta gama
de suportes fsicos. Os smbolos, ou sinais fsicos, utilizados para representar
essa fotografia num CD-ROM diferem substancialmente dos smbolos
utilizados para a representar num disco rgido [7]. No primeiro, os smbolos
utilizados so essencialmente pequenos orifcios reflectores dispostos em
espiral sobre uma base de policarbonato. No segundo, so utilizados padres
magnticos sobre um prato metlico.
O objecto fsico constitui aquilo que, geralmente, o hardware capaz de
interpretar (Fig. 3). O hardware assume aqui a responsabilidade de
transformar os smbolos inscritos no suporte fsico num conjunto de dados
que o software ser capaz de manipular. Esse conjunto de dados encontra-se
geralmente organizado segundo as regras decretadas pelo software que foi
utilizado para produzir o objecto digital. Essas regras ou estruturas de dados
constituem aquilo que vulgarmente se designa por f o r m a t o de um objecto
digital [7]. Essas estruturas constituem o nvel de abstraco l g i c o , ou
s i n t c t i c o , do objecto digital.
O software assume ento a responsabilidade de preparar o o b j e c t o
l g i c o para que este seja devidamente apresentado a um receptor humano.
Nesta fase, os sinais digitais manipulados no interior do computador so

22

transformados em sinais analgicos que sero veiculados at ao receptor


humano atravs de um perifrico de sada (Fig. 4).

Fig. 3 - Diferentes nveis de abstraco de um objecto digital.

A imagem que posteriormente se forma na mente do receptor constitui o que


vulgarmente se designa por um o b j e c t o c o n c e p t u a l ou o b j e c t o
s e m n t i c o (Fig. 3).
Os objectos conceptuais assumem formas ou concepes familiares aos seres
humanos, i.e. formas que existem no mundo real e que lhes so conhecidas,
como livros, filmes ou fotografias. Do ponto de vista do ser humano, o
objecto conceptual constitui aquilo que deve ser preservado.
No obstante, cada ser humano acaba por fazer uma interpretao individual
do objecto recebido. Essa interpretao ser aqui designada por o b j e c t o
e x p e r i m e n t a d o ( Fig. 3). Apesar de teoricamente ser possvel captar e
preservar o objecto experimentado, nenhuma das estratgias de preservao
apresentadas ao longo deste livro abordam seriamente esta questo.
De modo anlogo, quando um ser humano assume o papel de emissor (ou
produtor de informao), este mesmo conjunto de transformaes

23

realizado, mas em sentido inverso. Nesta situao, o objecto conceptual que


ganhou forma no crebro do emissor codificado numa qualquer linguagem
passvel de ser comunicada (e.g. lngua portuguesa, linguagem grfica, etc.).
Essa linguagem poder ento ser transmitida ou armazenada num suporte
fsico adequado sua reteno, passando inevitavelmente por um processo
intermdio de codificao que transforma a linguagem humana em cdigos
binrios capazes de ser processados pelo computador.

Fotograa

Nvel conceptual
Perifrico
de sada

11010110
01000101
10111011
10011101

Nvel lgico
Software

Nvel fsico
Suporte
fsico

Perifrico de
entrada

Fig. 4 - Cadeia de interpretao do nvel fsico ao conceptual.

Numa situao ideal, o objecto conceptual formado na mente do emissor


ser em tudo semelhante ao objecto conceptual concebido pelo receptor.
Somente nessa situao a comunicao poder ser considerada perfeita.
A preservao digital a actividade responsvel por garantir que a
comunicao entre um emissor e um receptor possvel, no s atravs do
espao mas tambm atravs do tempo.
Para que a preservao de um objecto digital seja possvel, necessrio
assegurar que todos os nveis de abstraco anteriormente descritos se
encontram acessveis e interpretveis. Se a cadeia de interpretao que

24

permite elevar um objecto digital desde o seu nvel fsico at ao nvel


conceptual for rompida, a comunicao deixa de ser possvel e o objecto
perder-se- para sempre [8, 9].
Visto numa outra perspectiva, um mesmo objecto conceptual pode ser
representado em diversos formatos lgicos, podendo cada um destes ser
suportado por um sem-nmero de representaes fsicas [10]. Voltando ao
exemplo da fotografia digital, facilmente podemos constatar que poder ser
codificada em diversos formatos, e.g. TIFF, JPEG, PNG. No obstante,
cada um destes formatos pode, por sua vez, ser inscrito numa multitude de
suportes fsicos, e.g. DVD, disco rgido, flash-drive. (Fig. 5).

Fig. 5 - Objecto digital observado a diferentes nveis de abstraco.

Esta dissecao do conceito objecto digital luz da semitica , i.e. recorrendo


a diferentes nveis de abstraco, permite um melhor enquadramento das

25

diversas estratgias de preservao que sero apresentadas ao longo deste


livro.

26

O modelo de
referncia OAIS
Em 1990, o Consultative Comitee for Space Data Systems (CCSDS) iniciou
um esforo conjunto com a International Organization for Standardization
(ISO) a fim de desenvolver um conjunto de normas capazes de regular o
armazenamento a longo-prazo de informao digital produzida no mbito de
misses espaciais.
Deste esforo nasceu o modelo de referncia OAIS (Open Archival
Information System), um modelo conceptual que visa identificar os
componentes funcionais que devero fazer parte de um sistema de
informao dedicado preservao digital [11, 12]. O modelo descreve ainda
as interfaces internas e externas do sistema e os objectos de informao que
so manipulados no seu interior [11]. O modelo foi aprovado como uma
norma internacional em 2003 ISO Standard 14721:2003 [12].

27

Um dos contributos mais notveis desta iniciativa foi a definio de uma


terminologia prpria que viria a facilitar a comunicao entre os diversos
intervenientes envolvidos na preservao de objectos digitais [13].
A Fig. 6 ilustra os diferentes componentes funcionais, assim como os pacotes
de informao trocados no interior de um repositrio digital compatvel com
o modelo de referncia OAIS.

Planeamento de Preservao

Informao
descritiva

Gesto de
Dados

Informao
descritiva

Ingesto

Acesso

PIS

PID

Produtor

PIA

Repositrio de
dados

PIA

Consumidor

Administrao

Administrador

Fig. 6 - Modelo de referncia Open Archival Information System (OAIS).

O P r o d u t o r dever ser entendido como a entidade externa ao repositrio


que se responsabiliza pela submisso de material. O material submetido a
arquivo aqui representado pelo P a c o t e d e I n f o r m a o d e
Subm isso2 (PIS ).
T

Durante o processo de submisso ou incorporao, designado neste contexto


por I n g e s t o , o repositrio responsvel por garantir a integridade da
2

Do ingls Submission Information Package (SIP).

28

informao recebida. Ainda nesta fase, produzida toda a I n f o r m a o


D e s c r i t i v a que ir suportar a descoberta e localizao do material
depositado. Essa informao descritiva (ou metainformao) armazenada e
gerida pelo componente G e s t o d e D a d o s 3. O material a preservar (i.e.
P a c o t e d e I n f o r m a o d e A r q u i v o 4 ou PIA) ser conservado no
R e p o s i t r i o d e D a d o s 5.
O componente de ingesto constitui, assim, a interface entre o arquivo OAIS
e os respectivos produtores de informao [11].
O componente P l a n e a m e n t o d e P r e s e r v a o encarrega-se da
definio de polticas de preservao. Este servio responsvel pela
monitorizao do ambiente externo ao repositrio e por desencadear eventos
de preservao sempre que necessrio. , por exemplo, da responsabilidade
deste componente definir as estratgias de preservao a utilizar no interior
do repositrio, monitorizar as tendncias comportamentais da sua
comunidade de interesse ou identificar formatos que se encontram na
iminncia de se tornar obsoletos [11].
O componente A c e s s o estabelece a ponte entre o repositrio e a sua
comunidade de interesse6, i.e. o conjunto de potenciais C o n s u m i d o r e s
do material custodiado. Este componente responsvel por facilitar a

Do ingls Data Management.


Do ingls Archival Information Package (AIP).
5 Do ingls Archival Storage.
6 Tambm conhecido por p o p u l a o p o t e n c i a l m e n t e u t i l i z a d o r a . De
notar que o conceito de c o m u n i d a d e d e i n t e r e s s e dever ser entendido
no seu sentido mais lato. Trata-se de um conceito por vezes associado a centros de
documentao e bibliotecas especializadas, como o caso de certas bibliotecas
universitrias (e.g. Biblioteca de Fsica da Universidade do Minho). Em bibliotecas
de carcter geral, como bibliotecas pblicas ou nacionais, e na generalidade dos
arquivos este conceito no aplicvel ou apenas o ser se considerarmos que a
comunidade de interesse coincide com a totalidade da populao.
4

29

descoberta e localizao dos objectos digitais, bem como preparar os


mesmos para entrega ao consumidor.
Os pacotes que so entregues ao consumidor assumem a forma de
P a c o t e s d e I n f o r m a o d e D i s s e m i n a o 7 PID [11]. de
realar o facto de os P a c o t e s d e I n f o r m a o d e D i s s e m i n a o
poderem ser diferentes dos P a c o t e s d e I n f o r m a o d e A r q u i v o .
A informao que entregue ao consumidor poder ser apenas um
subconjunto da informao arquivada ou at uma verso transformada da
mesma (ver Migrao/converso na pgina 36).
Por ltimo, o componente A d m i n i s t r a o responsvel pelas
operaes dirias de manuteno e sobretudo pela parametrizao e
monitorizao dos processos desencadeados no interior do repositrio. Este
componente interage com todos os restantes de modo a assegurar o correcto
funcionamento do mesmo [11].

Do ingls Dissemination Information Package (DIP).

30

Estratgias de
preservao digital
Ao longo dos ltimos anos tm vindo a ser propostas inmeras estratgias
no sentido de solucionar o problema da preservao digital. Segundo Lee e
seus colaboradores, estas estratgias podem ser agrupadas em trs classes
fundamentais: emulao, migrao e encapsulamento [2].
Thibodeau, por sua vez, organiza as diferentes estratgias propostas num
mapa bidimensional, posicionando no seu extremo esquerdo as estratgias
centradas na preservao do objecto fsico/lgico8 e no extremo oposto as
estratgias centradas na preservao do objecto conceptual (Fig. 7). No eixo
vertical as diversas estratgias so dispostas mediante o seu grau de
especificidade, isto , se so estratgias apenas aplicveis a uma dada classe de
objectos digitais ou se se tratam de estratgias genricas, passveis de ser
administradas a qualquer classe de objectos digitais [7].

Tambm designada na literatura por p r e s e r v a o d e t e c n o l o g i a .

31

Aplicao
genrica

Refrescamento

Encapsulamento
Maquina Virtual
Universal

Pedra de Rosetta

Normalizao/
Canonizao

Emulao

Aplicao
especfica

Migrao

Preservao de
tecnologia

Preservao do
objecto fsico/lgico

Preservao do
objecto conceptual

Fig. 7 - Classificao das diferentes estratgias de preservao digital.

Preservao de tecnologia
Uma das primeiras estratgias de preservao a ser proposta consiste na
conservao do contexto tecnolgico utilizado originalmente na concepo
dos objectos digitais que se procuram preservar. Esta estratgia consiste,
essencialmente, na conservao e manuteno de todo o hardware e software
necessrios correcta apresentao dos objectos digitais [14-17].
Trata-se sobretudo da criao de museus de tecnologia. Aqui, o foco da
preservao no se concentra no objecto conceptual, mas sim na preservao
do objecto digital na sua forma original. Os impulsionadores desta estratgia
consideram-na a nica forma suficientemente eficaz para assegurar que os
objectos digitais so experimentados de forma fidedigna [2].
Contudo, a histria da computao tem vindo a demonstrar que qualquer
plataforma tecnolgica, mesmo a mais popular, acaba inevitavelmente por se
tornar obsoleta, acabando frequentemente por desaparecer sem deixar
qualquer rasto [17]. Este tipo de estratgias introduz dificuldades ao nvel da
gesto do espao fsico, manuteno e custo de operao, tornando-as

32

inadequadas para aplicao a longo-prazo [2]. Outras desvantagens


assinalveis deste tipo de estratgias tm que ver com o facto de o acesso
informao ficar confinado a apenas alguns locais fsicos do globo e com
condicionalismos acrescidos ao nvel da reutilizao de informao [18].

Refrescamento
Um objecto digital torna-se persistente no momento em que inscrito num
suporte fsico de armazenamento (e.g. disquete, disco rgido, CD-ROM).
Garantir a integridade do suporte fundamental para que a informao nele
armazenada possa ser correctamente interpretada. Se o suporte fsico se
deteriorar ou se se tornar obsoleto a ponto de deixarem de existir perifricos
capazes de extrair a informao nele armazenada, incorremos no srio risco
dessa informao se perder para sempre [17].
O r e f r e s c a m e n t o de suporte consiste na transferncia de informao de
um suporte fsico de armazenamento para outro mais actual antes que o
primeiro se deteriore ou se torne irremediavelmente obsoleto [15, 17, 19, 20].
O refrescamento atempado de suporte no constitui uma estratgia de
preservao por si s. Dever, em vez disso, ser entendido como um prrequisito para o sucesso de qualquer estratgia de preservao [21]. A
frequente verificao da integridade dos suportes fsicos, assim como o seu
refrescamento peridico, so consideradas actividades vitais num contexto de
preservao digital.

Emulao
As estratgias de emulao baseiam-se essencialmente na utilizao de um
software, designado e m u l a d o r , capaz de reproduzir o comportamento de
uma plataforma de hardware e/ou software, numa outra que partida seria
incompatvel [18]. A grande vantagem desta abordagem est na capacidade

33

de preservar, com um elevado grau de fidelidade, as caractersticas e as


funcionalidades do objecto digital original [2].
Tal como acontece em estratgias baseadas na p r e s e r v a o d e
t e c n o l o g i a , as tcnicas de e m u l a o centram-se na preservao do
objecto lgico no seu formato original. No entanto, este tipo de estratgias
no sofre de alguns dos problemas anteriormente enunciados, como por
exemplo, o envelhecimento do hardware.
Existem essencialmente dois tipos de emuladores: emuladores de sistemas
operativos e de hardware. Os primeiros focam-se na reproduo de um
sistema operativo por completo permitindo, deste modo, a execuo de
diversas aplicaes no contexto de um nico emulador (e.g. Wine [22]). Os
segundos visam mimar o comportamento de uma plataforma de hardware,
possibilitando que vrios sistemas operativos e correspondentes aplicaes
possam ser executados no contexto de um nico emulador (e.g. VMware
Workstation [23], Parallels Desktop [24]) [7, 25]. Existem actualmente vrios
exemplos de emuladores de plataformas consideradas obsoletas, e.g. ZX
Spectrum [26], Nintendo NES [27], entre outras.
Rothenberg, um dos principais promotores deste tipo de abordagens,
defende um modelo terico capaz de emular plataformas actuais em
computadores futuros. O modelo consiste na conservao do objecto digital
juntamente com todo o software necessrio sua execuo/apresentao
(incluindo o sistema operativo) e na criao de uma especificao abstracta
da plataforma de hardware que suporta a execuo desse software. Essa
especificao dever ser escrita numa linguagem independente da plataforma
e ser suficientemente rica para que um emulador possa ser construdo
automaticamente num qualquer computador do futuro [18].
Hendley considera que a emulao apenas deveria ser utilizada em contextos
em que a comunidade de interesse valoriza a preservao do ambiente
tecnolgico original ou ainda em situaes em que os objectos digitais no

34

so passveis de ser convertidos para formatos contemporneos [17]. Outros


autores consideram potencialmente arriscado confiar no software original
como forma de preservar objectos digitais, uma vez que este pode ser
portador de vrus ou bugs que podero, no futuro, resultar em perdas
substanciais de informao [7, 28].
importante reconhecer, tambm, que a criao de especificaes capazes
de descrever transversalmente plataformas de hardware no uma tarefa
simples de concretizar. Geralmente, implica recorrer a mo-de-obra
altamente especializada, o que por si s poder constituir um obstculo
considervel para a maioria das organizaes [7, 25, 29]. Para alm disso, a
criao de especificaes imprecisas ou incompletas poder impossibilitar a
construo futura dos respectivos emuladores [30]. tambm importante
salientar que, com o tempo, o prprio emulador ir sofrer de obsolescncia,
havendo ento necessidade de o converter para uma nova plataforma ou
desenvolver um novo emulador capaz de emular o primeiro [7].
O uso de emuladores parte tambm do pressuposto que os utilizadores do
futuro sero capazes de operar adequadamente aplicaes e sistemas
operativos h muito desaparecidos. Por exemplo, num futuro prximo ser
difcil conceber que os utilizadores estejam aptos a enfrentar as
particularidades do sistema operativo MS-DOS [31].
Apesar dos problemas apresentados, as estratgias de emulao continuam a
assumir um papel importante na preservao de objectos digitais.
Determinados tipos de objectos, especialmente aqueles dotados de
caractersticas dinmicas e/ou interactivas, podero exigir o recurso a
emuladores como nica forma de assegurar uma experimentao fidedigna
[32]. As estratgias de emulao so particularmente relevantes em contextos
em que o objecto que se pretende preservar uma aplicao de software, tal
como acontece actualmente com um nmero crescente de jogos de
computador considerados de valor histrico assinalvel.

35

Migrao/converso
A m i g r a o consiste na () transferncia peridica de material digital de
uma dada configurao de hardware/software para uma outra, ou de uma
gerao de tecnologia para outra subsequente [15].
Como referido anteriormente, os objectos digitais so constitudos por
elementos estruturais e elementos de informao. O formato de um objecto
digital constitui a estrutura pela qual estes elementos de informao se
encontram organizados. Neste contexto, a migrao pode ser vista como o
processo responsvel pela reorganizao dos elementos de informao que
constituem um objecto digital [33].
Ao contrrio das estratgias de preservao j apresentadas que procuram
cristalizar o objecto digital no seu formato original, as estratgias baseadas em
migrao centram-se sobretudo na preservao do seu contedo intelectual,
ou seja, na preservao do objecto conceptual [34].
A migrao tem como objectivo manter os objectos digitais compatveis com
tecnologias actuais de modo a que um utilizador comum seja capaz de os
interpretar sem necessidade de recorrer a artefactos menos convencionais,
como por exemplo, emuladores.
No entanto, os processos de migrao introduzem algumas desvantagens que
devemos considerar. Neste tipo de processos existe uma grande
probabilidade de algumas das propriedades que constituem os objectos
digitais no serem correctamente transferidas para o formato de destino
adoptado [29, 35]. Isto deve-se, sobretudo, a incompatibilidades existentes
entre os formatos de origem e destino ou utilizao de conversores
incapazes de realizar as suas tarefas adequadamente [33, 36].
Adicionalmente, no espectvel que uma estratgia de migrao possa
resolver permanentemente os problemas de preservao. O formato de

36

destino encontra-se, tambm este, sob constante ameaa de se tornar


obsoleto o que significa que ser apenas uma questo de tempo at que uma
nova migrao tenha de ser administrada. No obstante, a migrao de
longe a estratgia de preservao mais aplicada at data e a nica que tem
vindo a dar provas da sua eficcia [2].
Existem diversas variantes de migrao que podero ser consideradas:
migrao para suportes analgicos, actualizao de verses, converso para
formatos concorrentes, normalizao, migrao a-pedido e migrao
distribuda.

Migrao para suportes analgicos


A migrao para suportes analgicos consiste na converso de objectos para
suportes no digitais com o intuito de aumentar a sua longevidade [15]. Esta
estratgia consiste, essencialmente, na reproduo de um objecto digital em
papel, microfilme ou qualquer outro suporte analgico de longa durao e
concentrar os esforos de preservao em torno do novo suporte.
Esta estratgia, no entanto, apenas pode ser aplicada a objectos digitais que
possuam uma representao aproximada em suportes analgicos, como por
exemplo, documentos de texto ou imagens. Objectos interactivos e/ou
dinmicos ficam assim automaticamente excludos deste tipo de estratgias.

Actualizao de verses
bastante comum encontrar aplicaes de software capazes de abrir ou
importar objectos digitais produzidos por verses anteriores dessa mesma
aplicao. Essas aplicaes permitem geralmente gravar os objectos
importados no formato mais actual produzido pela mesma. Esta operao
designa-se por a c t u a l i z a o d a v e r s o do formato.

37

A a c t u a l i z a o d e v e r s e s , possivelmente, a estratgia de
preservao mais vulgarmente utilizada pelos generalidade dos utilizadores.
Essencialmente, consiste em actualizar os materiais digitais produzidos por
um determinado software recorrendo a uma verso mais actual do mesmo
[7].

Converso para formatos concorrentes


O processo e actualizao de verses geralmente controlado pela
organizao que desenvolveu a respectiva aplicao de software. A qualidade
da migrao depende, assim, da capacidade dos importadores fornecidos pelo
fabricante e do grau de retrocompatibilidade oferecido pelo novo formato.
Idealmente, o fabricante deveria assegurar que todos os atributos presentes
numa dada verso de um formato se encontram disponveis na nova verso
que o vem substituir. No entanto, independentemente do sucesso econmico
de um fabricante ou produto de software, os formatos esto constantemente
sujeitos a descontinuidade [7]. Uma forma de garantir que os objectos digitais
sobrevivem a este tipo de rupturas tecnolgicas consiste em convert-los
para formatos de uma linha de produtos concorrente.
Existem, no entanto, formatos que no so dependentes de qualquer
aplicao de software. Tal, acontece com grande parte dos formatos de
imagem (e.g. JPEG, TIFF, PNG). Isto possibilita que os objectos sejam
convertidos entre formatos anlogos, independentemente da aplicao
utilizada na sua criao.

Normalizao
A n o r m a l i z a o t em como objectivo simplificar o processo de
preservao atravs da reduo do nmero de formatos distintos que se
encontram no repositrio de objectos digitais [2, 7]. Havendo um nmero
controlado de formatos, uma mesma estratgia de preservao poder ser

38

aplicada transversalmente a um maior nmero de objectos digitais, o que


poder conduzir a uma reduo generalizada dos custos de preservao [37].
Vejamos um exemplo. Existe um leque variado de opes no que diz
respeito a formatos para representao de imagens bidimensionais (e.g. BMP,
GIF, JPEG, PNG, TARGA). Se durante o processo de ingesto, todas as
imagens digitais forem convertidas para um nico formato, futuras
intervenes ao nvel da sua preservao podero ser realizadas de forma
mais simples e, consequentemente, mais econmica.
A escolha do formato de normalizao um factor determinante no sucesso
desta estratgia. Sempre que possvel, devero ser escolhidos formatos
conhecidos pela comunidade de interesse e baseados em normas
internacionais abertas [29]. Isto poder evitar futuras complicaes a nvel de
direitos de autor ou pagamento de royalties [38]. Paralelamente, o formato de
normalizao dever ser suficientemente rico para que as caractersticas
fundamentais dos vrios formatos possam ser devidamente incorporadas.
A normalizao promove, tambm, a interoperabilidade entre sistemas
distintos. Ao serem utilizados formatos abertos e independentes da
plataforma, diferentes configuraes de hardware e software sero capazes de
os interpretar [7, 39].
A normalizao de formatos pode ser implementada de diversas formas.
Determinados repositrios procedem converso automtica dos objectos
recebidos para um formato nico de preservao. Outros, definem polticas
de arquivo que limitam os formatos em que aceitam informao, significando
isto, que cabe aos produtores da informao converter os seus objectos
digitais para os formatos estipulados [40, 41]. O argumento que suporta esta
abordagem assenta no pressuposto de que os produtores de informao
sero as entidades mais indicadas para avaliar a qualidade da converso
efectuada.

39

Migrao a-pedido
O sucesso de uma migrao depende, fundamentalmente, da qualidade dos
conversores utilizados e da capacidade que o formato de destino possui para
acomodar o conjunto de propriedades do formato de partida. Poder-se-
assumir, no entanto, que sempre que efectuada uma migrao, os objectos
digitais resultantes sero de alguma forma diferentes dos objectos de partida.
Ao fim de algumas iteraes, os objectos preservados podero ser
substancialmente diferentes dos objectos originais (Fig. 8). Para combater
este fenmeno de degradao surgiu uma estratgia designada por
m i g r a o a - p e d i d o [42].
Neste tipo de migrao, ao invs de as converses serem aplicadas ao objecto
mais actual, estas so sempre aplicadas ao objecto original (Fig. 9). Deste
modo, se de uma dada converso resultar um objecto substancialmente
diferente do original, numa futura converso, o problema poder ser
resolvido recorrendo a um conversor de melhor qualidade ou a um formato
de destino mais adequado.

Fig. 8 - Degradao do objecto digital ao longo de sucessivas migraes.

Esta abordagem possui como principal vantagem o facto de, uma vez
construdo o mdulo de descodificao do conversor (i.e. o mdulo capaz de
ler as propriedades do formato de origem), apenas ser necessrio desenvolver
os codificadores especficos para cada formato de sada. No obstante, ser
necessrio suportar ao longo do tempo um conjunto alargado de conversores
de modo a garantir a capacidade de transformar os objectos armazenados

40

nos seus formatos originais para formatos que sirvam adequadamente as


necessidades dos seus consumidores.

Fig. 9 - Migrao a-pedido.

Migrao distribuda
Os mais recentes desenvolvimentos no contexto da migrao introduzem
arquitecturas distribudas de conversores (Fig. 10). Neste tipo de migrao,
existe um conjunto de servios de converso que se encontram acessveis
atravs da Internet e que podero ser invocados remotamente recorrendo a
uma pequena aplicao-cliente.
Existem actualmente vrias iniciativas que visam o desenvolvimento deste
tipo de conversores. O Typed Objects Model (TOM) sintetiza um sistema
distribudo de conversores, suportado por uma taxionomia de tipos e
formatos de objectos, que recorre a agentes mediadores para descobrir e
executar converses entre formatos [43].
No Lister Hill National Center for Biomedical Communications foi
desenvolvido um Servio Web9 que converte objectos digitais de cinquenta
formatos distintos para PDF [44]. Hunter e Choudhury do um passo em
frente propondo uma rede de servios de converso suportada por uma
descrio semntica que possibilita a sua descoberta e invocao automtica
por agentes de software [45].

Do ingls Web Service.

41

Na Universidade do Minho est actualmente a ser desenvolvida uma


Arquitectura Orientada ao Servio (SOA) que disponibiliza vrias centenas
de servios de converso, avaliao e recomendao [3, 46-50].

Fig. 10 - Migrao distribuda baseada em Servios Web.

Este tipo de migrao apresenta algumas vantagens face s estratgias de


migrao mais convencionais, nomeadamente:
A utilizao de servios de converso permite esconder as
especificidades de cada conversor e da plataforma que o suporta;
A criao de servios redundantes assegura a fiabilidade do
sistema perante situaes de ruptura parcial;
A existncia de mltiplos caminhos de migrao permite
soluo resistir ao desaparecimento gradual de parte dos
conversores;
Este tipo de abordagem compatvel com uma srie de variantes
de migrao, como por exemplo, n o r m a l i z a o e
migra o a -ped ido;
A criao de uma rede global de conversores poder conduzir a
uma reduo generalizada dos custos de preservao. Qualquer
organizao poder rentabilizar os seus investimentos no

42

desenvolvimento de conversores, publicando-os na rede de


servios e cobrando uma pequena taxa pela sua utilizao.
Apesar das vantagens apresentadas, a migrao distribuda poder no ser
adequada a todos os contextos. Um repositrio de informao digital pode
facilmente conter milhares de itens, atingindo nveis de armazenamento na
ordem dos mltiplos Terabytes. Transferir atravs da Internet um volume de
informao desta natureza acarreta custos que podero ser impeditivos para
muitas organizaes. Para alm disso, requisitos em termos de largura de
banda, segurana dos dados e tempo de transferncia podero ser factores
determinantes no sucesso deste tipo de estratgias.

Encapsulamento
Por vezes, no fcil determinar o valor intrnseco de determinados objectos
digitais. Podero passar-se vrios anos at que a comunidade revele um
interesse particular por uma determinada coleco de objectos [51]. Durante
esse tempo, o material custodiado poder nunca ser consultado. Neste tipo
de cenrios, as estratgias de preservao que carecem de uma diligncia
contnua (e.g. migrao) podero revelar-se demasiado onerosas. As solues
baseadas em encapsulamento procuram resolver esse problema mantendo os
objectos digitais inalterados at ao momento em que se tornam
efectivamente necessrios.
A estratgia de encapsulamento consiste em preservar, juntamente com o
objecto digital, toda a informao necessria e suficiente para permitir o
futuro desenvolvimento de conversores, visualizadores ou emuladores. Esta
informao poder consistir, por exemplo, numa descrio formal e
detalhada do formato do objecto preservado [52].
O Formato Universal de Preservao10 (UPF) uma iniciativa que visa criar
um formato normalizado para agregar metainformao de preservao junto
10

Do ingls Universal Preservation Format.

43

do objecto digital. Este formato ser independente da aplicao, do sistema


operativo e do suporte fsico utilizados para criar e armazenar o objecto
digital [53, 54].
Raymond Lorie prope uma alternativa a esta estratgia substituindo a
especificao formal por uma aplicao de software compilada para uma
m q u i n a v i r t u a l u n i v e r s a l , por exemplo, para a Java Virtual
Machine [55, 56]. Esta aplicao na realidade um descodificador e tem
como finalidade apresentar uma viso lgica do objecto digital, permitindo
deste modo uma navegao simples atravs das suas propriedades. Lorie
argumenta que a mquina virtual universal suficientemente simples para
que possa ser implementada em qualquer arquitectura de hardware futura.

A Pedra de Rosetta digital


O povo egpcio deixou uma infindvel quantidade de vestgios da sua
presena na Terra. No entanto, s a partir do sculo XIX foi possvel decifrar
os seus escritos hieroglficos. Tudo aconteceu em 1799 quando um grupo de
soldados franceses descobriu no delta do Nilo um bloco de granito que ficou
conhecido como a Pedra de Rosetta. Nele encontrava-se escrito em trs
lnguas distintas (egpcio hieroglfico, egpcio cursivo e grego clssico) um
decreto emitido em 196 a.C. por Ptolomeu V Epifnio. Em 1822 o
palegrafo francs Jean-Franois Champollion descodificou a verso egpcia
do texto recorrendo aos seus conhecimentos de grego clssico, um idioma
bem conhecido dos historiadores da poca [57, 58]. Esta descoberta
conduziu descodificao de inmeros outros textos egpcios encontrados
nos mais variados locais e suportes (e.g. monumentos, rochas, papiros).
Heminger e Robertson propem a utilizao de uma estratgia semelhante
para recuperar objectos digitais para os quais no existe informao suficiente
sobre o seu formato [51]. Nesta estratgia, em vez de se preservar as regras
que permitem descodificar o objecto digital, so reunidas amostras de
objectos que sejam representativas do formato que se pretende recuperar.

44

Estas amostras devero existir num formato que possa ser directamente
interpretado pelo ser humano. Trata-se do conjunto de referncia, i.e., a
verso grega do decreto inscrito na Pedra de Rosetta. Com esta informao
seria possvel inferir as regras necessrias para traduzir/converter o objecto
original para um qualquer formato contemporneo [7, 59].
Um exemplo de aplicao desta estratgia consiste em imprimir em papel um
conjunto representativo de documentos de texto juntamente com a sua
representao binria. No futuro, as regras necessrias interpretar e migrar os
objectos para um novo formato poderiam ser inferidas, comparando os
documentos impressos com a sua representao binria [7].
Esta estratgia dever ser considerada apenas em situaes em que todos os
esforos de preservao falharam. Trata-se sobretudo de uma ferramenta de
arqueologia digital e no propriamente de uma estratgia de base para
preservao de objectos digitais [51].

45

Directrios de
formatos
Uma das formas de minimizar a ansiedade de todos os agentes envolvidos
em processos de preservao digital consiste na criao de directrios
centralizados de informao tcnica sobre formatos digitais. Esta informao
inclui, por exemplo, a identificao dos produtores de um dado formato, a
sua data de criao, informao sobre as aplicaes que o suportam,
especificaes tcnicas, grau de obsolescncia, entre outros.
Para alm de disponibilizar este tipo informao, os directrios de formatos
podero prestar servios avanados de apoio preservao digital. Por
exemplo, um directrio de formatos poder disponibilizar ferramentas
capazes de identificar o formato de um dado objecto digital e promover
esquemas normalizados para a sua descrio. Poder ainda fornecer
especificaes tcnicas sobre formatos, permitindo a qualquer instituio
desenvolver descodificadores para os mesmos, bem como disponibilizar um
conjunto de informaes relevantes para apoio a actividades de preservao
digital, como por exemplo, informao sobre a cota de mercado de um dado

46

formato ou produzir recomendaes quanto aos formatos mais apropriados


para preservao a longo-prazo.
Existem actualmente diversas iniciativas que visam a construo de
directrios deste tipo, como por exemplo, o PRONOM [60], Global Digital
Format Registry [61] e o Typed Object Model [43].
O PRONOM11 uma iniciativa dos UK National Archives12 que visa a
concentrao de uma grande quantidade de informao sobre produtos de
software e seus formatos associados [60, 62]. O PRONOM disponibiliza
ainda uma ferramenta que facilita a identificao de formatos (Droid [63]) e
promove a utilizao de identificadores nicos para os mesmos.
O Global Digital Format Registry13 (GDFR) apresenta-se como uma
alternativa aos actuais MIME Media Types14 introduzindo um mecanismo de
identificao de formatos mais preciso e rigoroso. O GDFR possui ainda
como objectivo a reunio de informao sobre da sintaxe e semntica dos
diversos formatos digitais existentes. A sua criao est a cargo de um grupo
de trabalho internacional constitudo por membros de diversas bibliotecas e
arquivos nacionais, assim como bibliotecas acadmicas, num total de 18
instituies [61].

11

http://www.nationalarchives.gov.uk/PRONOM/
Arquivos Nacionais do Reino Unido.
13 http://hul.harvard.edu/gdfr/
14 Actualmente, o sistema de identificao de formatos mais utilizado o MIME
Media Types. Este sistema amplamente utilizado na Internet, nomeadamente, para
especificar as regras de codificao/descodificao de documentos anexados a
mensagens de correio electrnico e para identificar os formatos de dados trocados
durante as transferncias entre browsers e servidores Web. Este sistema, no entanto,
no possui a granularidade necessria para identificar de forma unvoca todos os
formatos existentes. Por exemplo, todas as verses da famlia PDF da verso 1.0
1.4, PDF/X da verso 1 3, e PDF/A so identificadas pelo mesmo descritor:
application/pdf.
12

47

O projecto Typed Object Model15 (TOM) assenta no pressuposto de que


todos os formatos digitais podem ser vistos como objectos (i.e. possuem
propriedades e mtodos) e, como tal, ser possvel construir uma arquitectura
baseada em herana, capaz de descrever a estrutura de cada formato de
dados, as suas instncias e as relaes existentes entre os mesmos [43]. Este
projecto introduz uma taxionomia classificativa de formatos e um sistema
distribudo de conversores baseado em agentes mediadores. No entanto, no
se antev que se possa vir a tornar numa norma de facto, pois a sua
implementao bastante residual.

15

http://tom.library.upenn.edu/

48

Autenticidade
O conceito de autenticidade est longe de ser consensual entre os
profissionais da preservao. Este poder assumir significados
consideravelmente diferentes consoante a comunidade que o manipula. Para
um historiador um objecto autntico se a sua identidade e integridade no
foram comprometidas, i.e., se for possvel aferir que um objecto realmente
aquilo que se prope ser [64]. Esta definio pressupe que o seu contedo
verdadeiro e que o seu contexto histrico se encontra devidamente
identificado. Em suma, um objecto autntico se estiver conforme o original
e se a sua histria custodial tiver sido devidamente documentada ao longo do
tempo.
Do ponto de vista de um arquivista, a autenticidade de um documento no
pressupe uma legitimao da sua veracidade ou at mesmo utilidade. Um
arquivista preocupa-se, sobretudo, com a prova que um documento poder
constituir. Este poder conter incorreces, erros ou at falsidades, mas isso
no invalida a sua importncia como testemunho de que algo aconteceu [65].
Um documento falsificado, por exemplo, pode ser considerado autntico
uma vez que constitui prova de que algum falsificou um documento [66].

49

Definies mais abrangentes de autenticidade giram em torno dos conceitos


de autenticao, integridade, completude, veracidade, validade, conformidade
com o original, significncia e adequabilidade ao fim a que se destina [67].
Em termos genricos, o conceito de a u t e n t i c i d a d e traduz a capacidade
de identificar os elementos diplomticos que permitem aferir se um dado
objecto autntico. Trata-se da identificao do porqu, do quando, do
onde e do por quem de um objecto digital [10]. A autenticidade tem que
ver com a capacidade de se conseguir demonstrar que um objecto digital
aquilo que se prope ser [37, 68-72]. Para atingir esse objectivo
fundamental documentar devidamente a provenincia do objecto,
contextualizar a sua existncia, descrever a sua histria custodial e atestar que
a sua integridade no foi comprometida, i.e. provar que existe um conjunto
de propriedades, consideradas significativas, que foram correctamente
preservadas ao longo do tempo [68, 73].
Os problemas associados determinao da autenticidade de um recurso no
esto limitados documentao digital. Na idade mdia, por exemplo, a
reproduo de livros era realizada manualmente. Cada cpia de um livro
apresentava, geralmente, um conjunto de diferenas face ao original. A maior
parte dessas diferenas resultavam de infelizes erros de transcrio. No
entanto, no seriam raras as vezes em que escrives mais perspicazes
introduziam deliberadamente melhorias durante o processo de transcrio
do documento [74].
No contexto digital, os problemas relacionados com a autenticidade so em
tudo semelhantes aos do mundo analgico. Contudo, a simplicidade com que
alteraes podem ser introduzidas, a rapidez com que estas podem ser
disseminadas e a dificuldade inerente sua deteco tornam o problema
sensivelmente mais complexo.
No contexto analgico, o contedo e o suporte so geralmente duas
entidades inseparveis. As propriedades fsicas que caracterizam o suporte

50

fornecem, geralmente, pistas suficientes para que a autenticidade do seu


contedo possa ser aferida [66]. No mundo digital este tipo de pistas no
existe. O ambiente tecnolgico propcio introduo de modificaes
provocando um clima generalizado de desconfiana em relao
autenticidade deste tipo de material [69, 71, 74, 75].
A preservao de informao no domnio analgico manifesta-se, sobretudo,
pela tentativa de conservar o suporte inalterado durante o mximo de tempo
possvel. No contexto digital, a preservao do suporte ou da sequncia de
bits que constitui o objecto, no condio suficiente para garantir que a
informao permanece acessvel, reutilizvel e autntica ao longo do tempo
[76]. Preservar informao digital consiste, por vezes, em modificar ou
transformar deliberadamente o objecto fsico ou lgico que transporta a
mensagem (ver Migrao/converso). Para que essa transformao no
produza uma mensagem exageradamente degradada, fundamental definir
quais as propriedades da mensagem que devero ser asseguradas durante o
processo de transformao.
Paralelamente, a informao no um conceito ou substncia concreta. Esta
materializa-se atravs de um processo de transformao que eleva um
conjunto de smbolos a algo com significado [77]. Para alm disso, a
interpretao desse significante est sujeita a influncias adicionais. O
hardware e o software que servem de mediadores nesse processo podem
diferir substancialmente de consumidor para consumidor [73]. Neste
contexto, a definio de e s s n c i a 16 de um objecto digital de extrema
importncia, pois caracteriza o conjunto de propriedades que devero ser
mantidas e preservadas de forma intacta para que o objecto possa ser
considerado autntico [66].

16

Propried ades significat ivas e essncia d e um objecto


d i g i t a l so duas expresses vulgarmente utilizadas para representar o mesmo
conceito.

51

O conjunto das propriedades significativas no absoluto nem esttico. A


sua definio dever ter em conta a natureza da organizao responsvel pela
preservao, as caractersticas da coleco e, acima de tudo, os requisitos e
exigncias da comunidade de interesse [66, 78]. a definio da e s s n c i a
de um objecto digital que dever determinar a forma como o material deve
ser preservado [76].
A definio das propriedades significativas de um objecto digital influencia
directamente a forma como este dever ser preservado. Quanto maior for o
nmero de propriedades significativas, maiores sero os requisitos
relativamente infra-estrutura tecnolgica necessria para suportar a
preservao [79].
Embora desejvel, a definio de um conjunto de propriedades significativas
para cada objecto digital existente num arquivo no economicamente
vivel. Torna-se, assim, necessria a criao de polticas de preservao que
exprimam, para cada classe de objectos digitais, o conjunto das propriedades
significativas que sero asseguradas pelo repositrio [79].
A ttulo de exemplo, considere-se uma biblioteca responsvel por preservar
artigos cientficos (o repositrio institucional de uma universidade, por
exemplo). Se a sua poltica de preservao apenas especificar a propriedade
significativa: preservao do c o n t e d o t e x t u a l d o s a r t i g o s
c i e n t f i c o s ; ento, estes estaro a ser adequadamente preservados se
apenas os caracteres ASCII17 que os constituem forem conservados. Se por
outro lado a poltica de preservao especificar propriedades significativas
adicionais como a d i s p o s i o d o t e x t o n a p g i n a ou a sua
f o r m a t a o , ento a preservao dos caracteres ASCII deixa de ser

17

American Standard Code for Information Interchange. Trata-se de um conjunto de


cdigos capaz de representar letras, dgitos e outros smbolos, amplamente
utilizado por computadores para troca de informao textual.

52

suficiente, passando a ser necessrio recorrer a formatos mais complexos,


como por exemplo o PDF.
Ainda neste contexto surge o conceito de c a n o n i z a o . Lynch apresentao como uma forma de avaliar o sucesso de uma migrao [80]. O formato
cannico tem como objectivo representar de forma unvoca as
c a r a c t e r s t i c a s e s s e n c i a i s de uma classe de objectos digitais. O
formato cannico especifica a ordem e a estrutura das propriedades que
constituem os objectos digitais e assume valores por omisso para as
propriedades sem valor. O mtodo funciona comparando os objectos
cannicos obtidos a partir dos objectos original e convertido (Fig. 11).

Fig. 11 - Verificao da qualidade de uma migrao atravs de canonizao.

Considere-se dois objectos digitais: o original e o convertido. Poder-se-


afirmar que o objecto convertido preserva as caractersticas essenciais do
objecto original, se os objectos cannicos obtidos a partir de ambos forem
em tudo semelhantes [80].

53

Metainformao de
preservao
A m e t a i n f o r m a o d e p r e s e r v a o tem como objectivo descrever
e documentar os processos e actividades relacionadas com a preservao de
materiais digitais. Ou seja, a metainformao de preservao responsvel
por reunir, junto do material custodiado, informao detalhada sobre a sua
provenincia, autenticidade, actividades de preservao, ambiente tecnolgico
e condicionantes legais [68].
No que diz respeito p r o v e n i n c i a , a metainformao de preservao
procura descrever a histria custodial dos materiais, i.e. o caminho percorrido
por estes materiais desde a sua criao at sua incorporao no repositrio
[68]. Esta assume tambm a responsabilidade de garantir a
a u t e n t i c i d a d e dos materiais. Para tal, agrega um conjunto de
metainformao que descreve detalhadamente todo o tipo de actividades
desenvolvidas no interior do repositrio [68].

54

A metainformao de preservao tem tambm como objectivo descrever o


a m b i e n t e t e c n o l g i c o (i.e. hardware, sistemas operativos e software
que sustenta a correcta apresentao dos objectos), bem como incluir
informao sobre todas as contingncias legais que afectam o material
custodiado [68].
O modelo de referncia OAIS constituiu um ponto de partida para a
discusso em torno da necessidade de criar um conjunto de elementos de
metainformao capazes de dar suporte s actividades relacionadas com a
preservao digital [12, 68]. Desde ento, diversas instituies tm vindo a
propor dicionrios de metainformao que reflectem as necessidades
individuais dos projectos em que esto ou estiveram envolvidas [81-83].
Em 2002, o consrcio Online Computer Library Center e Research Libraries
Group (OCLC/RLG) consolidou este conhecimento acumulado num nico
documento onde se enumeram as diversas classes de informao que
devero estar presentes num esquema de metainformao de preservao
[84].
A OCLC/RLG constituiu um segundo grupo de trabalho designado
PREMIS (PREservation Metadata: Implementation Strategies) com o
objectivo de continuar o desenvolvimento deste esquema de
metainformao. O grupo de trabalho foi constitudo por um comit
internacional com mais de trinta especialistas em preservao digital. Deste
trabalho resultou o Dicionrio de Dados PREMIS18, um documento que
identifica e descreve um conjunto bsico de elementos de metainformao de
suporte preservao digital, bem como um conjunto de recomendaes
quanto forma como estes devero ser utilizados no contexto de um arquivo
digital [85].

18

Do ingls PREMIS Data Dictionary.

55

O Dicionrio de Dados PREMIS descreve cinco entidades fundamentais:


Entidades Intelectuais, Agentes, Eventos, Objectos e Direitos19 (Fig. 12).
Uma E n t i d a d e I n t e l e c t u a l um conjunto coerente de informao
que pode ser identificado e descrito como uma unidade. Um livro, uma
fotografia ou uma base de dados so exemplos do que podemos considerar
Entidades Intelectuais.
Uma Entidade Intelectual pode conter outras Entidades Intelectuais no seu
interior. Um stio Web pode ser constitudo por vrias pginas Web e cada
uma destas pode conter diversas fotografias. tambm importante realar
que uma Entidade Intelectual pode assumir mais do que uma representao.
Uma fotografia, por exemplo, pode existir em formato digital, impressa em
papel fotogrfico ou estampada numa T-shirt. A Entidade Intelectual20 que a
descreve sempre a mesma, apesar da sua manifestao fsica variar
substancialmente.

Entidades
Intelectuais

Direitos

Objectos

Agentes

Eventos

Fig. 12 - Entidades do Dicionrio de Dados PREMIS.

19
20

Do ingls Intellectual Entities, Agents, Events, Objects e Rights.


De notar o paralelismo entre o conceito de Entidade Intelectual e Objecto
Conceptual.

56

A entidade A g e n t e descreve qualquer pessoa, organizao ou aplicao de


software que esteja envolvida num Evento de preservao. Por sua vez, um
E v e n t o agrega informao sobre as aces de preservao realizadas em
torno de um O b j e c t o (e.g. verificao de integridade, migrao, etc.). O
registo das aces de preservao, especialmente aquelas que tm como
objectivo modificar o objecto digital, considerado uma actividade
fundamental para assegurar a autenticidade do mesmo.
A entidade O b j e c t o responsvel por descrever o conjunto das
representaes ou manifestaes fsicas de uma Entidade Intelectual. Um
livro, por exemplo, poder ser representado de diversas formas: atravs de
um conjunto de imagens TIFF, em PDF, etc. Um Objecto pode ainda ser
dividido de trs subtipos: Representao, Ficheiro ou Sequncia de bits21.
Uma R e p r e s e n t a o um conjunto de ficheiros com metainformao
estrutural associada que permite que um dado objecto intelectual possa ser
consumido recorrendo a software apropriado. Um F i c h e i r o trata-se de
um conjunto ordenado de bytes reconhecido por um sistema operativo. Um
ficheiro pode ter propriedades associadas tais como: tamanho, data de
criao/modificao, permisses de acesso, etc. Por ltimo, uma
S e q u n c i a d e b i t s um conjunto de dados coeso e com particular
interesse de preservao que pode ser identificado e extrado a partir de um
ficheiro, e.g. a faixa de udio de um ficheiro de vdeo.
A entidade D i r e i t o s rene informao sobre os direitos de propriedade
intelectual e permisses associadas ao objecto digital.

21

Do ingls Representation, File e Bitstream.

57

Avaliao de estratgias
de preservao
Apesar do nmero de estratgias de preservao no parar de aumentar,
nenhuma destas foi at ao momento seriamente validada ou universalmente
aceite [86]. A preferncia por uma alternativa de preservao exige,
geralmente, a ponderao de diversos factores, como por exemplo: as
caractersticas da coleco, a satisfao da comunidade de interesse ou os
custos associados ao processo de preservao [86].
Rauch e Rauber desenvolveram um mtodo capaz de comparar e seleccionar
alternativas de preservao tendo em conta as necessidades individuais de
cada organizao ou utilizador [86, 87]. O seu trabalho baseado em
conceitos de A n l i s e d e U t i l i d a d e [88], um mtodo originalmente
desenvolvido para o auxlio tomada de deciso em projectos complexos no
domnio da construo civil e economia.

58

Fig. 13 - Exemplo de uma rvore-objectivo ponderada.

O mtodo segue um processo composto pelas seguintes etapas:


1.

Inicialmente construda uma rvore-objectivo, i.e. um conjunto de


critrios organizados de forma hierrquica que serviro para aferir o
grau de adequabilidade de uma dada estratgia de preservao (Fig.
13);

2.

Numa segunda fase so associadas unidades de medida a cada um


desses critrios, e.g. milmetro, segundo, Mb/s, EURO;

3.

A terceira fase consiste na seleco de um conjunto de alternativas


que podero ser utilizadas para preservar a coleco de objectos em
causa. Estas alternativas sero comparadas e ordenadas de acordo
com as necessidades especficas da organizao;

4.

No quarto passo, cada uma das alternativas executada face a um


conjunto representativo de objectos digitais. O resultado de cada

59

interveno ser ento avaliado luz de cada um dos critrios que


constam da rvore-objectivo (Fig. 14 1);
5.

No quinto passo, os resultados das avaliaes so normalizados, i.e.


transformados em unidades numricas comparveis (Fig. 14 2);

6.

No sexto, so atribudas ponderaes percentuais a cada um dos


critrios que constituem a rvore-objectivo. Os pesos atribudos
representam os requisitos ou preferncias de preservao da
organizao e iro determinar a estratgia a adoptar (Fig. 14 3);

7.

O passo sete consiste na agregao de valores parciais e totais


obtidos a partir das experincias (Fig. 14 4);

8.

Finalmente, todas as alternativas so ordenadas mediante o seu grau


de adequao face aos requisitos manifestados pela organizao.

Fig. 14 - Processo de seleco de estratgias de preservao. E1 e


E2 representam duas estratgias de preservao distintas.

60

importante realar que a construo da rvore-objectivo por si s uma


tarefa complexa e morosa, geralmente envolvendo profissionais da rea
tecnolgica, arquivstica, produtores de informao e respectivos
consumidores.
Rauch e Rauber tm promovido a construo de rvores-objectivo para
diversas classes de objectos digitais atravs da realizao de workshops no seio
de organizaes detentoras de informao digital. Durante esses workshops,
um conjunto de pessoas convidado a sugerir critrios de avaliao que
consideram importantes no sentido de garantir a preservao de um conjunto
concreto de objectos digitais. Estes critrios so ento organizados em
classes e subclasses de forma constituir uma rvore-objectivo semelhante
apresentada na Fig. 13.
A rvore-objectivo da Fig. 13 rene um conjunto de critrios para a avaliao
de estratgias de preservao aplicadas a documentos de texto. Nela
podemos encontrar critrios relativos ao processo de preservao (e.g.
disponibilidade, estabilidade, dbito, custo, etc.), aos formatos envolvidos na
preservao (e.g. cota ou taxa de penetrao no mercado, nvel de suporte, se
se trata de um formato normalizado, etc.) e critrios relativos aos objectos
propriamente ditos (e.g. contedo textual, dimenses da pgina, n de
pginas, etc). O ltimo conjunto de critrios pode ser entendido como o
conjunto das propriedades significativas relevantes para esta classe de
objectos digitais, i.e. documentos de texto.
Este mtodo de avaliao pode vir a ser utilizado para construir sistemas
automticos de recomendao que possibilitem a pequenas organizaes
identificar e implementar estratgias de preservao adequadas conservao
dos objectos digitais [47, 48, 50].

61

Sntese e concluso
Este livro tem como objectivo descrever e contextualizar as principais
actividades que tm vindo a ser realizadas internacionalmente no domnio da
preservao digital. O livro comea por definir p r e s e r v a o d i g i t a l e
introduzir o conceito de o b j e c t o d i g i t a l . Este apresentado numa
perspectiva semitica, sendo feita uma anlise dos diferentes nveis de
abstraco a que pode ser observado: fsico, lgico e conceptual. Esta viso
multidimensional do objecto digital promove uma melhor compreenso e
enquadramento das diferentes estratgias de preservao apresentadas ao
longo desta publicao.
De seguida foi apresentado o modelo de referncia OAIS (Open Archival
Information System), uma norma internacional que visa a identificao dos
principais componentes funcionais e objectos de informao presentes num
sistema de arquivo com pretenses de preservao a longo-prazo. O modelo
de referncia serviu fundamentalmente para introduzir alguma da notao
utilizada ao longo do livro.

62

Foram tambm descritas e contextualizadas as principais estratgias de


preservao que tm vindo a ser propostas pela comunidade cientfica, bem
como as mais relevantes iniciativas no que toca a directrios de formatos.
O livro engloba ainda uma breve discusso sobre a u t e n t i c i d a d e ,
salientando-se a importncia do conceito de p r o p r i e d a d e
s i g n i f i c a t i v a na elaborao de polticas de preservao. Paralelamente,
procurar-se- realar a necessidade da utilizao de metainformao como
meio para assegurar a autenticidade dos materiais custodiados, dando especial
nfase ao Dicionrio de Dados PREMIS.
Finalmente, foi apresentado um mtodo que permite avaliar e comparar
diferentes estratgias de preservao, ordenando-as de acordo com o seu
grau de adequao aos requisitos individuais da instituio que pretende
realizar a preservao digital.
fundamental realar que existem muitos outros aspectos da preservao
que no foram descritos nem to pouco mencionados ao longo desta
publicao. Questes como a definio de polticas de preservao, modelos
de financiamento, normas de metainformao (descritiva, tcnica, estrutural,
administrativa, etc.), requisitos para a certificao de repositrios digitais,
ferramentas de preservao, disposies legais e projectos relevantes a nvel
nacional e internacional ficaram de fora desta edio. No obstante, a
informao presente neste livro suficiente para que o leitor seja capaz de
identificar e compreender os principais conceitos associados a esta temtica,
bem como divisar estratgias adequadas preservao de classes distintas de
objectos digitais.
Para alm do disposto, o leitor dever compreender que, apesar do nmero
elevado de alternativas de preservao digital apresentadas, continuam a no
existir provas conclusivas quanto eficcia de cada uma delas. Para muitas,
s o tempo o dir. Mesmo assim, tem-se assistido a uma batalha ideolgica
entre aqueles que defendem estratgias baseadas em migrao e os que

63

defendem a utilizao de estratgias de emulao. Esta discusso tem na sua


origem, questes relacionadas com a autenticidade e integridade dos
materiais.
Nas estratgias derivadas da migrao, assume-se que os objectos digitais iro
sofrer modificaes ao longo do tempo. Determinadas migraes podero
mesmo originar perdas substanciais de informao. Para os defensores da
emulao, assumir de antemo que a informao que se procura preservar
ser sistematicamente adulterada ao longo do tempo viola os pressupostos
mais elementares da preservao [18].
Esta questo, no entanto, no est confinada ao domnio digital. Na
arquivstica tradicional, h quem defenda que a preservao do material no
seu estado original dever ser considerada como a nica medida de sucesso.
H, no entanto, quem opte por transferir os seus materiais para suportes
menos volumosos, como por exemplo o microfilme, tomando uma deciso
explcita pela poupana de espao em detrimento da originalidade [89]. O
material digital, no entanto, possui caractersticas que fazem com que estas
questes acabem por ser de certa forma amplificadas. O material digital
estruturalmente mais complexo que o seu equivalente analgico. Diferentes
tipos de informao podem ser combinados num nico objecto (e.g. texto,
vdeo, som) e este, pode ainda, exibir capacidades dinmicas e/ou
interactivas. Para alm disso, este pode facilmente ser modificado,
desconstrudo e recombinado de formas inovadoras usando software
adequado [89].
Apesar de tudo, a preocupao obstinada pela originalidade tem vindo a
diminuir medida que aumenta a compreenso generalizada acerca dos
processos de preservao. Comea-se a difundir a ideia de que o foco da
preservao no dever estar na reteno do objecto fsico original, mas na
conservao da experincia sensorial que produzida por esse objecto [29].

64

Neste contexto, Burkel questiona-se sobre o papel da tecnologia no processo


de interpretao de informao digital () as entradas e sadas de
qualquer sistema digital so na forma de linguagens humanas. A tecnologia e
as suas linguagens prprias apenas asseguram um processamento mais
eficiente dessa informao no interior do computador [90].
Reforando esta ideia, Thibodeau argumenta que no futuro, tal como hoje,
os consumidores desejaro servir-se das tecnologias mais modernas ou
daquelas que melhor conhecem para manipular mais eficientemente a
informao com que trabalham. A opo por uma estratgia de emulao
poder conduzir ao incumprimento desta necessidade bsica [7, 89].
A batalha ideolgica m i g r a o v e r s u s e m u l a o tem, assim,
tendncia a esgotar-se. Instala-se o reconhecimento generalizado de que
diferentes estratgias preservao devero ser implementadas mediante o
contexto especfico da organizao preservadora e o tipo de objectos que se
pretendem preservar [91]. A seleco de estratgias de preservao deve ter
em conta diversos factores como as caractersticas intrnsecas dos objectos, o
custo de implementao e manuteno, os interesses do arquivo e da sua
comunidade de interesse, entre outros. Para diversos autores este ltimo
ponto de extrema importncia. A informao ter pouca utilidade se no
for preservada e disseminada de acordo com as necessidades da sua
comunidade de interesse [40, 89, 92].
A tendncia actual vai no sentido de combinar um conjunto de tcnicas
como o refrescamento automtico do suporte, a normalizao para formatos
de preservao durante o processo de ingesto, a conservao do objecto
original (como salvaguarda e para fins arqueolgicos) e migrao a-pedido
para adaptar os formatos de preservao (i.e. os Pacotes de Informao de
Arquivo) a formatos mais adequados sua disseminao (i.e. Pacotes de
Informao de Disseminao) [7]. Os objectos digitais predominantemente
dinmicos ou interactivos so geralmente preservados nos seus formatos
originais e so utilizadas estratgias de emulao para a sua interpretao [41].

65

Apesar do recente aparecimento de ferramentas de software que auxiliam o


processo de arquivo e preservao (e.g. OCLC Digital Archive22, DSpace23,
LOCKSS24, Fedora25, Eprints26, PANDAS27, Digital Information Archiving
System28 da IBM, JHove29, Droid30, Xena31) ainda se verifica uma escassez
assinalvel de produtos comerciais com capacidades de preservao [41]. Isto
faz com que cada organizao se sinta de certa forma responsvel pelo
desenvolvimento e implementao do seu prprio sistema de preservao,
bem como pela definio de polticas de preservao adequadas.
A definio de uma poltica de preservao envolve, geralmente, todas as
facetas de um arquivo. Implica a criao de polticas de avaliao e seleco
de materiais, a identificao de esquemas de metainformao apropriados
(e.g. metainformao descritiva, tcnica, de disseminao, estrutural e de
preservao), a definio de estratgias de preservao adequadas a cada
classe de objectos digitais, a criao de planos de sucesso para a
eventualidade da organizao detentora da informao interromper a sua
actividade, a utilizao de modelos sustentveis de financiamento, entre
outros.
Uma poltica de preservao dever descrever claramente as estratgias
adoptadas para assegurar a preservao dos materiais a cada um dos nveis de
abstraco a que estes podem ser considerados, i.e. fsico, lgico e
conceptual, mas tambm a nveis superiores, como o social, o econmico e o
organizacional. A tabela que se segue enumera possveis estratgias que

22

http://www.oclc.org/digitalarchive/
http://www.dspace.org
24 http://www.lockss.org
25 http://www.fedora.info
26 http://www.eprints.org/software/
27 http://pandora.nla.gov.au/pandas.html
28 http://www-5.ibm.com/nl/dias/
29 http://hul.harvard.edu/jhove/
30 http://www.nationalarchives.gov.uk/aboutapps/pronom/droid.htm
31 http://sourceforge.net/projects/xena
23

66

podero ser utilizadas para preservar cada um destes nveis de abstraco


(Tabela 1).
Nvel de abstraco
Fsico
Lgico
Conceptual

Social

Econmico

Organizacional

Estratgias a aplicar
Acondicionamento adequado dos suportes fsicos, utilizao
de suportes de longa durao, salas de preveno contra
desastres naturais, etc.
Refrescamento, backup, replicao local e/ou remota, etc.
Migrao, Emulao, Encapsulamento, etc.
O sistema de preservao dever ser capaz de impedir ou de
corrigir a ocorrncia de erros provocados por operadores ou
atacantes externos, e.g. implementao de mecanismos de
undo, registo de actividades, autenticao e gesto de
permisses, etc.
Definio de modelos de financiamento sustentveis. As
despesas com a preservao devero fazer parte dos
oramentos de base das organizaes.
Definio de planos de sucesso que garantam a sobrevivncia
dos materiais face eventual de cessao de actividade por
parte da organizao detentora.

Tabela 1 Possveis estratgias de preservao para cada nvel de abstraco.

No obstante, para alm da definio de uma poltica de preservao e do


estabelecimento de estratgias de preservao adequadas, fundamental
adoptar um sistema de arquivo digital, i.e. um repositrio capaz de albergar
os objectos, bem como facilitar a implementao dessas polticas e
respectivas estratgias de preservao.
At data, nenhum dos principais repositrios digitais (e.g. DSpace, Fedora,
Eprints) facilitam a implementao de polticas de preservao de forma
transversal, nem to pouco suportam esquemas de metainformao de
preservao, to essenciais para garantir a autenticidade dos materiais. No
entanto, oferecem j a capacidade de armazenar, organizar, descrever e
disseminar esses materiais. Ser portanto espectvel que a curto prazo estas
plataformas passem a incorporar funcionalidades de preservao digital que
permitam preservar plenamente e a longo-prazo os materiais digitais
armazenados.

67

Glossrio
Arquitectura Orientada ao Servio. Arquitectura de software onde vrios
agentes disponibilizam recursos aos restantes participantes da rede sob a
forma de servios independentes, invocveis de forma normalizada (ver
Servio Web).
Arquivo. Organizao responsvel por garantir o acesso continuado
informao custodiada.
ASCII. American Standard Code for Information Interchange. Conjunto de
cdigos capaz de representar letras, dgitos e outros smbolos, amplamente
utilizado por computadores para troca de informao textual.
Autenticao. Processo responsvel por assegurar que um utilizador,
servio ou recurso exactamente aquilo que se prope ser.
CD-ROM. Compact Disc Read-Only Memory. Suporte fsico de
armazenamento baseado em tecnologia ptica.

68

Comunidade de interesse. Conjunto identificvel de consumidores de


informao de um repositrio.
Converso. Ver Migrao.
Digitalizao. Processo responsvel pela transformao de informao
analgica para formato digital.
Disco rgido. Suporte de armazenamento de informao digital baseado em
tecnologia magntica.
DVD. Digital Versatile Disk. Suporte fsico de armazenamento baseado em
tecnologia ptica. Fisionomicamente semelhante a um CD-ROM mas com
uma capacidade de armazenamento vrias vezes superior.
Emulador. Software capaz de reproduzir o comportamento de uma
plataforma de hardware e/ou software numa outra que partida seria
incompatvel.
Encapsulamento. Preservar, juntamente com o objecto digital, a
informao necessria e suficiente para permitir o futuro desenvolvimento de
conversores, visualizadores ou emuladores. Esta informao poder consistir,
por exemplo, numa descrio formal e detalhada do formato do objecto
preservado.
Estratgia de preservao digital. Abordagem tcnica que garante o
acesso continuado informao existente em formatos digitais (ver
Migrao, Emulador ou Encapsulamento).
Flash-drive. Dispositivo que combina uma memria flash com uma
interface USB, vulgarmente utilizado para armazenar informao digital.

69

GIF. Graphics Interchange Format. Formato matricial para representao de


imagens digitais.
Ingesto. Processo ou componente responsvel pela recepo de material
de arquivo.
Internet. Rede global de comunicao baseada em protocolos TCP/IP.
Java. Linguagem de programao orientada a objectos desenvolvida na
dcada de 90. Contrariamente s linguagens de programao convencionais,
que so compiladas para cdigo nativo, a linguagem Java compilada para
bytecode que executado por uma mquina virtual.
JPEG. Joint Photographic Experts Group. Formato matricial para
representao de imagens digitais.
Material digital. Conjunto de informao ou objectos digitais.
Metadados. Ver Metainformao.
Metainformao. Informao utilizada para descrever um determinado
objecto ou recurso.
Migrao. Transferncia peridica de material digital de uma configurao
de hardware/software para outra, ou de uma gerao de tecnologia para
outra subsequente.
Objecto digital. Todo e qualquer objecto de informao que possa ser
representado atravs de uma sequncia de dgitos binrios (bitstream).
Documentos de texto, fotografias digitais, diagramas vectoriais, bases de
dados, sequncias de vdeo e udio, modelos de realidade virtual, pginas Web
e jogos ou aplicaes de software so apenas alguns exemplos do que pode
ser considerado um objecto digital.

70

Objecto nado-digital. Objecto criado recorrendo apenas a ferramentas ou


processos digitais.
PDF. Portable Document Format. Formato digital vulgarmente utilizado
para representar documentos de texto estruturado, i.e., documentos com
tabelas, formatao, imagens, etc.
PNG. Portable Network Graphics. Formato matricial para representar
imagens digitais.
Preservao digital. Conjunto de actividades ou processos responsveis por
garantir o acesso continuado e a longo-prazo informao e restante
patrimnio cultural existente em formatos digitais.
Propriedade significativa. Caracterstica tcnica ou atributo que
caracteriza um objecto digital, considerada relevante para efeitos de
preservao.
Refrescamento. Processo que consiste na cpia de informao de um
suporte fsico de armazenamento para outro do mesmo tipo.
Repositrio digital. Sistema de informao responsvel por gerir e
armazenar material digital.
Service Oriented Architecture (SOA). Ver Arquitectura Orientada ao
Servio.
Servio Web. Forma de partilhar informao onde so utilizados protocolos
de ligao e formatos de mensagens normalizados baseados em XML
(SOAP). De modo a facilitar a descoberta de servios, estes so geralmente
publicados em directrios, vulgarmente designados por UDDI (Universal
Description, Discovery and Integration).

71

TARGA. Truevision TGA. Formato matricial utilizado para representar


imagens digitais.
TIFF. Tagged Image File Format. Formato matricial vulgarmente utilizado
para representar imagens digitais.
Web service. Ver Servio Web.

72

73

Referncias
[1]

A. Proena and S. Lopes, "Digital Preservation," Departamento de


Informtica da Universidade da Beira Interior, Covilh,
Monography, 2004.

[2]

K.-H. Lee, O. Slattery, R. Lu, X. Tang and V. McCrary, "The State


of the Art and Practice in Digital Preservation," Journal of Research of
the National Institute of Standards and Technology, vol. 107, no. 1, pp. 93106, 2002.

[3]

M. Ferreira, A. A. Baptista and J. C. Ramalho, "Avaliao


Automtica de Migrao em Redes Distribudas de Conversores,"
presented at Conferncia da Associao Portuguesa de Sistemas de
Informao (CAPSI), Bragana, Portugal, 2005.

[4]

Wikipedia contributors, "Betamax," in Wikipedia, The Free


Encyclopedia, 2006. [Online]. Available:
http://en.wikipedia.org/w/index.php?title=Betamax&oldid=60719
745.

[5]

A. R. Kenney, N. Y. McGovern, R. Entlich, W. R. Kehoe and E.


Olsen, "Digital Preservation Management," 2003. [Online].
Available: http://www.library.cornell.edu/iris/tutorial/dpm/.

74

[6]

C. Webb, "Guidelines for the Preservation of Digital Heritage,"


United Nations Educational Scientific and Cultural Organization Information Society Division, 2003.

[7]

K. Thibodeau, "Overview of Technological Approaches to Digital


Preservation and Challenges in Coming Years," presented at The
State of Digital Preservation: An International Perspective,
Washington D.C., 2002.

[8]

E. Oltmans, R. J. v. Diessen and H. v. Wijngaarden, "Preservation


Functionality in a Digital Archive," presented at Joint ACM/IEEE
Conference on Digital Libraries (JCDL'04), 2004.

[9]

T. v. d. Werf, "Our digital heritage: how authentic should it be?,"


presented at Victorian Association for Library Automation Inc.,
Melbourne, 2002.

[10]

H. Hofman, "A global issue: preservation of digital objects,"


presented at Korean Association of Archives Management, Seoul,
Korea, 2002.

[11]

B. F. Lavoie, "The Open Archival Information System Reference


Model: Introductory Guide," Digital Preservation Coalition,
Dublin, USA, Technology Watch Report Watch Series Report 0401, 2004.

[12]

Consultative Committee for Space Data Systems, Reference Model for


an Open Archival Information System (OAIS) - Blue Book. Washington:
National Aeronautics and Space Administration, 2002.

[13]

M. d. L. Saramago, "Metadados para preservao digital e aplicao


do modelo OAIS," presented at VIII Congresso da BAD, Estoril,
Portugal, 2004.

[14]

D. Bearman, "Collecting Software: A New challenge for Archives


& Museums," Archival Informatics 1, 1987.

[15]

Task Force on Archiving of Digital Information, Commission on


Preservation and Access and Research Libraries Group, Preserving
digital information: report of the Task Force on Archiving of Digital

75

Information. Washington, D.C.: Commission on Preservation and


Access, 1996.
[16]

D. Swade, "Preserving Software in an Object-Centred Culture," in


In History and Electronic Artefacts, E. Higgs, Ed. Oxford: Clarendon
Press, 1998, pp. 195-206.

[17]

T. Hendley, "Comparison of Methods & Costs of Digital


Preservation," British Library Research and Innovation Center,
West Yorkshire 106, 1998.

[18]

J. Rothenberg, Commission on Preservation and Access and


Council on Library and Information Resources, Avoiding technological
quicksand: finding a viable technical foundation for digital preservation: a report
to the Council on Library and Information Resources. Washington, DC:
Council on Library and Information Resources, 1999.

[19]

D. Bearman, "Archival Methods," Archives and Museum


Informatics, Pittsburgh, Techical Report 1, 1989.

[20]

D. Woodyard, "Farewell my Floppy: a strategy for migration of


digital information," 1998. [Online]. Available:
http://www.nla.gov.au/nla/staffpaper/valadw.html.

[21]

H. Besser, "Digital Preservation of Moving Image Material?," The


Journal of the Association of Moving Image Archivists, vol. 1, no. 2, pp. 3955, 2001.

[22]

Wine development team, "Wine HQ Web site," 1997. [Online].


Available: http://www.winehq.com. [Accessed 2006-10-11]

[23]

VMWare, "VMWare Workstation Web site," 1998. [Online].


Available: http://www.vmware.com/.

[24]

Parallels, "Parallels Desktop Web site," 1995. [Online]. Available:


http://www.parallels.com. [Accessed 2006-10-12]

[25]

S. Granger, "Emulation as a Digital Preservation Strategy," D-Lib


Magazine, vol. 6, no. 10, 2000.

76

[26]

A. Davidson and A. Pollard, "Jasper - ZX Spectrum Emulator,"


2005. [Online]. Available: http://www.spectrum.lovely.net/.

[27]

G. Krijgsman, "Emulator Zone," 2005. [Online]. Available:


http://www.emulator-zone.com.

[28]

A. Waugh, R. Wilkinson, B. Hills and J. Dell'oro, "Preserving


Digital Information Forever," presented at Fifth ACM Conference
on Digital Libraries, San Antonio, Texas, 2000.

[29]

H. Heslop, S. Davis and A. Wilson, "An Approach to the


Preservation of Digital Records." Camberra, Australia: National
Archives of Australia, 2002.

[30]

D. Holdsworth and P. Wheatley, "Emulation, Preservation and


Abstraction," DigiNews, Research Library Group, vol. 5, no. 4, 2001.

[31]

Microsoft Corporation, "MS-DOS," 1.0 ed, 1981.

[32]

D. Woodyard, "Digital Preservation: The Australian Experience,"


presented at Third Conference Digital Library: Positioning the
Fountain of Kowledge, Malaysia, 2000.

[33]

G. W. Lawrence, W. R. Kehoe, O. Y. Rieger, W. H. Walters and A.


R. Kenney, "Risk Management of Digital Information: A file
format investigation," Council on Library and Information
Resources, Washington, DC, 2000.

[34]

K. Russell, "Digital Preservation and the CEDARS Project


Experience," presented at International Conference on
Preservation and Long Term Accessibility of Digital Materials,
York, England, 2000.

[35]

M. Hedstrom, "Digital Preservation: Problems and Prospects,"


Digital Library Network (DLnet), no. 20, 2001.

[36]

A. Rauber and A. Aschenbrenner, "Part of Our Culture is Born


Digital - On Efforts to Preserve it for Future Generations,"
TRANS - On-line Journal for Cultural Studies., vol. 10, 2001.

77

[37]

H. Hofman, "How to keep digital records understandable and


usable through time?," presented at Long-Term Preservation of
Electronic Records, Paris, France, 2001.

[38]

C. Ayre and A. Muir, "The Right to Preserve," D-Lib Magazine, vol.


10, no. 3, 2004.

[39]

A. G. Howel, "Preserving Digital Information: Challenges and


Solutions," Victorian Academic Libraries, Victorian university
libraries and State Library of Victoria, 2004.

[40]

M. Hedstrom, "Digital Preservation: A time bomb for digital


libraries," Computers and the Humanities, vol. 31, pp. 189-202, 1998.

[41]

G. Hodge and E. Frangakis, "Digital Preservation and Permanent


Access to Scientific Information: The State of the Practice,"
International Council for Scientific and Technical Information &
CENDI, Report 2004-3: Rev. 05/04, 2004.

[42]

P. Mellor, P. Wheatley and D. M. Sergeant, "Migration on Request,


a Practical Technique for Preservation," presented at ECDL '02:
6th European Conference on Research and Advanced Technology
for Digital Libraries, London, UK, 2002.

[43]

J. M. Ockerbloom, "Mediating Among Diverse Data Formats," in


School of Computer Science. Pittsburg: Carnegie Mellon University,
1998, pp. 164.

[44]

F. L. Walker and G. R. Thoma, "A Web-Based Paradigm for File


Migration," presented at IS&T's 2004 Archiving Conference, San
Antonio, Texas, USA, 2004.

[45]

J. Hunter and S. Choudhury, "A Semi-Automated Digital


Preservation System based on Semantic Web Services," presented
at Joint ACM/IEEE Conference on Digital Libraries (JCDL'04),
2004.

[46]

M. Ferreira, "Automatic Evaluation of Migration Quality in


Distributed Networks of Converters," presented at Doctoral
Consorcium of the 9th European Conference on Research and

78

Advanced Technology for Digital Libraries (ECDL), Vienna,


Austria, 2005.
[47]

M. Ferreira, A. A. Baptista and J. C. Ramalho, "CRiB: A service


oriented architecture for digital preservation outsourcing,"
presented at XATA - XML: Aplicaes e Tecnologias Associadas,
Portalegre, Portugal, 2006.

[48]

M. Ferreira, "Automatic Evaluation of Migration Quality in


Distributed Networks of Converters," Bulletin of the IEEE Technical
Committee on Digital Libraries (TCDL), vol. 2, no. 1, 2006.

[49]

M. Ferreira, "CRiB - Conversion and Recommendation of Digital


Object Formats Web site," 2006. [Online]. Available:
http://crib.dsi.uminho.pt.

[50]

M. Ferreira, A. A. Baptista and J. C. Ramalho, "A Foundation for


Automatic Digital Preservation," Ariadne, no. 48, 2006.

[51]

A. R. Heminger and S. B. Robertson, "A Delphi Assessment of the


Digital Rosetta Stone Model," presented at 37th Annual Hawaii
International Conference on System Sciences (HICSS'04), Big
Island, Hawaii, 2004.

[52]

Digital Preservation Testbed, "Migration: Context and Current


Status," The Hague, White Paper, 2001.

[53]

T. Shepard and D. MacCarn, "The Universal Preservation Format:


Background and Fundamentals," presented at Sixth DELOS
Workshop, Tomar, Portugal, 1998.

[54]

T. Shepard and D. MacCarn, "The Universal Preservation Format:


A Recommended Practice for Archiving Media and Electronic
Records," Boston, 1999.

[55]

R. A. Lorie, "A Methodology and System for Preserving Digital


Data," presented at Second ACM/IEEE-CS Joint Conference on
Digital Libraries (JCDL'02), Portland, Oregon, 2002.

79

[56]

R. A. Lorie, "Long Term Preservation of Digital Information,"


presented at First ACM/IEEE-CS Joint Conference on Digital
Libraries (JCDL'01), Roanoke, Virginia, USA, 2001.

[57]

Wikipedia, "Rosetta Stone," 2005. [Online]. Available:


http://en.wikipedia.org/wiki/Rosetta_stone.

[58]

Wikipedia, "Jean-Franois Champollion," 2005. [Online]. Available:


http://en.wikipedia.org/wiki/Jean-Fran%E7ois_Champollion.

[59]

A. R. Heminger and S. B. Robertson, "Digital Rosetta Stone: A


Conceptual Model for Maintaining Long-Term Access to Digital
Documents," presented at 6th DELOS Workshop, Tomar,
Portugal, 1998.

[60]

UK National Archives, "PRONOM - The file format registry,"


2002. [Online]. Available:
http://www.nationalarchives.gov.uk/pronom/.

[61]

S. L. Abrams and D. Seaman, "Towards a global digital format


registry," presented at World Library and Information Congress:
69th IFLA General Conference and Council, 2003.

[62]

J. Darlington, "PRONOM - A Practical Online Compendium of


File Formats," RLG DigiNews, vol. 7, no. 5, 2003.

[63]

UK National Archives, "Droid: Digital Record Object


Identification," 1.0 ed. Surrey: UK National Archives, 2005.

[64]

C. T. Cullen, "Authentication of Digital Objects: Lessons from a


Historian's Research," in Authenticity in a Digital Environment.
Washington, DC: Council on Library and Information Resources,
2000.

[65]

P. B. Hirtle, "Archival Authenticity in a Digital Age," in Authenticity


in a Digital Environment. Washington, DC: Council on Library and
Information Resources, 2000.

80

[66]

H. Hofman, "Can Bits and Bytes be Authentic? Preserving the


Authenticity of Digital Objects," presented at International
Federation of Library Associations Conference, Glasgow, 2002.

[67]

J. Rothenberg, "Preserving Authentic Digital Information," in


Authenticity in a Digital Environment. Washington, DC: Council on
Library and Information Resources, 2000.

[68]

B. Lavoie and R. Gartner, "Technology Watch Report Preservation Metadata," Online Computer Library Center Inc.,
Oxford University Library Services and Digital Preservation
Coalition 05-01, 2005.

[69]

H. MacNeil, C. Wei, L. Duranti, A. Gilliland-Swetland, M. Guercio,


Y. Hackett, B. Hamidzadeh, L. Iacovino, B. Lee, S. McKemmish, J.
Roeder, S. Ross, W.-k. Wan and Z. Z. Xiu, "Authenticity Task
Force Report," InterPARES Project, Vancouver, Canada, 2001.

[70]

L. Millar, "Authenticity of electronic records: a report prepared for


UNESCO and the International Council on Archives,"
International Council on Archives, London, UK, 2004.

[71]

C. Lynch, "Authenticity and Integrity in the Digital Environment:


An Exploratory Analysis of the Central Role of Trust," in
Authenticity in a Digital Environment. Washington, DC: Council on
Library and Information Resources, 2000.

[72]

Authenticity Task Force, "Requirements for Assessing and


Maintaining the Authenticity of Electronic Records," InterPARES
Project, Vancouver, Canada, 2002.

[73]

R. J. v. Diessen and T. v. d. Werf-Davelaar, "Authenticity in a


digital environment," Koninklijke Bibliotheek & IBM,
Amesterdam, The Netherlands, Report 2, 2002.

[74]

P. Akester, "Internet law - authenticity of works. Authorship and


authenticity in cyberspace," Computer Law & Security Report, vol. 20,
no. 6, 2004.

81

[75]

P. Graham, "Issues in Digital Archiving," in Preservation: Issues and


Planning, R. Pilette and P. Banks, Eds. Chicago: IL: American
Library Association, 2000.

[76]

The Cedars Project Team, "The Cedars Project Report,"


Consortium of University Research Libraries, UK, 2001.

[77]

R. J. v. Diessen, "Model Driven Object-Oriented Development of


Systems: A Behavioural-Oriented Approach." Hilversum, The
Netherlands, 1997.

[78]

N. Beagrie, M. Bellinger, R. Dale, M. Doerr, M. Hedstrom, M.


Jones, A. Kenney, C. Lupovici, K. Russell, C. Webb and D.
Woodyard, "Trusted Digital Repositories: Attributes and
Responsibilities," Research Libraries Group & Online Computer
Library Center, Report, 2002.

[79]

A. Rusbridge, "Migration on Request," University of Edinburgh Division of Informatics, 4th Year Project Report, 2003.

[80]

C. Lynch, "Canonicalization: A Fundamental Tool to Facilitate


Preservation and Management of Digital Information," D-Lib
Magazine, vol. 5, no. 9, 1999.

[81]

C. Lupovici and J. Masans, "Metadata for the Long Term


Preservation of Electronic Publications," NEDLIB Consortium,
The Hague, The Netherlands 2, 2000.

[82]

The Cedars Project Team, "Cedars Guide to Preservation


Metadata," The Cedars Project, 2002.

[83]

National Library of Australia, "Preservation Metadata for Digital


Collections," 1999. [Online]. Available:
http://www.nla.gov.au/preserve/pmeta.html.

[84]

OCLC/RLG Preservation Metadata Working Group, "A Metadata


Framework to Support the Preservation of Digital Objects," OCLC
Online Computer Library Center, Inc., Dublin, USA, 2002.

82

[85]

PREMIS Working Group, "Data dictionary for preservation


metadata: final report of the PREMIS Working Group," OCLC
Online Computer Library Center & Research Libraries Group,
Dublin, Ohio, USA, Final report, 2005.

[86]

C. Rauch and A. Rauber, "Preserving Digital Media: Towards a


Preservation Solution Evaluation Metric," presented at
International Conference on Asian Digital Libraries, Shanghai,
China, 2004.

[87]

C. Rauch, F. Pavuza, S. Strodl and A. Rauber, "Evaluating


preservation strategies for audio and video files," presented at
DELOS Digital Repositories Workshop, Heraklion, Crete, 2005.

[88]

P. Weirich, B. Skyrms, E. W. Adams, K. Binmore, J. Butterfield, P.


Diaconis and W. L. Harper, Decision Space: Multidimensional Utility
Analysis. Cambridge, 2001.

[89]

B. F. Lavoie and L. Dempsey, "Thirteen Ways of Looking at...


Digital Preservation," D-Lib Magazine, vol. 10, no. 7/8, 2004.

[90]

R. Burkel, "The Role of Microfilm in Information Management,"


Information Management Journal, vol. 37, no. 1, pp. 58-65, 2003.

[91]

D. Waters, "Good Archives Make Good Scholars: Reflections on


Recent Steps Toward the Archiving of Digital Information,"
presented at The State of Digital Preservation: An International
Perspective, Washington D.C., 2002.

[92]

J. C. Bennett, "A Framework of Data Types and Formats, And


Issues Affecting the Long Term Preservation of Digital Material,"
British Library Research and Innovation Centre, West Yorkshire,
UK, Report 50, 1997.

83

ndice
disquete, 20, 30
Documentos de texto, 19, 67
DVD, 17, 20, 23, 66
emulao, 31
emulador, 30, 31, 32
encapsulamento, 28, 40
Entidade Intelectual, 53
essncia de um objecto digital, 49
Evento, 54
Ficheiro, 54
formato, 20
formato cannico, 50
formato de preservao, 36
Formato Universal de
Preservao, 40
fotografias digitais, 19, 67
Global Digital Format Registry,
44
hardware, 20, 29, 30, 31, 32, 33,
36, 41, 48, 52, 66, 67
incorporao, 25, 51

Acesso, 26
actualizao de verses, 35
Agente, 54
Anlise de Utilidade, 55
aplicaes, 17, 19, 31, 32, 34, 43,
67
arqueologia digital, 42
rvore-objectivo, 56, 57
ASCII, 49
udio, 19, 67
autenticidade, xii, 46, 47, 51, 54,
60, 61
bases de dados, 19, 67
canonizao, 50
caractersticas essenciais, 50
CCSDS, 24
CD, 20, 30, 65, 66
comunidade de interesse, 26
diagramas vectoriais, 19, 67
Direitos, 54
disco rgido, 20, 23, 30

84

OCLC/RLG, 52
Pacote de Informao de
Arquivo, 26
Pacotes de Informao de
Disseminao, 27
PDF, 38, 44, 49, 68
Pedra de Rosetta, 41
Planeamento de Preservao, 26
PNG, 23, 35, 36, 68
polticas, xii, 26, 36, 49, 60, 63
populao potencialmente
utilizadora, 26
PREMIS, xii, 52, 53, 60
preservao digital, iv, xi, 18, 22,
24, 28, 29, 30, 32, 43,
52, 66
propriedades significativas, 48, 49
provenincia, 51
realidade virtual, 19, 67
refrescamento, 30
repositrio, 25, 26, 27, 35, 39, 49,
51
Repositrio de Dados, 26
Representao, 54
Sequncia de bits, 54
Servios, 39
software, 17, 19, 20, 29, 30, 31,
32, 33, 34, 35, 36, 38,
41, 44, 48, 52, 54, 63,
65, 66, 67
submisso, 25
suporte fsico, 20, 22, 30, 40, 68
Thibodeau, 28, 62
TIFF, 23, 35, 69
TOM, 38, 45
Typed Objects Model, 38
Universidade do Minho, iv, ix, 38
vdeo, 16, 19, 61, 67
Web, 19, 38, 39, 44, 65, 67, 68, 69

informao, xi, xii, 16, 17, 18, 19,


24, 25, 26, 27, 30, 32,
33, 36, 39, 40, 41, 43,
44, 48, 51, 52, 54, 59,
61, 62, 65, 66, 67, 68
Informao Descritiva, 26
Ingesto, 25, 67
ISO, 24
Java Virtual Machine, 41
JPEG, 23, 35, 36, 67
mquina virtual universal, 41
metainformao, 40
metainformao de preservao,
51
migrao, 28, 33, 34, 35, 37, 38,
39, 40, 50, 60, 61, 62
migrao a-pedido, 34, 37, 39, 62
migrao para suportes
analgicos, 34
MIME, 44
MS-DOS, 32
normalizao, 34, 35, 36, 39, 62
OAIS, xi, 24, 25, 26, 52, 59
Objecto, 54
objecto conceptual, 21, 22, 23,
28, 29, 33
objecto digital, xi, 19, 20, 21, 22,
23, 29, 30, 31, 33, 34,
37, 40, 41, 47, 48, 49,
54, 59, 66, 67, 68
objecto experimentado, 21
objecto fsico, 20, 28, 48, 61
objecto lgico, 20
objecto semntico, 21
objectos conceptuais, 21
objectos digitais, 20, 27, 28, 29,
32, 33, 34, 35, 36, 37,
38, 40, 41, 42, 49, 50,
56, 61, 62, 63, 67

85

86

87

88

Você também pode gostar