Você está na página 1de 88

2

Introduo

Preservao Digital
Conceitos, estratgias e actuais consensos

MIGUEL FERREIRA 2006

Ttulo Autor Ano ISBN Editora Local Capa Suporte Dimenses de impresso Reviso cientfica

Introduo preservao digital Conceitos, estratgias e actuais consensos Miguel Ferreira 2006 972-8692-30-7 978-972-8692-30-8 Escola de Engenharia da Universidade do Minho Guimares, Portugal Miguel Ferreira Edio electrnica A: 297mm, L: 210mm (A4) Ana Alice Baptista
(Universidade do Minho)

Cristina Ribeiro
(Faculdade de Engenharia da Universidade do Porto)

Francisco Barbedo
(Instituto dos Arquivos Nacionais/Torre do Tombo)

Jos Carlos Ramalho


(Universidade do Minho)

Paulo Cortez
(Universidade do Minho)

Idioma

Portugus

Citao. M. Ferreira, Introduo preservao digital Conceitos, estratgias e actuais consensos. Guimares, Portugal: Escola de Engenharia da Universidade do Minho, 2006. Este trabalho est licenciado sob uma Licena Creative Commons Atribuio-Uso No-Comercial-Vedada a Criao de Obras Derivadas 2.5 Portugal. Para ver uma cpia desta licena, visite http://creativecommons.org/licenses/by-nc-nd/2.5/pt/ ou envie uma carta para Creative Commons, 559 Nathan Abbott Way, Stanford, California 94305, USA.

Dedicado Marta a minha mais que tudo.

AGRADECIMENTOS

Foram vrias as pessoas que contriburam para a edificao deste livro. A todos os que directa ou indirectamente participaram ou influenciaram a realizao deste trabalho, o meu mais sincero obrigado. H, contudo, um conjunto de pessoas que pela forma incisiva como colaboraram na concepo deste projecto merece a minha particular ateno. Gostaria, assim, de agradecer de forma especial s seguintes individualidades: Ana Alice Baptista e ao Jos Carlos Ramalho, meus mentores e orientadores de doutoramento que sempre me indicaram o caminho mais acertado, tanto no trabalho como na vida. equipa de revisores, Cristina Ribeiro e Paulo Cortez, pelos comentrios, correces e sugestes fornecidas durante a apresentao pblica do meu trabalho de doutoramento. Ao sempre eloquente Francisco Barbedo, pelas discusses filosficas em torno de semitica, comunicao e arquivstica. Ao Rui Castro e Duarte Duque, companheiros de sempre, pelas inmeras correces de linguagem e conselhos tcnicos que to acentuadamente elevaram a qualidade final desta obra. Ao Dr. Eloy Rodrigues, por ter aceite o meu humilde convite para prefaciar este livro. A todas estas pessoas, o meu mais profundo obrigado.

SOBRE O AUTOR

Licenciado em Engenharia de Sistemas e Informtica pela Universidade do Minho, iniciou a sua carreira profissional na Philips Research em Eindhoven, Holanda, onde trabalhou como investigador no domnio da domtica e Ambient Intelligence. A, fez parte da equipa de desenvolvimento de um dispositivo capaz de armazenar e navegar nas memrias colectivas de uma comunidade, e.g. fotografias, vdeos, sons, aromas. Regressado a Portugal, mudou radicalmente o rumo da sua vida profissional ao ingressar a equipa do projecto DigitArq. Um projecto multifacetado realizado no Arquivo Distrital do Porto, sob coordenao cientfica da Universidade do Minho, do qual resultou a atribuio do prmio Fernandes Costa Agncia para a Sociedade do Conhecimento, por ter sido considerado o trabalho que melhor respondeu inovao e contributo para o desenvolvimento da Sociedade da Informao em Portugal no ano de 2004. Regressou Universidade do Minho onde iniciou a sua carreira como investigador na rea dos Arquivos e Bibliotecas Digitais. Durante um ano explorou novas formas de navegar sobre repositrios digitais. Parte desses desenvolvimentos vieram a ser integrados na distribuio oficial da plataforma DSpace e so agora mantidos pelo Massachusetts Institute of Technology (MIT) e pela Hewlett-Packard (HP). Em 2005 iniciou o seu programa de doutoramento na rea da Preservao Digital, do qual resultou esta publicao.

10

Prefcio
para mim um grande prazer, e tambm uma honra, prefaciar esta obra. Em primeiro lugar, pela sua relevncia, oportunidade e utilidade. No mundo de hoje diariamente produzido um volume gigantesco de informao, registada e/ou transmitida sobre diversos suportes e formatos. Em resultado da evoluo social escala planetria no ltimo sculo (crescimento demogrfico, evoluo do acesso educao e s tecnologias, desenvolvimento e enriquecimento de mltiplas regies e grupos sociais) e da revoluo tecnolgica dos ltimos 20 anos (em particular da informtica e das comunicaes), provvel que as geraes actuais produzam e registem mais informao, do que toda a informao registada pelas milhares de geraes que nos precederam. Uma parte crescente desta informao produzida, registada e transmitida em suportes e formatos digitais. Claro que, tal como no passado, no possvel, nem til ou relevante, guardar e preservar toda a informao hoje criada. Mas, do mesmo modo que hoje podemos aceder e consultar um registo significativo da informao produzida pelas geraes que nos

11

antecederam (em particular as dos ltimos cinco sculos), necessrio garantir que as geraes futuras iro ter acesso a um registo igualmente significativo e relevante da produo informativa contempornea. Por isso, a preservao digital, que de forma feliz definida neste livro como a actividade que garante que a comunicao entre um emissor e um receptor possvel, no s atravs do espao, como tambm atravs do tempo, assume uma importncia fundamental no actual contexto social e tecnolgico. E da, a extrema oportunidade e relevncia deste livro. O tema da preservao digital , ao mesmo tempo, um tema novo, vasto e complexo. um tema novo porque ele apenas se autonomizou e desenvolveu de forma visvel h pouco mais de dez anos. um tema vasto e complexo porque o conjunto de questes e problemas, quer de natureza conceptual e terica, quer de natureza prtica e tecnolgica, imenso. O volume crescente, a heterogeneidade e as caractersticas da informao digital (que, do ponto de vista dos seus utilizadores, no apenas pode ser independente dos suportes, como dos formatos), tais como a facilidade de manipulao, interligao e reutilizao vo traduzir-se certamente no alargamento do campo da preservao digital. A grande utilidade deste livro resulta precisamente de apresentar e mapear, de forma simples mas nem por isso menos rigorosa, o territrio novo, vasto e complexo da preservao digital. O livro comea, de forma muito adequada, por apresentar e discutir a anatomia dos objectos digitais, cuja preservao se pretende garantir, chamando a ateno para a existncia de vrios nveis a que podem ser observados, como que diferentes camadas de que se compem. Uma das caractersticas essenciais dos objectos digitais, que os distingue de objectos informativos anteriores, como os livros e outros documentos registados em papel em que a informao pode ser acedida directamente do

12

objecto, que eles exigem camadas de intermediao tecnolgica (hardware/equipamento, e software/formato), sem as quais a informao que contm no pode ser acedida e usada. E apesar de os leitores/utilizadores s interagirem com a ltima camada (no livro designada como objecto conceptual), esta depende das camadas anteriores, muito vulnerveis obsolescncia tecnolgica. Partindo deste til enquadramento conceptual, o livro aborda nos captulos seguintes a problemtica especfica da preservao digital, apresentando de um modo sinttico, e ao mesmo tempo claro e de fcil compreenso, o modelo de referncia OAIS, as diferentes estratgias de preservao digital, os directrios de formatos, a autenticidade, a metainformao de preservao, concluindo com uma muito til avaliao de estratgias de preservao. Este livro fornece portanto uma panormica abrangente e introdutria s questes da preservao digital que ser certamente preciosa para todos quantos se queiram iniciar, ou actualizar conhecimentos, neste domnio. Em segundo lugar, para mim tambm um enorme prazer prefaciar um livro que o seu autor disponibiliza em Acesso Livre (Open Access). Como se sabe, o Acesso Livre aplica-se primariamente verso final (aps peer-review) de artigos de revistas (postprints), mas tambm inclui verses no revistas (preprints) que os investigadores queiram divulgar para alertar sobre novos resultados ou para estabelecer a primazia. Mas o Acesso Livre pode aplicar-se naturalmente a todos os trabalhos, como livros e monografias especializadas, working papers, e outros, dos quais os autores no esperem obter rendimento (apesar de serem cada vez mais frequentes exemplos de livros com verses disponveis em Acesso Livre e, simultaneamente, com verses vendidas no circuito comercial).

13

Este livro, que o autor agora generosamente disponibiliza, constitui um dos primeiros exemplos nacionais de livros acessveis em Acesso Livre. Espero que, tambm sob esse ponto de vista, este seja um livro pioneiro abrindo caminho a muitos outros que se editaro em Acesso Livre nos prximos anos em Portugal. Finalmente, tambm um prazer prefaciar este livro pelo conhecimento e estima pessoal que tenho pelo Miguel Ferreira, com quem tenho tido o privilgio de interagir e colaborar, ainda que de forma espordica e fugaz, nos ltimos dois anos. Ambos somos membros de uma comunidade que se tem vindo a constituir, de forma mais ou menos informal, na Universidade do Minho, mas com fortes ligaes nacionais e internacionais, em torno da informao digital, das bibliotecas e arquivos digitais, dos repositrios institucionais, dos arquivos abertos (Open Archives Initiative) e do Acesso Livre literatura cientfica. Para finalizar este prefcio, deixo um convite e um desafio. O convite a todos os que se deram ao trabalho de ler estas linhas, para que leiam, usem e aproveitem intensamente este livro, no se esquecendo do dever bsico do reconhecimento e atribuio da autoria. O desafio para o autor: para que esta seja apenas a primeira verso de um livro, que atravs de mltiplas revises, acrescentos e actualizaes, se transforme numa obra de referncia sobre a preservao digital em lngua portuguesa. Guimares, Novembro de 2006 Eloy Rodrigues

14

CONTEDO

INTRODUO ...............................................................................................17 A ANATOMIA DE UM OBJECTO DIGITAL..................................................21 O MODELO DE REFERNCIA OAIS .........................................................27 ESTRATGIAS DE PRESERVAO DIGITAL..............................................31 Preservao de tecnologia..................................................................32 Refrescamento.....................................................................................33 Emulao..............................................................................................33 Migrao/converso...........................................................................36 Migrao para suportes analgicos...........................................37 Actualizao de verses .............................................................37 Converso para formatos concorrentes...................................38 Normalizao ..............................................................................38 Migrao a-pedido ......................................................................40 Migrao distribuda ...................................................................41 Encapsulamento..................................................................................43 A Pedra de Rosetta digital..................................................................44 DIRECTRIOS DE FORMATOS ...................................................................46 AUTENTICIDADE .........................................................................................49 METAINFORMAO DE PRESERVAO ....................................................54 AVALIAO DE ESTRATGIAS DE PRESERVAO...................................58 SNTESE E CONCLUSO ..............................................................................62 GLOSSRIO ...................................................................................................68 REFERNCIAS...............................................................................................74 NDICE ..........................................................................................................84

15

16

Introduo
Desde a inveno da escrita que existe uma manifesta preocupao pela preservao dos artefactos que resultam de processos intelectuais e criativos do ser humano [1]. A preservao desses artefactos permite s geraes futuras compreender e contextualizar a histria e a cultura dos seus povos [2]. Os museus, as bibliotecas e os arquivos assumem neste contexto um papel determinante, responsabilizando-se pela preservao e longevidade desses artefactos. Nos dias de hoje, uma parte significativa da produo intelectual realizada com o auxlio de ferramentas digitais. A simplicidade com que o material digital pode ser criado e disseminado atravs das modernas redes de comunicao e a qualidade dos resultados obtidos so factores determinantes na adopo deste tipo de ferramentas. No entanto, o material digital carrega consigo um problema estrutural que coloca em risco a sua longevidade. Embora um documento digital possa ser copiado infinitas vezes sem qualquer perda de qualidade, este exige a presena de um contexto tecnolgico para que possa ser consumido de

17

forma inteligvel por um ser humano. Esta dependncia tecnolgica torna-o vulnervel rpida obsolescncia a que geralmente a tecnologia est sujeita [3]. O curso da histria tem revelado inmeros exemplos fatdicos de obsolescncia tecnolgica. Na dcada de 1970 a multinacional japonesa Sony introduziu um formato de vdeo designado Betamax (Fig. 1 a). Comparativamente ao comum VHS (Video Home System) (Fig. 1 b), a cassete Betamax era de menores dimenses e oferecia uma qualidade de imagem superior. O pico da sua popularidade foi atingido em 1983 quando cerca de um tero do mercado de vdeo domstico era dominado por este formato [4]. Apesar do seu sucesso comercial, o facto de a Sony no facilitar o licenciamento de produo a terceiros foi decisivo para que uma viragem radical ocorresse no mercado e os consumidores passassem a utilizar massivamente o formato VHS. Em escassos anos, o formato Betamax desapareceu do mercado europeu e norte-americano, sendo hoje em dia praticamente impossvel encontrar um dispositivo capaz de ler a informao armazenada numa dessas cassetes [4].

a)

b)

Fig. 1 a) Cassete Betamax; b) Cassete VHS.

18

Um exemplo mais recente de obsolescncia tecnolgica, desta vez no domnio digital, reporta-se ao uso das populares disquetes de 3.5 polegadas ( Fig. 2 - a). Em Maro de 2003, o fabricante Dell Computer Corporation anunciou que os seus computadores deixariam de integrar dispositivos capazes de ler este tipo de suportes (Fig. 2 - b). Vrios fabricantes seguiram de imediato o seu exemplo [5]. Actualmente, ainda possvel adquirir dispositivos capazes de ler disquetes de 3.5 polegadas. No entanto, o mercado inclina-se rapidamente para o uso de DVD e flash-drives.

a)

b)

Fig. 2 a) Disquete de 3.5 polegadas; b) Leitor de disquetes de 3.5 polegadas.

A obsolescncia tecnolgica no se manifesta somente ao nvel dos suportes fsicos. No domnio digital, todo o tipo de material tem obrigatoriamente de respeitar as regras de um determinado formato. Isto permite que as aplicaes de software sejam capazes de abrir e interpretar adequadamente a informao armazenada. medida que o software vai evoluindo, tambm os formatos por ele produzidos vo sofrendo alteraes. bastante comum encontrar aplicaes de software capazes de carregar os ficheiros produzidos por verses anteriores dessa mesma aplicao. No entanto, essa capacidade raramente vai alm das duas verses precedentes [5].

19

No mundo actual, onde cada vez mais organizaes dependem da informao digital que produzem, torna-se premente a implementao de tcnicas e de polticas concertadas que vo no sentido de garantir a perenidade e a acessibilidade a este tipo de informao. Designa-se, assim, por p r e s e r v a o d i g i t a l o conjunto de actividades ou processos responsveis por garantir o acesso continuado a longo-prazo informao e restante patrimnio cultural existente em formatos digitais [6]. A preservao digital consiste na capacidade de garantir que a informao digital permanece acessvel e com qualidades de autenticidade suficientes para que possa ser interpretada no futuro recorrendo a uma plataforma tecnolgica diferente da utilizada no momento da sua criao. Ao longo dos ltimos 10 anos, foram muitos os projectos e iniciativas que contriburam para a edificao da base de conhecimento que actualmente suporta o domnio cientfico da preservao digital. Desses projectos resultaram ideias, conceitos e estratgias que conduziram ao reconhecimento universal do problema e elaborao de possveis solues. Nos prximos captulos sero apresentados os conceitos e as iniciativas de maior relevo no domnio da preservao digital.

20

A anatomia de um objecto digital


Um o b j e c t o d i g i t a l pode ser definido como todo e qualquer objecto de informao que possa ser representado atravs de uma sequncia de dgitos binrios1 [7]. Esta definio suficientemente lata para acomodar tanto, informao nascida num contexto tecnolgico digital (objectos nado-digitais), como informao digital obtida a partir de suportes analgicos (objectos digitalizados). Documentos de texto, fotografias digitais, diagramas vectoriais, bases de dados, sequncias de vdeo e udio, modelos de realidade virtual, pginas Web e aplicaes de software so apenas alguns exemplos do que podemos considerar um objecto digital.

Do ingls bit stream.

21

De modo a promover a compreenso e o enquadramento dos diferentes processos envolvidos na preservao de objectos digitais, torna-se fundamental analisar as diferentes formas como os podemos observar. Para que um ser humano seja capaz de decifrar um objecto digital, h um conjunto de transformaes que tm necessariamente de ocorrer. Um objecto digital comea por ser um objecto fsico, i.e. um conjunto de smbolos ou sinais inscritos num suporte fsico (e.g. disco rgido, CD, DVD, disquete). O suporte fsico define o domnio dos smbolos a utilizar. Vejamos um exemplo. Uma fotografia digital pode encontrar-se inscrita numa vasta gama de suportes fsicos. Os smbolos, ou sinais fsicos, utilizados para representar essa fotografia num CD-ROM diferem substancialmente dos smbolos utilizados para a representar num disco rgido [7]. No primeiro, os smbolos utilizados so essencialmente pequenos orifcios reflectores dispostos em espiral sobre uma base de policarbonato. No segundo, so utilizados padres magnticos sobre um prato metlico. O objecto fsico constitui aquilo que, geralmente, o hardware capaz de interpretar (Fig. 3). O hardware assume aqui a responsabilidade de transformar os smbolos inscritos no suporte fsico num conjunto de dados que o software ser capaz de manipular. Esse conjunto de dados encontra-se geralmente organizado segundo as regras decretadas pelo software que foi utilizado para produzir o objecto digital. Essas regras ou estruturas de dados constituem aquilo que vulgarmente se designa por f o r m a t o de um objecto digital [7]. Essas estruturas constituem o nvel de abstraco l g i c o , ou s i n t c t i c o , do objecto digital. O software assume ento a responsabilidade de preparar o o b j e c t o l g i c o para que este seja devidamente apresentado a um receptor humano. Nesta fase, os sinais digitais manipulados no interior do computador so

22

transformados em sinais analgicos que sero veiculados at ao receptor humano atravs de um perifrico de sada (Fig. 4).

Fig. 3 - Diferentes nveis de abstraco de um objecto digital.

A imagem que posteriormente se forma na mente do receptor constitui o que vulgarmente se designa por um o b j e c t o c o n c e p t u a l ou o b j e c t o s e m n t i c o (Fig. 3). Os objectos conceptuais assumem formas ou concepes familiares aos seres humanos, i.e. formas que existem no mundo real e que lhes so conhecidas, como livros, filmes ou fotografias. Do ponto de vista do ser humano, o objecto conceptual constitui aquilo que deve ser preservado. No obstante, cada ser humano acaba por fazer uma interpretao individual do objecto recebido. Essa interpretao ser aqui designada por o b j e c t o e x p e r i m e n t a d o ( Fig. 3). Apesar de teoricamente ser possvel captar e preservar o objecto experimentado, nenhuma das estratgias de preservao apresentadas ao longo deste livro abordam seriamente esta questo. De modo anlogo, quando um ser humano assume o papel de emissor (ou produtor de informao), este mesmo conjunto de transformaes

23

realizado, mas em sentido inverso. Nesta situao, o objecto conceptual que ganhou forma no crebro do emissor codificado numa qualquer linguagem passvel de ser comunicada (e.g. lngua portuguesa, linguagem grfica, etc.). Essa linguagem poder ento ser transmitida ou armazenada num suporte fsico adequado sua reteno, passando inevitavelmente por um processo intermdio de codificao que transforma a linguagem humana em cdigos binrios capazes de ser processados pelo computador.

Fotograa

Nvel conceptual
Perifrico de sada

11010110 01000101 10111011 10011101


Software

Nvel lgico

Nvel fsico
Suporte fsico Perifrico de entrada

Fig. 4 - Cadeia de interpretao do nvel fsico ao conceptual.

Numa situao ideal, o objecto conceptual formado na mente do emissor ser em tudo semelhante ao objecto conceptual concebido pelo receptor. Somente nessa situao a comunicao poder ser considerada perfeita. A preservao digital a actividade responsvel por garantir que a comunicao entre um emissor e um receptor possvel, no s atravs do espao mas tambm atravs do tempo. Para que a preservao de um objecto digital seja possvel, necessrio assegurar que todos os nveis de abstraco anteriormente descritos se encontram acessveis e interpretveis. Se a cadeia de interpretao que

24

permite elevar um objecto digital desde o seu nvel fsico at ao nvel conceptual for rompida, a comunicao deixa de ser possvel e o objecto perder-se- para sempre [8, 9]. Visto numa outra perspectiva, um mesmo objecto conceptual pode ser representado em diversos formatos lgicos, podendo cada um destes ser suportado por um sem-nmero de representaes fsicas [10]. Voltando ao exemplo da fotografia digital, facilmente podemos constatar que poder ser codificada em diversos formatos, e.g. TIFF, JPEG, PNG. No obstante, cada um destes formatos pode, por sua vez, ser inscrito numa multitude de suportes fsicos, e.g. DVD, disco rgido, flash-drive. (Fig. 5).

Fig. 5 - Objecto digital observado a diferentes nveis de abstraco.

Esta dissecao do conceito objecto digital luz da semitica , i.e. recorrendo a diferentes nveis de abstraco, permite um melhor enquadramento das

25

diversas estratgias de preservao que sero apresentadas ao longo deste livro.

26

O modelo de referncia OAIS


Em 1990, o Consultative Comitee for Space Data Systems (CCSDS) iniciou um esforo conjunto com a International Organization for Standardization (ISO) a fim de desenvolver um conjunto de normas capazes de regular o armazenamento a longo-prazo de informao digital produzida no mbito de misses espaciais. Deste esforo nasceu o modelo de referncia OAIS (Open Archival Information System), um modelo conceptual que visa identificar os componentes funcionais que devero fazer parte de um sistema de informao dedicado preservao digital [11, 12]. O modelo descreve ainda as interfaces internas e externas do sistema e os objectos de informao que so manipulados no seu interior [11]. O modelo foi aprovado como uma norma internacional em 2003 ISO Standard 14721:2003 [12].

27

Um dos contributos mais notveis desta iniciativa foi a definio de uma terminologia prpria que viria a facilitar a comunicao entre os diversos intervenientes envolvidos na preservao de objectos digitais [13]. A Fig. 6 ilustra os diferentes componentes funcionais, assim como os pacotes de informao trocados no interior de um repositrio digital compatvel com o modelo de referncia OAIS.

Planeamento de Preservao

Informao descritiva

Gesto de Dados

Informao descritiva

Ingesto
PIS

Acesso
PID

Produtor

PIA

Repositrio de dados

PIA

Consumidor

Administrao

Administrador

Fig. 6 - Modelo de referncia Open Archival Information System (OAIS).

O P r o d u t o r dever ser entendido como a entidade externa ao repositrio que se responsabiliza pela submisso de material. O material submetido a arquivo aqui representado pelo P a c o t e d e I n f o r m a o d e Subm isso2 (PIS ).
T

Durante o processo de submisso ou incorporao, designado neste contexto por I n g e s t o , o repositrio responsvel por garantir a integridade da
2

Do ingls Submission Information Package (SIP).

28

informao recebida. Ainda nesta fase, produzida toda a I n f o r m a o D e s c r i t i v a que ir suportar a descoberta e localizao do material depositado. Essa informao descritiva (ou metainformao) armazenada e gerida pelo componente G e s t o d e D a d o s 3. O material a preservar (i.e. P a c o t e d e I n f o r m a o d e A r q u i v o 4 ou PIA) ser conservado no R e p o s i t r i o d e D a d o s 5. O componente de ingesto constitui, assim, a interface entre o arquivo OAIS e os respectivos produtores de informao [11]. O componente P l a n e a m e n t o d e P r e s e r v a o encarrega-se da definio de polticas de preservao. Este servio responsvel pela monitorizao do ambiente externo ao repositrio e por desencadear eventos de preservao sempre que necessrio. , por exemplo, da responsabilidade deste componente definir as estratgias de preservao a utilizar no interior do repositrio, monitorizar as tendncias comportamentais da sua comunidade de interesse ou identificar formatos que se encontram na iminncia de se tornar obsoletos [11]. O componente A c e s s o estabelece a ponte entre o repositrio e a sua comunidade de interesse6, i.e. o conjunto de potenciais C o n s u m i d o r e s do material custodiado. Este componente responsvel por facilitar a

3 4

Do ingls Data Management. Do ingls Archival Information Package (AIP). 5 Do ingls Archival Storage. 6 Tambm conhecido por p o p u l a o p o t e n c i a l m e n t e u t i l i z a d o r a . De notar que o conceito de c o m u n i d a d e d e i n t e r e s s e dever ser entendido no seu sentido mais lato. Trata-se de um conceito por vezes associado a centros de documentao e bibliotecas especializadas, como o caso de certas bibliotecas universitrias (e.g. Biblioteca de Fsica da Universidade do Minho). Em bibliotecas de carcter geral, como bibliotecas pblicas ou nacionais, e na generalidade dos arquivos este conceito no aplicvel ou apenas o ser se considerarmos que a comunidade de interesse coincide com a totalidade da populao.

29

descoberta e localizao dos objectos digitais, bem como preparar os mesmos para entrega ao consumidor. Os pacotes que so entregues ao consumidor assumem a forma de P a c o t e s d e I n f o r m a o d e D i s s e m i n a o 7 PID [11]. de realar o facto de os P a c o t e s d e I n f o r m a o d e D i s s e m i n a o poderem ser diferentes dos P a c o t e s d e I n f o r m a o d e A r q u i v o . A informao que entregue ao consumidor poder ser apenas um subconjunto da informao arquivada ou at uma verso transformada da mesma (ver Migrao/converso na pgina 36). Por ltimo, o componente A d m i n i s t r a o responsvel pelas operaes dirias de manuteno e sobretudo pela parametrizao e monitorizao dos processos desencadeados no interior do repositrio. Este componente interage com todos os restantes de modo a assegurar o correcto funcionamento do mesmo [11].

Do ingls Dissemination Information Package (DIP).

30

Estratgias de preservao digital


Ao longo dos ltimos anos tm vindo a ser propostas inmeras estratgias no sentido de solucionar o problema da preservao digital. Segundo Lee e seus colaboradores, estas estratgias podem ser agrupadas em trs classes fundamentais: emulao, migrao e encapsulamento [2]. Thibodeau, por sua vez, organiza as diferentes estratgias propostas num mapa bidimensional, posicionando no seu extremo esquerdo as estratgias centradas na preservao do objecto fsico/lgico8 e no extremo oposto as estratgias centradas na preservao do objecto conceptual (Fig. 7). No eixo vertical as diversas estratgias so dispostas mediante o seu grau de especificidade, isto , se so estratgias apenas aplicveis a uma dada classe de objectos digitais ou se se tratam de estratgias genricas, passveis de ser administradas a qualquer classe de objectos digitais [7].

Tambm designada na literatura por p r e s e r v a o d e t e c n o l o g i a .

31

Aplicao genrica

Refrescamento

Encapsulamento Maquina Virtual Universal

Pedra de Rosetta

Emulao

Normalizao/ Canonizao

Aplicao especfica

Preservao de tecnologia

Migrao

Preservao do objecto fsico/lgico

Preservao do objecto conceptual

Fig. 7 - Classificao das diferentes estratgias de preservao digital.

Preservao de tecnologia
Uma das primeiras estratgias de preservao a ser proposta consiste na conservao do contexto tecnolgico utilizado originalmente na concepo dos objectos digitais que se procuram preservar. Esta estratgia consiste, essencialmente, na conservao e manuteno de todo o hardware e software necessrios correcta apresentao dos objectos digitais [14-17]. Trata-se sobretudo da criao de museus de tecnologia. Aqui, o foco da preservao no se concentra no objecto conceptual, mas sim na preservao do objecto digital na sua forma original. Os impulsionadores desta estratgia consideram-na a nica forma suficientemente eficaz para assegurar que os objectos digitais so experimentados de forma fidedigna [2]. Contudo, a histria da computao tem vindo a demonstrar que qualquer plataforma tecnolgica, mesmo a mais popular, acaba inevitavelmente por se tornar obsoleta, acabando frequentemente por desaparecer sem deixar qualquer rasto [17]. Este tipo de estratgias introduz dificuldades ao nvel da gesto do espao fsico, manuteno e custo de operao, tornando-as

32

inadequadas para aplicao a longo-prazo [2]. Outras desvantagens assinalveis deste tipo de estratgias tm que ver com o facto de o acesso informao ficar confinado a apenas alguns locais fsicos do globo e com condicionalismos acrescidos ao nvel da reutilizao de informao [18].

Refrescamento
Um objecto digital torna-se persistente no momento em que inscrito num suporte fsico de armazenamento (e.g. disquete, disco rgido, CD-ROM). Garantir a integridade do suporte fundamental para que a informao nele armazenada possa ser correctamente interpretada. Se o suporte fsico se deteriorar ou se se tornar obsoleto a ponto de deixarem de existir perifricos capazes de extrair a informao nele armazenada, incorremos no srio risco dessa informao se perder para sempre [17]. O r e f r e s c a m e n t o de suporte consiste na transferncia de informao de um suporte fsico de armazenamento para outro mais actual antes que o primeiro se deteriore ou se torne irremediavelmente obsoleto [15, 17, 19, 20]. O refrescamento atempado de suporte no constitui uma estratgia de preservao por si s. Dever, em vez disso, ser entendido como um prrequisito para o sucesso de qualquer estratgia de preservao [21]. A frequente verificao da integridade dos suportes fsicos, assim como o seu refrescamento peridico, so consideradas actividades vitais num contexto de preservao digital.

Emulao
As estratgias de emulao baseiam-se essencialmente na utilizao de um software, designado e m u l a d o r , capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software, numa outra que partida seria incompatvel [18]. A grande vantagem desta abordagem est na capacidade

33

de preservar, com um elevado grau de fidelidade, as caractersticas e as funcionalidades do objecto digital original [2]. Tal como acontece em estratgias baseadas na p r e s e r v a o d e t e c n o l o g i a , as tcnicas de e m u l a o centram-se na preservao do objecto lgico no seu formato original. No entanto, este tipo de estratgias no sofre de alguns dos problemas anteriormente enunciados, como por exemplo, o envelhecimento do hardware. Existem essencialmente dois tipos de emuladores: emuladores de sistemas operativos e de hardware. Os primeiros focam-se na reproduo de um sistema operativo por completo permitindo, deste modo, a execuo de diversas aplicaes no contexto de um nico emulador (e.g. Wine [22]). Os segundos visam mimar o comportamento de uma plataforma de hardware, possibilitando que vrios sistemas operativos e correspondentes aplicaes possam ser executados no contexto de um nico emulador (e.g. VMware Workstation [23], Parallels Desktop [24]) [7, 25]. Existem actualmente vrios exemplos de emuladores de plataformas consideradas obsoletas, e.g. ZX Spectrum [26], Nintendo NES [27], entre outras. Rothenberg, um dos principais promotores deste tipo de abordagens, defende um modelo terico capaz de emular plataformas actuais em computadores futuros. O modelo consiste na conservao do objecto digital juntamente com todo o software necessrio sua execuo/apresentao (incluindo o sistema operativo) e na criao de uma especificao abstracta da plataforma de hardware que suporta a execuo desse software. Essa especificao dever ser escrita numa linguagem independente da plataforma e ser suficientemente rica para que um emulador possa ser construdo automaticamente num qualquer computador do futuro [18]. Hendley considera que a emulao apenas deveria ser utilizada em contextos em que a comunidade de interesse valoriza a preservao do ambiente tecnolgico original ou ainda em situaes em que os objectos digitais no

34

so passveis de ser convertidos para formatos contemporneos [17]. Outros autores consideram potencialmente arriscado confiar no software original como forma de preservar objectos digitais, uma vez que este pode ser portador de vrus ou bugs que podero, no futuro, resultar em perdas substanciais de informao [7, 28]. importante reconhecer, tambm, que a criao de especificaes capazes de descrever transversalmente plataformas de hardware no uma tarefa simples de concretizar. Geralmente, implica recorrer a mo-de-obra altamente especializada, o que por si s poder constituir um obstculo considervel para a maioria das organizaes [7, 25, 29]. Para alm disso, a criao de especificaes imprecisas ou incompletas poder impossibilitar a construo futura dos respectivos emuladores [30]. tambm importante salientar que, com o tempo, o prprio emulador ir sofrer de obsolescncia, havendo ento necessidade de o converter para uma nova plataforma ou desenvolver um novo emulador capaz de emular o primeiro [7]. O uso de emuladores parte tambm do pressuposto que os utilizadores do futuro sero capazes de operar adequadamente aplicaes e sistemas operativos h muito desaparecidos. Por exemplo, num futuro prximo ser difcil conceber que os utilizadores estejam aptos a enfrentar as particularidades do sistema operativo MS-DOS [31]. Apesar dos problemas apresentados, as estratgias de emulao continuam a assumir um papel importante na preservao de objectos digitais. Determinados tipos de objectos, especialmente aqueles dotados de caractersticas dinmicas e/ou interactivas, podero exigir o recurso a emuladores como nica forma de assegurar uma experimentao fidedigna [32]. As estratgias de emulao so particularmente relevantes em contextos em que o objecto que se pretende preservar uma aplicao de software, tal como acontece actualmente com um nmero crescente de jogos de computador considerados de valor histrico assinalvel.

35

Migrao/converso
A m i g r a o consiste na () transferncia peridica de material digital de uma dada configurao de hardware/software para uma outra, ou de uma gerao de tecnologia para outra subsequente [15]. Como referido anteriormente, os objectos digitais so constitudos por elementos estruturais e elementos de informao. O formato de um objecto digital constitui a estrutura pela qual estes elementos de informao se encontram organizados. Neste contexto, a migrao pode ser vista como o processo responsvel pela reorganizao dos elementos de informao que constituem um objecto digital [33]. Ao contrrio das estratgias de preservao j apresentadas que procuram cristalizar o objecto digital no seu formato original, as estratgias baseadas em migrao centram-se sobretudo na preservao do seu contedo intelectual, ou seja, na preservao do objecto conceptual [34]. A migrao tem como objectivo manter os objectos digitais compatveis com tecnologias actuais de modo a que um utilizador comum seja capaz de os interpretar sem necessidade de recorrer a artefactos menos convencionais, como por exemplo, emuladores. No entanto, os processos de migrao introduzem algumas desvantagens que devemos considerar. Neste tipo de processos existe uma grande probabilidade de algumas das propriedades que constituem os objectos digitais no serem correctamente transferidas para o formato de destino adoptado [29, 35]. Isto deve-se, sobretudo, a incompatibilidades existentes entre os formatos de origem e destino ou utilizao de conversores incapazes de realizar as suas tarefas adequadamente [33, 36]. Adicionalmente, no espectvel que uma estratgia de migrao possa resolver permanentemente os problemas de preservao. O formato de

36

destino encontra-se, tambm este, sob constante ameaa de se tornar obsoleto o que significa que ser apenas uma questo de tempo at que uma nova migrao tenha de ser administrada. No obstante, a migrao de longe a estratgia de preservao mais aplicada at data e a nica que tem vindo a dar provas da sua eficcia [2]. Existem diversas variantes de migrao que podero ser consideradas: migrao para suportes analgicos, actualizao de verses, converso para formatos concorrentes, normalizao, migrao a-pedido e migrao distribuda.

Migrao para suportes analgicos


A migrao para suportes analgicos consiste na converso de objectos para suportes no digitais com o intuito de aumentar a sua longevidade [15]. Esta estratgia consiste, essencialmente, na reproduo de um objecto digital em papel, microfilme ou qualquer outro suporte analgico de longa durao e concentrar os esforos de preservao em torno do novo suporte. Esta estratgia, no entanto, apenas pode ser aplicada a objectos digitais que possuam uma representao aproximada em suportes analgicos, como por exemplo, documentos de texto ou imagens. Objectos interactivos e/ou dinmicos ficam assim automaticamente excludos deste tipo de estratgias.

Actualizao de verses
bastante comum encontrar aplicaes de software capazes de abrir ou importar objectos digitais produzidos por verses anteriores dessa mesma aplicao. Essas aplicaes permitem geralmente gravar os objectos importados no formato mais actual produzido pela mesma. Esta operao designa-se por a c t u a l i z a o d a v e r s o do formato.

37

A a c t u a l i z a o d e v e r s e s , possivelmente, a estratgia de preservao mais vulgarmente utilizada pelos generalidade dos utilizadores. Essencialmente, consiste em actualizar os materiais digitais produzidos por um determinado software recorrendo a uma verso mais actual do mesmo [7].

Converso para formatos concorrentes


O processo e actualizao de verses geralmente controlado pela organizao que desenvolveu a respectiva aplicao de software. A qualidade da migrao depende, assim, da capacidade dos importadores fornecidos pelo fabricante e do grau de retrocompatibilidade oferecido pelo novo formato. Idealmente, o fabricante deveria assegurar que todos os atributos presentes numa dada verso de um formato se encontram disponveis na nova verso que o vem substituir. No entanto, independentemente do sucesso econmico de um fabricante ou produto de software, os formatos esto constantemente sujeitos a descontinuidade [7]. Uma forma de garantir que os objectos digitais sobrevivem a este tipo de rupturas tecnolgicas consiste em convert-los para formatos de uma linha de produtos concorrente. Existem, no entanto, formatos que no so dependentes de qualquer aplicao de software. Tal, acontece com grande parte dos formatos de imagem (e.g. JPEG, TIFF, PNG). Isto possibilita que os objectos sejam convertidos entre formatos anlogos, independentemente da aplicao utilizada na sua criao.

Normalizao
A n o r m a l i z a o t em como objectivo simplificar o processo de preservao atravs da reduo do nmero de formatos distintos que se encontram no repositrio de objectos digitais [2, 7]. Havendo um nmero controlado de formatos, uma mesma estratgia de preservao poder ser

38

aplicada transversalmente a um maior nmero de objectos digitais, o que poder conduzir a uma reduo generalizada dos custos de preservao [37]. Vejamos um exemplo. Existe um leque variado de opes no que diz respeito a formatos para representao de imagens bidimensionais (e.g. BMP, GIF, JPEG, PNG, TARGA). Se durante o processo de ingesto, todas as imagens digitais forem convertidas para um nico formato, futuras intervenes ao nvel da sua preservao podero ser realizadas de forma mais simples e, consequentemente, mais econmica. A escolha do formato de normalizao um factor determinante no sucesso desta estratgia. Sempre que possvel, devero ser escolhidos formatos conhecidos pela comunidade de interesse e baseados em normas internacionais abertas [29]. Isto poder evitar futuras complicaes a nvel de direitos de autor ou pagamento de royalties [38]. Paralelamente, o formato de normalizao dever ser suficientemente rico para que as caractersticas fundamentais dos vrios formatos possam ser devidamente incorporadas. A normalizao promove, tambm, a interoperabilidade entre sistemas distintos. Ao serem utilizados formatos abertos e independentes da plataforma, diferentes configuraes de hardware e software sero capazes de os interpretar [7, 39]. A normalizao de formatos pode ser implementada de diversas formas. Determinados repositrios procedem converso automtica dos objectos recebidos para um formato nico de preservao. Outros, definem polticas de arquivo que limitam os formatos em que aceitam informao, significando isto, que cabe aos produtores da informao converter os seus objectos digitais para os formatos estipulados [40, 41]. O argumento que suporta esta abordagem assenta no pressuposto de que os produtores de informao sero as entidades mais indicadas para avaliar a qualidade da converso efectuada.

39

Migrao a-pedido
O sucesso de uma migrao depende, fundamentalmente, da qualidade dos conversores utilizados e da capacidade que o formato de destino possui para acomodar o conjunto de propriedades do formato de partida. Poder-se- assumir, no entanto, que sempre que efectuada uma migrao, os objectos digitais resultantes sero de alguma forma diferentes dos objectos de partida. Ao fim de algumas iteraes, os objectos preservados podero ser substancialmente diferentes dos objectos originais (Fig. 8). Para combater este fenmeno de degradao surgiu uma estratgia designada por m i g r a o a - p e d i d o [42]. Neste tipo de migrao, ao invs de as converses serem aplicadas ao objecto mais actual, estas so sempre aplicadas ao objecto original (Fig. 9). Deste modo, se de uma dada converso resultar um objecto substancialmente diferente do original, numa futura converso, o problema poder ser resolvido recorrendo a um conversor de melhor qualidade ou a um formato de destino mais adequado.

Fig. 8 - Degradao do objecto digital ao longo de sucessivas migraes.

Esta abordagem possui como principal vantagem o facto de, uma vez construdo o mdulo de descodificao do conversor (i.e. o mdulo capaz de ler as propriedades do formato de origem), apenas ser necessrio desenvolver os codificadores especficos para cada formato de sada. No obstante, ser necessrio suportar ao longo do tempo um conjunto alargado de conversores de modo a garantir a capacidade de transformar os objectos armazenados

40

nos seus formatos originais para formatos que sirvam adequadamente as necessidades dos seus consumidores.

Fig. 9 - Migrao a-pedido.

Migrao distribuda
Os mais recentes desenvolvimentos no contexto da migrao introduzem arquitecturas distribudas de conversores (Fig. 10). Neste tipo de migrao, existe um conjunto de servios de converso que se encontram acessveis atravs da Internet e que podero ser invocados remotamente recorrendo a uma pequena aplicao-cliente. Existem actualmente vrias iniciativas que visam o desenvolvimento deste tipo de conversores. O Typed Objects Model (TOM) sintetiza um sistema distribudo de conversores, suportado por uma taxionomia de tipos e formatos de objectos, que recorre a agentes mediadores para descobrir e executar converses entre formatos [43]. No Lister Hill National Center for Biomedical Communications foi desenvolvido um Servio Web9 que converte objectos digitais de cinquenta formatos distintos para PDF [44]. Hunter e Choudhury do um passo em frente propondo uma rede de servios de converso suportada por uma descrio semntica que possibilita a sua descoberta e invocao automtica por agentes de software [45].

Do ingls Web Service.

41

Na Universidade do Minho est actualmente a ser desenvolvida uma Arquitectura Orientada ao Servio (SOA) que disponibiliza vrias centenas de servios de converso, avaliao e recomendao [3, 46-50].

Fig. 10 - Migrao distribuda baseada em Servios Web.

Este tipo de migrao apresenta algumas vantagens face s estratgias de migrao mais convencionais, nomeadamente: A utilizao de servios de converso permite esconder as especificidades de cada conversor e da plataforma que o suporta; A criao de servios redundantes assegura a fiabilidade do sistema perante situaes de ruptura parcial; A existncia de mltiplos caminhos de migrao permite soluo resistir ao desaparecimento gradual de parte dos conversores; Este tipo de abordagem compatvel com uma srie de variantes de migrao, como por exemplo, n o r m a l i z a o e migra o a -ped ido; A criao de uma rede global de conversores poder conduzir a uma reduo generalizada dos custos de preservao. Qualquer organizao poder rentabilizar os seus investimentos no

42

desenvolvimento de conversores, publicando-os na rede de servios e cobrando uma pequena taxa pela sua utilizao. Apesar das vantagens apresentadas, a migrao distribuda poder no ser adequada a todos os contextos. Um repositrio de informao digital pode facilmente conter milhares de itens, atingindo nveis de armazenamento na ordem dos mltiplos Terabytes. Transferir atravs da Internet um volume de informao desta natureza acarreta custos que podero ser impeditivos para muitas organizaes. Para alm disso, requisitos em termos de largura de banda, segurana dos dados e tempo de transferncia podero ser factores determinantes no sucesso deste tipo de estratgias.

Encapsulamento
Por vezes, no fcil determinar o valor intrnseco de determinados objectos digitais. Podero passar-se vrios anos at que a comunidade revele um interesse particular por uma determinada coleco de objectos [51]. Durante esse tempo, o material custodiado poder nunca ser consultado. Neste tipo de cenrios, as estratgias de preservao que carecem de uma diligncia contnua (e.g. migrao) podero revelar-se demasiado onerosas. As solues baseadas em encapsulamento procuram resolver esse problema mantendo os objectos digitais inalterados at ao momento em que se tornam efectivamente necessrios. A estratgia de encapsulamento consiste em preservar, juntamente com o objecto digital, toda a informao necessria e suficiente para permitir o futuro desenvolvimento de conversores, visualizadores ou emuladores. Esta informao poder consistir, por exemplo, numa descrio formal e detalhada do formato do objecto preservado [52]. O Formato Universal de Preservao10 (UPF) uma iniciativa que visa criar um formato normalizado para agregar metainformao de preservao junto
10

Do ingls Universal Preservation Format.

43

do objecto digital. Este formato ser independente da aplicao, do sistema operativo e do suporte fsico utilizados para criar e armazenar o objecto digital [53, 54]. Raymond Lorie prope uma alternativa a esta estratgia substituindo a especificao formal por uma aplicao de software compilada para uma m q u i n a v i r t u a l u n i v e r s a l , por exemplo, para a Java Virtual Machine [55, 56]. Esta aplicao na realidade um descodificador e tem como finalidade apresentar uma viso lgica do objecto digital, permitindo deste modo uma navegao simples atravs das suas propriedades. Lorie argumenta que a mquina virtual universal suficientemente simples para que possa ser implementada em qualquer arquitectura de hardware futura.

A Pedra de Rosetta digital


O povo egpcio deixou uma infindvel quantidade de vestgios da sua presena na Terra. No entanto, s a partir do sculo XIX foi possvel decifrar os seus escritos hieroglficos. Tudo aconteceu em 1799 quando um grupo de soldados franceses descobriu no delta do Nilo um bloco de granito que ficou conhecido como a Pedra de Rosetta. Nele encontrava-se escrito em trs lnguas distintas (egpcio hieroglfico, egpcio cursivo e grego clssico) um decreto emitido em 196 a.C. por Ptolomeu V Epifnio. Em 1822 o palegrafo francs Jean-Franois Champollion descodificou a verso egpcia do texto recorrendo aos seus conhecimentos de grego clssico, um idioma bem conhecido dos historiadores da poca [57, 58]. Esta descoberta conduziu descodificao de inmeros outros textos egpcios encontrados nos mais variados locais e suportes (e.g. monumentos, rochas, papiros). Heminger e Robertson propem a utilizao de uma estratgia semelhante para recuperar objectos digitais para os quais no existe informao suficiente sobre o seu formato [51]. Nesta estratgia, em vez de se preservar as regras que permitem descodificar o objecto digital, so reunidas amostras de objectos que sejam representativas do formato que se pretende recuperar.

44

Estas amostras devero existir num formato que possa ser directamente interpretado pelo ser humano. Trata-se do conjunto de referncia, i.e., a verso grega do decreto inscrito na Pedra de Rosetta. Com esta informao seria possvel inferir as regras necessrias para traduzir/converter o objecto original para um qualquer formato contemporneo [7, 59]. Um exemplo de aplicao desta estratgia consiste em imprimir em papel um conjunto representativo de documentos de texto juntamente com a sua representao binria. No futuro, as regras necessrias interpretar e migrar os objectos para um novo formato poderiam ser inferidas, comparando os documentos impressos com a sua representao binria [7]. Esta estratgia dever ser considerada apenas em situaes em que todos os esforos de preservao falharam. Trata-se sobretudo de uma ferramenta de arqueologia digital e no propriamente de uma estratgia de base para preservao de objectos digitais [51].

45

Directrios de formatos
Uma das formas de minimizar a ansiedade de todos os agentes envolvidos em processos de preservao digital consiste na criao de directrios centralizados de informao tcnica sobre formatos digitais. Esta informao inclui, por exemplo, a identificao dos produtores de um dado formato, a sua data de criao, informao sobre as aplicaes que o suportam, especificaes tcnicas, grau de obsolescncia, entre outros. Para alm de disponibilizar este tipo informao, os directrios de formatos podero prestar servios avanados de apoio preservao digital. Por exemplo, um directrio de formatos poder disponibilizar ferramentas capazes de identificar o formato de um dado objecto digital e promover esquemas normalizados para a sua descrio. Poder ainda fornecer especificaes tcnicas sobre formatos, permitindo a qualquer instituio desenvolver descodificadores para os mesmos, bem como disponibilizar um conjunto de informaes relevantes para apoio a actividades de preservao digital, como por exemplo, informao sobre a cota de mercado de um dado

46

formato ou produzir recomendaes quanto aos formatos mais apropriados para preservao a longo-prazo. Existem actualmente diversas iniciativas que visam a construo de directrios deste tipo, como por exemplo, o PRONOM [60], Global Digital Format Registry [61] e o Typed Object Model [43]. O PRONOM11 uma iniciativa dos UK National Archives12 que visa a concentrao de uma grande quantidade de informao sobre produtos de software e seus formatos associados [60, 62]. O PRONOM disponibiliza ainda uma ferramenta que facilita a identificao de formatos (Droid [63]) e promove a utilizao de identificadores nicos para os mesmos. O Global Digital Format Registry13 (GDFR) apresenta-se como uma alternativa aos actuais MIME Media Types14 introduzindo um mecanismo de identificao de formatos mais preciso e rigoroso. O GDFR possui ainda como objectivo a reunio de informao sobre da sintaxe e semntica dos diversos formatos digitais existentes. A sua criao est a cargo de um grupo de trabalho internacional constitudo por membros de diversas bibliotecas e arquivos nacionais, assim como bibliotecas acadmicas, num total de 18 instituies [61].

11 12

http://www.nationalarchives.gov.uk/PRONOM/ Arquivos Nacionais do Reino Unido. 13 http://hul.harvard.edu/gdfr/ 14 Actualmente, o sistema de identificao de formatos mais utilizado o MIME Media Types. Este sistema amplamente utilizado na Internet, nomeadamente, para especificar as regras de codificao/descodificao de documentos anexados a mensagens de correio electrnico e para identificar os formatos de dados trocados durante as transferncias entre browsers e servidores Web. Este sistema, no entanto, no possui a granularidade necessria para identificar de forma unvoca todos os formatos existentes. Por exemplo, todas as verses da famlia PDF da verso 1.0 1.4, PDF/X da verso 1 3, e PDF/A so identificadas pelo mesmo descritor: application/pdf.

47

O projecto Typed Object Model15 (TOM) assenta no pressuposto de que todos os formatos digitais podem ser vistos como objectos (i.e. possuem propriedades e mtodos) e, como tal, ser possvel construir uma arquitectura baseada em herana, capaz de descrever a estrutura de cada formato de dados, as suas instncias e as relaes existentes entre os mesmos [43]. Este projecto introduz uma taxionomia classificativa de formatos e um sistema distribudo de conversores baseado em agentes mediadores. No entanto, no se antev que se possa vir a tornar numa norma de facto, pois a sua implementao bastante residual.

15

http://tom.library.upenn.edu/

48

Autenticidade
O conceito de autenticidade est longe de ser consensual entre os profissionais da preservao. Este poder assumir significados consideravelmente diferentes consoante a comunidade que o manipula. Para um historiador um objecto autntico se a sua identidade e integridade no foram comprometidas, i.e., se for possvel aferir que um objecto realmente aquilo que se prope ser [64]. Esta definio pressupe que o seu contedo verdadeiro e que o seu contexto histrico se encontra devidamente identificado. Em suma, um objecto autntico se estiver conforme o original e se a sua histria custodial tiver sido devidamente documentada ao longo do tempo. Do ponto de vista de um arquivista, a autenticidade de um documento no pressupe uma legitimao da sua veracidade ou at mesmo utilidade. Um arquivista preocupa-se, sobretudo, com a prova que um documento poder constituir. Este poder conter incorreces, erros ou at falsidades, mas isso no invalida a sua importncia como testemunho de que algo aconteceu [65]. Um documento falsificado, por exemplo, pode ser considerado autntico uma vez que constitui prova de que algum falsificou um documento [66].

49

Definies mais abrangentes de autenticidade giram em torno dos conceitos de autenticao, integridade, completude, veracidade, validade, conformidade com o original, significncia e adequabilidade ao fim a que se destina [67]. Em termos genricos, o conceito de a u t e n t i c i d a d e traduz a capacidade de identificar os elementos diplomticos que permitem aferir se um dado objecto autntico. Trata-se da identificao do porqu, do quando, do onde e do por quem de um objecto digital [10]. A autenticidade tem que ver com a capacidade de se conseguir demonstrar que um objecto digital aquilo que se prope ser [37, 68-72]. Para atingir esse objectivo fundamental documentar devidamente a provenincia do objecto, contextualizar a sua existncia, descrever a sua histria custodial e atestar que a sua integridade no foi comprometida, i.e. provar que existe um conjunto de propriedades, consideradas significativas, que foram correctamente preservadas ao longo do tempo [68, 73]. Os problemas associados determinao da autenticidade de um recurso no esto limitados documentao digital. Na idade mdia, por exemplo, a reproduo de livros era realizada manualmente. Cada cpia de um livro apresentava, geralmente, um conjunto de diferenas face ao original. A maior parte dessas diferenas resultavam de infelizes erros de transcrio. No entanto, no seriam raras as vezes em que escrives mais perspicazes introduziam deliberadamente melhorias durante o processo de transcrio do documento [74]. No contexto digital, os problemas relacionados com a autenticidade so em tudo semelhantes aos do mundo analgico. Contudo, a simplicidade com que alteraes podem ser introduzidas, a rapidez com que estas podem ser disseminadas e a dificuldade inerente sua deteco tornam o problema sensivelmente mais complexo. No contexto analgico, o contedo e o suporte so geralmente duas entidades inseparveis. As propriedades fsicas que caracterizam o suporte

50

fornecem, geralmente, pistas suficientes para que a autenticidade do seu contedo possa ser aferida [66]. No mundo digital este tipo de pistas no existe. O ambiente tecnolgico propcio introduo de modificaes provocando um clima generalizado de desconfiana em relao autenticidade deste tipo de material [69, 71, 74, 75]. A preservao de informao no domnio analgico manifesta-se, sobretudo, pela tentativa de conservar o suporte inalterado durante o mximo de tempo possvel. No contexto digital, a preservao do suporte ou da sequncia de bits que constitui o objecto, no condio suficiente para garantir que a informao permanece acessvel, reutilizvel e autntica ao longo do tempo [76]. Preservar informao digital consiste, por vezes, em modificar ou transformar deliberadamente o objecto fsico ou lgico que transporta a mensagem (ver Migrao/converso). Para que essa transformao no produza uma mensagem exageradamente degradada, fundamental definir quais as propriedades da mensagem que devero ser asseguradas durante o processo de transformao. Paralelamente, a informao no um conceito ou substncia concreta. Esta materializa-se atravs de um processo de transformao que eleva um conjunto de smbolos a algo com significado [77]. Para alm disso, a interpretao desse significante est sujeita a influncias adicionais. O hardware e o software que servem de mediadores nesse processo podem diferir substancialmente de consumidor para consumidor [73]. Neste contexto, a definio de e s s n c i a 16 de um objecto digital de extrema importncia, pois caracteriza o conjunto de propriedades que devero ser mantidas e preservadas de forma intacta para que o objecto possa ser considerado autntico [66].

16

Propried ades significat ivas e essncia d e um objecto d i g i t a l so duas expresses vulgarmente utilizadas para representar o mesmo conceito.

51

O conjunto das propriedades significativas no absoluto nem esttico. A sua definio dever ter em conta a natureza da organizao responsvel pela preservao, as caractersticas da coleco e, acima de tudo, os requisitos e exigncias da comunidade de interesse [66, 78]. a definio da e s s n c i a de um objecto digital que dever determinar a forma como o material deve ser preservado [76]. A definio das propriedades significativas de um objecto digital influencia directamente a forma como este dever ser preservado. Quanto maior for o nmero de propriedades significativas, maiores sero os requisitos relativamente infra-estrutura tecnolgica necessria para suportar a preservao [79]. Embora desejvel, a definio de um conjunto de propriedades significativas para cada objecto digital existente num arquivo no economicamente vivel. Torna-se, assim, necessria a criao de polticas de preservao que exprimam, para cada classe de objectos digitais, o conjunto das propriedades significativas que sero asseguradas pelo repositrio [79]. A ttulo de exemplo, considere-se uma biblioteca responsvel por preservar artigos cientficos (o repositrio institucional de uma universidade, por exemplo). Se a sua poltica de preservao apenas especificar a propriedade significativa: preservao do c o n t e d o t e x t u a l d o s a r t i g o s c i e n t f i c o s ; ento, estes estaro a ser adequadamente preservados se apenas os caracteres ASCII17 que os constituem forem conservados. Se por outro lado a poltica de preservao especificar propriedades significativas adicionais como a d i s p o s i o d o t e x t o n a p g i n a ou a sua f o r m a t a o , ento a preservao dos caracteres ASCII deixa de ser

17

American Standard Code for Information Interchange. Trata-se de um conjunto de cdigos capaz de representar letras, dgitos e outros smbolos, amplamente utilizado por computadores para troca de informao textual.

52

suficiente, passando a ser necessrio recorrer a formatos mais complexos, como por exemplo o PDF. Ainda neste contexto surge o conceito de c a n o n i z a o . Lynch apresentao como uma forma de avaliar o sucesso de uma migrao [80]. O formato cannico tem como objectivo representar de forma unvoca as c a r a c t e r s t i c a s e s s e n c i a i s de uma classe de objectos digitais. O formato cannico especifica a ordem e a estrutura das propriedades que constituem os objectos digitais e assume valores por omisso para as propriedades sem valor. O mtodo funciona comparando os objectos cannicos obtidos a partir dos objectos original e convertido (Fig. 11).

Fig. 11 - Verificao da qualidade de uma migrao atravs de canonizao.

Considere-se dois objectos digitais: o original e o convertido. Poder-se- afirmar que o objecto convertido preserva as caractersticas essenciais do objecto original, se os objectos cannicos obtidos a partir de ambos forem em tudo semelhantes [80].

53

Metainformao de preservao
A m e t a i n f o r m a o d e p r e s e r v a o tem como objectivo descrever e documentar os processos e actividades relacionadas com a preservao de materiais digitais. Ou seja, a metainformao de preservao responsvel por reunir, junto do material custodiado, informao detalhada sobre a sua provenincia, autenticidade, actividades de preservao, ambiente tecnolgico e condicionantes legais [68]. No que diz respeito p r o v e n i n c i a , a metainformao de preservao procura descrever a histria custodial dos materiais, i.e. o caminho percorrido por estes materiais desde a sua criao at sua incorporao no repositrio [68]. Esta assume tambm a responsabilidade de garantir a a u t e n t i c i d a d e dos materiais. Para tal, agrega um conjunto de metainformao que descreve detalhadamente todo o tipo de actividades desenvolvidas no interior do repositrio [68].

54

A metainformao de preservao tem tambm como objectivo descrever o a m b i e n t e t e c n o l g i c o (i.e. hardware, sistemas operativos e software que sustenta a correcta apresentao dos objectos), bem como incluir informao sobre todas as contingncias legais que afectam o material custodiado [68]. O modelo de referncia OAIS constituiu um ponto de partida para a discusso em torno da necessidade de criar um conjunto de elementos de metainformao capazes de dar suporte s actividades relacionadas com a preservao digital [12, 68]. Desde ento, diversas instituies tm vindo a propor dicionrios de metainformao que reflectem as necessidades individuais dos projectos em que esto ou estiveram envolvidas [81-83]. Em 2002, o consrcio Online Computer Library Center e Research Libraries Group (OCLC/RLG) consolidou este conhecimento acumulado num nico documento onde se enumeram as diversas classes de informao que devero estar presentes num esquema de metainformao de preservao [84]. A OCLC/RLG constituiu um segundo grupo de trabalho designado PREMIS (PREservation Metadata: Implementation Strategies) com o objectivo de continuar o desenvolvimento deste esquema de metainformao. O grupo de trabalho foi constitudo por um comit internacional com mais de trinta especialistas em preservao digital. Deste trabalho resultou o Dicionrio de Dados PREMIS18, um documento que identifica e descreve um conjunto bsico de elementos de metainformao de suporte preservao digital, bem como um conjunto de recomendaes quanto forma como estes devero ser utilizados no contexto de um arquivo digital [85].

18

Do ingls PREMIS Data Dictionary.

55

O Dicionrio de Dados PREMIS descreve cinco entidades fundamentais: Entidades Intelectuais, Agentes, Eventos, Objectos e Direitos19 (Fig. 12). Uma E n t i d a d e I n t e l e c t u a l um conjunto coerente de informao que pode ser identificado e descrito como uma unidade. Um livro, uma fotografia ou uma base de dados so exemplos do que podemos considerar Entidades Intelectuais. Uma Entidade Intelectual pode conter outras Entidades Intelectuais no seu interior. Um stio Web pode ser constitudo por vrias pginas Web e cada uma destas pode conter diversas fotografias. tambm importante realar que uma Entidade Intelectual pode assumir mais do que uma representao. Uma fotografia, por exemplo, pode existir em formato digital, impressa em papel fotogrfico ou estampada numa T-shirt. A Entidade Intelectual20 que a descreve sempre a mesma, apesar da sua manifestao fsica variar substancialmente.

Entidades Intelectuais

Direitos

Objectos

Agentes

Eventos

Fig. 12 - Entidades do Dicionrio de Dados PREMIS.

19 20

Do ingls Intellectual Entities, Agents, Events, Objects e Rights. De notar o paralelismo entre o conceito de Entidade Intelectual e Objecto Conceptual.

56

A entidade A g e n t e descreve qualquer pessoa, organizao ou aplicao de software que esteja envolvida num Evento de preservao. Por sua vez, um E v e n t o agrega informao sobre as aces de preservao realizadas em torno de um O b j e c t o (e.g. verificao de integridade, migrao, etc.). O registo das aces de preservao, especialmente aquelas que tm como objectivo modificar o objecto digital, considerado uma actividade fundamental para assegurar a autenticidade do mesmo. A entidade O b j e c t o responsvel por descrever o conjunto das representaes ou manifestaes fsicas de uma Entidade Intelectual. Um livro, por exemplo, poder ser representado de diversas formas: atravs de um conjunto de imagens TIFF, em PDF, etc. Um Objecto pode ainda ser dividido de trs subtipos: Representao, Ficheiro ou Sequncia de bits21. Uma R e p r e s e n t a o um conjunto de ficheiros com metainformao estrutural associada que permite que um dado objecto intelectual possa ser consumido recorrendo a software apropriado. Um F i c h e i r o trata-se de um conjunto ordenado de bytes reconhecido por um sistema operativo. Um ficheiro pode ter propriedades associadas tais como: tamanho, data de criao/modificao, permisses de acesso, etc. Por ltimo, uma S e q u n c i a d e b i t s um conjunto de dados coeso e com particular interesse de preservao que pode ser identificado e extrado a partir de um ficheiro, e.g. a faixa de udio de um ficheiro de vdeo. A entidade D i r e i t o s rene informao sobre os direitos de propriedade intelectual e permisses associadas ao objecto digital.

21

Do ingls Representation, File e Bitstream.

57

Avaliao de estratgias de preservao


Apesar do nmero de estratgias de preservao no parar de aumentar, nenhuma destas foi at ao momento seriamente validada ou universalmente aceite [86]. A preferncia por uma alternativa de preservao exige, geralmente, a ponderao de diversos factores, como por exemplo: as caractersticas da coleco, a satisfao da comunidade de interesse ou os custos associados ao processo de preservao [86]. Rauch e Rauber desenvolveram um mtodo capaz de comparar e seleccionar alternativas de preservao tendo em conta as necessidades individuais de cada organizao ou utilizador [86, 87]. O seu trabalho baseado em conceitos de A n l i s e d e U t i l i d a d e [88], um mtodo originalmente desenvolvido para o auxlio tomada de deciso em projectos complexos no domnio da construo civil e economia.

58

Fig. 13 - Exemplo de uma rvore-objectivo ponderada.

O mtodo segue um processo composto pelas seguintes etapas: 1. Inicialmente construda uma rvore-objectivo, i.e. um conjunto de critrios organizados de forma hierrquica que serviro para aferir o grau de adequabilidade de uma dada estratgia de preservao (Fig. 13); Numa segunda fase so associadas unidades de medida a cada um desses critrios, e.g. milmetro, segundo, Mb/s, EURO; A terceira fase consiste na seleco de um conjunto de alternativas que podero ser utilizadas para preservar a coleco de objectos em causa. Estas alternativas sero comparadas e ordenadas de acordo com as necessidades especficas da organizao; No quarto passo, cada uma das alternativas executada face a um conjunto representativo de objectos digitais. O resultado de cada

2. 3.

4.

59

interveno ser ento avaliado luz de cada um dos critrios que constam da rvore-objectivo (Fig. 14 1); 5. 6. No quinto passo, os resultados das avaliaes so normalizados, i.e. transformados em unidades numricas comparveis (Fig. 14 2); No sexto, so atribudas ponderaes percentuais a cada um dos critrios que constituem a rvore-objectivo. Os pesos atribudos representam os requisitos ou preferncias de preservao da organizao e iro determinar a estratgia a adoptar (Fig. 14 3); O passo sete consiste na agregao de valores parciais e totais obtidos a partir das experincias (Fig. 14 4); Finalmente, todas as alternativas so ordenadas mediante o seu grau de adequao face aos requisitos manifestados pela organizao.

7. 8.

Fig. 14 - Processo de seleco de estratgias de preservao. E1 e E2 representam duas estratgias de preservao distintas.

60

importante realar que a construo da rvore-objectivo por si s uma tarefa complexa e morosa, geralmente envolvendo profissionais da rea tecnolgica, arquivstica, produtores de informao e respectivos consumidores. Rauch e Rauber tm promovido a construo de rvores-objectivo para diversas classes de objectos digitais atravs da realizao de workshops no seio de organizaes detentoras de informao digital. Durante esses workshops, um conjunto de pessoas convidado a sugerir critrios de avaliao que consideram importantes no sentido de garantir a preservao de um conjunto concreto de objectos digitais. Estes critrios so ento organizados em classes e subclasses de forma constituir uma rvore-objectivo semelhante apresentada na Fig. 13. A rvore-objectivo da Fig. 13 rene um conjunto de critrios para a avaliao de estratgias de preservao aplicadas a documentos de texto. Nela podemos encontrar critrios relativos ao processo de preservao (e.g. disponibilidade, estabilidade, dbito, custo, etc.), aos formatos envolvidos na preservao (e.g. cota ou taxa de penetrao no mercado, nvel de suporte, se se trata de um formato normalizado, etc.) e critrios relativos aos objectos propriamente ditos (e.g. contedo textual, dimenses da pgina, n de pginas, etc). O ltimo conjunto de critrios pode ser entendido como o conjunto das propriedades significativas relevantes para esta classe de objectos digitais, i.e. documentos de texto. Este mtodo de avaliao pode vir a ser utilizado para construir sistemas automticos de recomendao que possibilitem a pequenas organizaes identificar e implementar estratgias de preservao adequadas conservao dos objectos digitais [47, 48, 50].

61

Sntese e concluso
Este livro tem como objectivo descrever e contextualizar as principais actividades que tm vindo a ser realizadas internacionalmente no domnio da preservao digital. O livro comea por definir p r e s e r v a o d i g i t a l e introduzir o conceito de o b j e c t o d i g i t a l . Este apresentado numa perspectiva semitica, sendo feita uma anlise dos diferentes nveis de abstraco a que pode ser observado: fsico, lgico e conceptual. Esta viso multidimensional do objecto digital promove uma melhor compreenso e enquadramento das diferentes estratgias de preservao apresentadas ao longo desta publicao. De seguida foi apresentado o modelo de referncia OAIS (Open Archival Information System), uma norma internacional que visa a identificao dos principais componentes funcionais e objectos de informao presentes num sistema de arquivo com pretenses de preservao a longo-prazo. O modelo de referncia serviu fundamentalmente para introduzir alguma da notao utilizada ao longo do livro.

62

Foram tambm descritas e contextualizadas as principais estratgias de preservao que tm vindo a ser propostas pela comunidade cientfica, bem como as mais relevantes iniciativas no que toca a directrios de formatos. O livro engloba ainda uma breve discusso sobre a u t e n t i c i d a d e , salientando-se a importncia do conceito de p r o p r i e d a d e s i g n i f i c a t i v a na elaborao de polticas de preservao. Paralelamente, procurar-se- realar a necessidade da utilizao de metainformao como meio para assegurar a autenticidade dos materiais custodiados, dando especial nfase ao Dicionrio de Dados PREMIS. Finalmente, foi apresentado um mtodo que permite avaliar e comparar diferentes estratgias de preservao, ordenando-as de acordo com o seu grau de adequao aos requisitos individuais da instituio que pretende realizar a preservao digital. fundamental realar que existem muitos outros aspectos da preservao que no foram descritos nem to pouco mencionados ao longo desta publicao. Questes como a definio de polticas de preservao, modelos de financiamento, normas de metainformao (descritiva, tcnica, estrutural, administrativa, etc.), requisitos para a certificao de repositrios digitais, ferramentas de preservao, disposies legais e projectos relevantes a nvel nacional e internacional ficaram de fora desta edio. No obstante, a informao presente neste livro suficiente para que o leitor seja capaz de identificar e compreender os principais conceitos associados a esta temtica, bem como divisar estratgias adequadas preservao de classes distintas de objectos digitais. Para alm do disposto, o leitor dever compreender que, apesar do nmero elevado de alternativas de preservao digital apresentadas, continuam a no existir provas conclusivas quanto eficcia de cada uma delas. Para muitas, s o tempo o dir. Mesmo assim, tem-se assistido a uma batalha ideolgica entre aqueles que defendem estratgias baseadas em migrao e os que

63

defendem a utilizao de estratgias de emulao. Esta discusso tem na sua origem, questes relacionadas com a autenticidade e integridade dos materiais. Nas estratgias derivadas da migrao, assume-se que os objectos digitais iro sofrer modificaes ao longo do tempo. Determinadas migraes podero mesmo originar perdas substanciais de informao. Para os defensores da emulao, assumir de antemo que a informao que se procura preservar ser sistematicamente adulterada ao longo do tempo viola os pressupostos mais elementares da preservao [18]. Esta questo, no entanto, no est confinada ao domnio digital. Na arquivstica tradicional, h quem defenda que a preservao do material no seu estado original dever ser considerada como a nica medida de sucesso. H, no entanto, quem opte por transferir os seus materiais para suportes menos volumosos, como por exemplo o microfilme, tomando uma deciso explcita pela poupana de espao em detrimento da originalidade [89]. O material digital, no entanto, possui caractersticas que fazem com que estas questes acabem por ser de certa forma amplificadas. O material digital estruturalmente mais complexo que o seu equivalente analgico. Diferentes tipos de informao podem ser combinados num nico objecto (e.g. texto, vdeo, som) e este, pode ainda, exibir capacidades dinmicas e/ou interactivas. Para alm disso, este pode facilmente ser modificado, desconstrudo e recombinado de formas inovadoras usando software adequado [89]. Apesar de tudo, a preocupao obstinada pela originalidade tem vindo a diminuir medida que aumenta a compreenso generalizada acerca dos processos de preservao. Comea-se a difundir a ideia de que o foco da preservao no dever estar na reteno do objecto fsico original, mas na conservao da experincia sensorial que produzida por esse objecto [29].

64

Neste contexto, Burkel questiona-se sobre o papel da tecnologia no processo de interpretao de informao digital () as entradas e sadas de qualquer sistema digital so na forma de linguagens humanas. A tecnologia e as suas linguagens prprias apenas asseguram um processamento mais eficiente dessa informao no interior do computador [90]. Reforando esta ideia, Thibodeau argumenta que no futuro, tal como hoje, os consumidores desejaro servir-se das tecnologias mais modernas ou daquelas que melhor conhecem para manipular mais eficientemente a informao com que trabalham. A opo por uma estratgia de emulao poder conduzir ao incumprimento desta necessidade bsica [7, 89]. A batalha ideolgica m i g r a o v e r s u s e m u l a o tem, assim, tendncia a esgotar-se. Instala-se o reconhecimento generalizado de que diferentes estratgias preservao devero ser implementadas mediante o contexto especfico da organizao preservadora e o tipo de objectos que se pretendem preservar [91]. A seleco de estratgias de preservao deve ter em conta diversos factores como as caractersticas intrnsecas dos objectos, o custo de implementao e manuteno, os interesses do arquivo e da sua comunidade de interesse, entre outros. Para diversos autores este ltimo ponto de extrema importncia. A informao ter pouca utilidade se no for preservada e disseminada de acordo com as necessidades da sua comunidade de interesse [40, 89, 92]. A tendncia actual vai no sentido de combinar um conjunto de tcnicas como o refrescamento automtico do suporte, a normalizao para formatos de preservao durante o processo de ingesto, a conservao do objecto original (como salvaguarda e para fins arqueolgicos) e migrao a-pedido para adaptar os formatos de preservao (i.e. os Pacotes de Informao de Arquivo) a formatos mais adequados sua disseminao (i.e. Pacotes de Informao de Disseminao) [7]. Os objectos digitais predominantemente dinmicos ou interactivos so geralmente preservados nos seus formatos originais e so utilizadas estratgias de emulao para a sua interpretao [41].

65

Apesar do recente aparecimento de ferramentas de software que auxiliam o processo de arquivo e preservao (e.g. OCLC Digital Archive22, DSpace23, LOCKSS24, Fedora25, Eprints26, PANDAS27, Digital Information Archiving System28 da IBM, JHove29, Droid30, Xena31) ainda se verifica uma escassez assinalvel de produtos comerciais com capacidades de preservao [41]. Isto faz com que cada organizao se sinta de certa forma responsvel pelo desenvolvimento e implementao do seu prprio sistema de preservao, bem como pela definio de polticas de preservao adequadas. A definio de uma poltica de preservao envolve, geralmente, todas as facetas de um arquivo. Implica a criao de polticas de avaliao e seleco de materiais, a identificao de esquemas de metainformao apropriados (e.g. metainformao descritiva, tcnica, de disseminao, estrutural e de preservao), a definio de estratgias de preservao adequadas a cada classe de objectos digitais, a criao de planos de sucesso para a eventualidade da organizao detentora da informao interromper a sua actividade, a utilizao de modelos sustentveis de financiamento, entre outros. Uma poltica de preservao dever descrever claramente as estratgias adoptadas para assegurar a preservao dos materiais a cada um dos nveis de abstraco a que estes podem ser considerados, i.e. fsico, lgico e conceptual, mas tambm a nveis superiores, como o social, o econmico e o organizacional. A tabela que se segue enumera possveis estratgias que

22 23

http://www.oclc.org/digitalarchive/ http://www.dspace.org 24 http://www.lockss.org 25 http://www.fedora.info 26 http://www.eprints.org/software/ 27 http://pandora.nla.gov.au/pandas.html 28 http://www-5.ibm.com/nl/dias/ 29 http://hul.harvard.edu/jhove/ 30 http://www.nationalarchives.gov.uk/aboutapps/pronom/droid.htm 31 http://sourceforge.net/projects/xena

66

podero ser utilizadas para preservar cada um destes nveis de abstraco (Tabela 1).
Nvel de abstraco Fsico Lgico Conceptual Estratgias a aplicar Acondicionamento adequado dos suportes fsicos, utilizao de suportes de longa durao, salas de preveno contra desastres naturais, etc. Refrescamento, backup, replicao local e/ou remota, etc. Migrao, Emulao, Encapsulamento, etc. O sistema de preservao dever ser capaz de impedir ou de corrigir a ocorrncia de erros provocados por operadores ou atacantes externos, e.g. implementao de mecanismos de undo, registo de actividades, autenticao e gesto de permisses, etc. Definio de modelos de financiamento sustentveis. As despesas com a preservao devero fazer parte dos oramentos de base das organizaes. Definio de planos de sucesso que garantam a sobrevivncia dos materiais face eventual de cessao de actividade por parte da organizao detentora.

Social

Econmico

Organizacional

Tabela 1 Possveis estratgias de preservao para cada nvel de abstraco.

No obstante, para alm da definio de uma poltica de preservao e do estabelecimento de estratgias de preservao adequadas, fundamental adoptar um sistema de arquivo digital, i.e. um repositrio capaz de albergar os objectos, bem como facilitar a implementao dessas polticas e respectivas estratgias de preservao. At data, nenhum dos principais repositrios digitais (e.g. DSpace, Fedora, Eprints) facilitam a implementao de polticas de preservao de forma transversal, nem to pouco suportam esquemas de metainformao de preservao, to essenciais para garantir a autenticidade dos materiais. No entanto, oferecem j a capacidade de armazenar, organizar, descrever e disseminar esses materiais. Ser portanto espectvel que a curto prazo estas plataformas passem a incorporar funcionalidades de preservao digital que permitam preservar plenamente e a longo-prazo os materiais digitais armazenados.

67

Glossrio
Arquitectura Orientada ao Servio. Arquitectura de software onde vrios agentes disponibilizam recursos aos restantes participantes da rede sob a forma de servios independentes, invocveis de forma normalizada (ver Servio Web). Arquivo. Organizao responsvel por garantir o acesso continuado informao custodiada. ASCII. American Standard Code for Information Interchange. Conjunto de cdigos capaz de representar letras, dgitos e outros smbolos, amplamente utilizado por computadores para troca de informao textual. Autenticao. Processo responsvel por assegurar que um utilizador, servio ou recurso exactamente aquilo que se prope ser. CD-ROM. Compact Disc Read-Only Memory. Suporte fsico de armazenamento baseado em tecnologia ptica.

68

Comunidade de interesse. Conjunto identificvel de consumidores de informao de um repositrio. Converso. Ver Migrao. Digitalizao. Processo responsvel pela transformao de informao analgica para formato digital. Disco rgido. Suporte de armazenamento de informao digital baseado em tecnologia magntica. DVD. Digital Versatile Disk. Suporte fsico de armazenamento baseado em tecnologia ptica. Fisionomicamente semelhante a um CD-ROM mas com uma capacidade de armazenamento vrias vezes superior. Emulador. Software capaz de reproduzir o comportamento de uma plataforma de hardware e/ou software numa outra que partida seria incompatvel. Encapsulamento. Preservar, juntamente com o objecto digital, a informao necessria e suficiente para permitir o futuro desenvolvimento de conversores, visualizadores ou emuladores. Esta informao poder consistir, por exemplo, numa descrio formal e detalhada do formato do objecto preservado. Estratgia de preservao digital. Abordagem tcnica que garante o acesso continuado informao existente em formatos digitais (ver Migrao, Emulador ou Encapsulamento). Flash-drive. Dispositivo que combina uma memria flash com uma interface USB, vulgarmente utilizado para armazenar informao digital.

69

GIF. Graphics Interchange Format. Formato matricial para representao de imagens digitais. Ingesto. Processo ou componente responsvel pela recepo de material de arquivo. Internet. Rede global de comunicao baseada em protocolos TCP/IP. Java. Linguagem de programao orientada a objectos desenvolvida na dcada de 90. Contrariamente s linguagens de programao convencionais, que so compiladas para cdigo nativo, a linguagem Java compilada para bytecode que executado por uma mquina virtual. JPEG. Joint Photographic Experts Group. Formato matricial para representao de imagens digitais. Material digital. Conjunto de informao ou objectos digitais. Metadados. Ver Metainformao. Metainformao. Informao utilizada para descrever um determinado objecto ou recurso. Migrao. Transferncia peridica de material digital de uma configurao de hardware/software para outra, ou de uma gerao de tecnologia para outra subsequente. Objecto digital. Todo e qualquer objecto de informao que possa ser representado atravs de uma sequncia de dgitos binrios (bitstream). Documentos de texto, fotografias digitais, diagramas vectoriais, bases de dados, sequncias de vdeo e udio, modelos de realidade virtual, pginas Web e jogos ou aplicaes de software so apenas alguns exemplos do que pode ser considerado um objecto digital.

70

Objecto nado-digital. Objecto criado recorrendo apenas a ferramentas ou processos digitais. PDF. Portable Document Format. Formato digital vulgarmente utilizado para representar documentos de texto estruturado, i.e., documentos com tabelas, formatao, imagens, etc. PNG. Portable Network Graphics. Formato matricial para representar imagens digitais. Preservao digital. Conjunto de actividades ou processos responsveis por garantir o acesso continuado e a longo-prazo informao e restante patrimnio cultural existente em formatos digitais. Propriedade significativa. Caracterstica tcnica ou atributo que caracteriza um objecto digital, considerada relevante para efeitos de preservao. Refrescamento. Processo que consiste na cpia de informao de um suporte fsico de armazenamento para outro do mesmo tipo. Repositrio digital. Sistema de informao responsvel por gerir e armazenar material digital. Service Oriented Architecture (SOA). Ver Arquitectura Orientada ao Servio. Servio Web. Forma de partilhar informao onde so utilizados protocolos de ligao e formatos de mensagens normalizados baseados em XML (SOAP). De modo a facilitar a descoberta de servios, estes so geralmente publicados em directrios, vulgarmente designados por UDDI (Universal Description, Discovery and Integration).

71

TARGA. Truevision TGA. Formato matricial utilizado para representar imagens digitais. TIFF. Tagged Image File Format. Formato matricial vulgarmente utilizado para representar imagens digitais. Web service. Ver Servio Web.

72

73

Referncias
[1] A. Proena and S. Lopes, "Digital Preservation," Departamento de Informtica da Universidade da Beira Interior, Covilh, Monography, 2004. K.-H. Lee, O. Slattery, R. Lu, X. Tang and V. McCrary, "The State of the Art and Practice in Digital Preservation," Journal of Research of the National Institute of Standards and Technology, vol. 107, no. 1, pp. 93106, 2002. M. Ferreira, A. A. Baptista and J. C. Ramalho, "Avaliao Automtica de Migrao em Redes Distribudas de Conversores," presented at Conferncia da Associao Portuguesa de Sistemas de Informao (CAPSI), Bragana, Portugal, 2005. Wikipedia contributors, "Betamax," in Wikipedia, The Free Encyclopedia, 2006. [Online]. Available: http://en.wikipedia.org/w/index.php?title=Betamax&oldid=60719 745. A. R. Kenney, N. Y. McGovern, R. Entlich, W. R. Kehoe and E. Olsen, "Digital Preservation Management," 2003. [Online]. Available: http://www.library.cornell.edu/iris/tutorial/dpm/.

[2]

[3]

[4]

[5]

74

[6]

C. Webb, "Guidelines for the Preservation of Digital Heritage," United Nations Educational Scientific and Cultural Organization Information Society Division, 2003. K. Thibodeau, "Overview of Technological Approaches to Digital Preservation and Challenges in Coming Years," presented at The State of Digital Preservation: An International Perspective, Washington D.C., 2002. E. Oltmans, R. J. v. Diessen and H. v. Wijngaarden, "Preservation Functionality in a Digital Archive," presented at Joint ACM/IEEE Conference on Digital Libraries (JCDL'04), 2004. T. v. d. Werf, "Our digital heritage: how authentic should it be?," presented at Victorian Association for Library Automation Inc., Melbourne, 2002. H. Hofman, "A global issue: preservation of digital objects," presented at Korean Association of Archives Management, Seoul, Korea, 2002. B. F. Lavoie, "The Open Archival Information System Reference Model: Introductory Guide," Digital Preservation Coalition, Dublin, USA, Technology Watch Report Watch Series Report 0401, 2004. Consultative Committee for Space Data Systems, Reference Model for an Open Archival Information System (OAIS) - Blue Book. Washington: National Aeronautics and Space Administration, 2002. M. d. L. Saramago, "Metadados para preservao digital e aplicao do modelo OAIS," presented at VIII Congresso da BAD, Estoril, Portugal, 2004. D. Bearman, "Collecting Software: A New challenge for Archives & Museums," Archival Informatics 1, 1987. Task Force on Archiving of Digital Information, Commission on Preservation and Access and Research Libraries Group, Preserving digital information: report of the Task Force on Archiving of Digital

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

75

Information. Washington, D.C.: Commission on Preservation and Access, 1996. [16] D. Swade, "Preserving Software in an Object-Centred Culture," in In History and Electronic Artefacts, E. Higgs, Ed. Oxford: Clarendon Press, 1998, pp. 195-206. T. Hendley, "Comparison of Methods & Costs of Digital Preservation," British Library Research and Innovation Center, West Yorkshire 106, 1998. J. Rothenberg, Commission on Preservation and Access and Council on Library and Information Resources, Avoiding technological quicksand: finding a viable technical foundation for digital preservation: a report to the Council on Library and Information Resources. Washington, DC: Council on Library and Information Resources, 1999. D. Bearman, "Archival Methods," Archives and Museum Informatics, Pittsburgh, Techical Report 1, 1989. D. Woodyard, "Farewell my Floppy: a strategy for migration of digital information," 1998. [Online]. Available: http://www.nla.gov.au/nla/staffpaper/valadw.html. H. Besser, "Digital Preservation of Moving Image Material?," The Journal of the Association of Moving Image Archivists, vol. 1, no. 2, pp. 3955, 2001. Wine development team, "Wine HQ Web site," 1997. [Online]. Available: http://www.winehq.com. [Accessed 2006-10-11] VMWare, "VMWare Workstation Web site," 1998. [Online]. Available: http://www.vmware.com/. Parallels, "Parallels Desktop Web site," 1995. [Online]. Available: http://www.parallels.com. [Accessed 2006-10-12] S. Granger, "Emulation as a Digital Preservation Strategy," D-Lib Magazine, vol. 6, no. 10, 2000.

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

76

[26]

A. Davidson and A. Pollard, "Jasper - ZX Spectrum Emulator," 2005. [Online]. Available: http://www.spectrum.lovely.net/. G. Krijgsman, "Emulator Zone," 2005. [Online]. Available: http://www.emulator-zone.com. A. Waugh, R. Wilkinson, B. Hills and J. Dell'oro, "Preserving Digital Information Forever," presented at Fifth ACM Conference on Digital Libraries, San Antonio, Texas, 2000. H. Heslop, S. Davis and A. Wilson, "An Approach to the Preservation of Digital Records." Camberra, Australia: National Archives of Australia, 2002. D. Holdsworth and P. Wheatley, "Emulation, Preservation and Abstraction," DigiNews, Research Library Group, vol. 5, no. 4, 2001. Microsoft Corporation, "MS-DOS," 1.0 ed, 1981. D. Woodyard, "Digital Preservation: The Australian Experience," presented at Third Conference Digital Library: Positioning the Fountain of Kowledge, Malaysia, 2000. G. W. Lawrence, W. R. Kehoe, O. Y. Rieger, W. H. Walters and A. R. Kenney, "Risk Management of Digital Information: A file format investigation," Council on Library and Information Resources, Washington, DC, 2000. K. Russell, "Digital Preservation and the CEDARS Project Experience," presented at International Conference on Preservation and Long Term Accessibility of Digital Materials, York, England, 2000. M. Hedstrom, "Digital Preservation: Problems and Prospects," Digital Library Network (DLnet), no. 20, 2001. A. Rauber and A. Aschenbrenner, "Part of Our Culture is Born Digital - On Efforts to Preserve it for Future Generations," TRANS - On-line Journal for Cultural Studies., vol. 10, 2001.

[27]

[28]

[29]

[30]

[31] [32]

[33]

[34]

[35]

[36]

77

[37]

H. Hofman, "How to keep digital records understandable and usable through time?," presented at Long-Term Preservation of Electronic Records, Paris, France, 2001. C. Ayre and A. Muir, "The Right to Preserve," D-Lib Magazine, vol. 10, no. 3, 2004. A. G. Howel, "Preserving Digital Information: Challenges and Solutions," Victorian Academic Libraries, Victorian university libraries and State Library of Victoria, 2004. M. Hedstrom, "Digital Preservation: A time bomb for digital libraries," Computers and the Humanities, vol. 31, pp. 189-202, 1998. G. Hodge and E. Frangakis, "Digital Preservation and Permanent Access to Scientific Information: The State of the Practice," International Council for Scientific and Technical Information & CENDI, Report 2004-3: Rev. 05/04, 2004. P. Mellor, P. Wheatley and D. M. Sergeant, "Migration on Request, a Practical Technique for Preservation," presented at ECDL '02: 6th European Conference on Research and Advanced Technology for Digital Libraries, London, UK, 2002. J. M. Ockerbloom, "Mediating Among Diverse Data Formats," in School of Computer Science. Pittsburg: Carnegie Mellon University, 1998, pp. 164. F. L. Walker and G. R. Thoma, "A Web-Based Paradigm for File Migration," presented at IS&T's 2004 Archiving Conference, San Antonio, Texas, USA, 2004. J. Hunter and S. Choudhury, "A Semi-Automated Digital Preservation System based on Semantic Web Services," presented at Joint ACM/IEEE Conference on Digital Libraries (JCDL'04), 2004. M. Ferreira, "Automatic Evaluation of Migration Quality in Distributed Networks of Converters," presented at Doctoral Consorcium of the 9th European Conference on Research and

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

78

Advanced Technology for Digital Libraries (ECDL), Vienna, Austria, 2005. [47] M. Ferreira, A. A. Baptista and J. C. Ramalho, "CRiB: A service oriented architecture for digital preservation outsourcing," presented at XATA - XML: Aplicaes e Tecnologias Associadas, Portalegre, Portugal, 2006. M. Ferreira, "Automatic Evaluation of Migration Quality in Distributed Networks of Converters," Bulletin of the IEEE Technical Committee on Digital Libraries (TCDL), vol. 2, no. 1, 2006. M. Ferreira, "CRiB - Conversion and Recommendation of Digital Object Formats Web site," 2006. [Online]. Available: http://crib.dsi.uminho.pt. M. Ferreira, A. A. Baptista and J. C. Ramalho, "A Foundation for Automatic Digital Preservation," Ariadne, no. 48, 2006. A. R. Heminger and S. B. Robertson, "A Delphi Assessment of the Digital Rosetta Stone Model," presented at 37th Annual Hawaii International Conference on System Sciences (HICSS'04), Big Island, Hawaii, 2004. Digital Preservation Testbed, "Migration: Context and Current Status," The Hague, White Paper, 2001. T. Shepard and D. MacCarn, "The Universal Preservation Format: Background and Fundamentals," presented at Sixth DELOS Workshop, Tomar, Portugal, 1998. T. Shepard and D. MacCarn, "The Universal Preservation Format: A Recommended Practice for Archiving Media and Electronic Records," Boston, 1999. R. A. Lorie, "A Methodology and System for Preserving Digital Data," presented at Second ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL'02), Portland, Oregon, 2002.

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

79

[56]

R. A. Lorie, "Long Term Preservation of Digital Information," presented at First ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL'01), Roanoke, Virginia, USA, 2001. Wikipedia, "Rosetta Stone," 2005. [Online]. Available: http://en.wikipedia.org/wiki/Rosetta_stone. Wikipedia, "Jean-Franois Champollion," 2005. [Online]. Available: http://en.wikipedia.org/wiki/Jean-Fran%E7ois_Champollion. A. R. Heminger and S. B. Robertson, "Digital Rosetta Stone: A Conceptual Model for Maintaining Long-Term Access to Digital Documents," presented at 6th DELOS Workshop, Tomar, Portugal, 1998. UK National Archives, "PRONOM - The file format registry," 2002. [Online]. Available: http://www.nationalarchives.gov.uk/pronom/. S. L. Abrams and D. Seaman, "Towards a global digital format registry," presented at World Library and Information Congress: 69th IFLA General Conference and Council, 2003. J. Darlington, "PRONOM - A Practical Online Compendium of File Formats," RLG DigiNews, vol. 7, no. 5, 2003. UK National Archives, "Droid: Digital Record Object Identification," 1.0 ed. Surrey: UK National Archives, 2005. C. T. Cullen, "Authentication of Digital Objects: Lessons from a Historian's Research," in Authenticity in a Digital Environment. Washington, DC: Council on Library and Information Resources, 2000. P. B. Hirtle, "Archival Authenticity in a Digital Age," in Authenticity in a Digital Environment. Washington, DC: Council on Library and Information Resources, 2000.

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

80

[66]

H. Hofman, "Can Bits and Bytes be Authentic? Preserving the Authenticity of Digital Objects," presented at International Federation of Library Associations Conference, Glasgow, 2002. J. Rothenberg, "Preserving Authentic Digital Information," in Authenticity in a Digital Environment. Washington, DC: Council on Library and Information Resources, 2000. B. Lavoie and R. Gartner, "Technology Watch Report Preservation Metadata," Online Computer Library Center Inc., Oxford University Library Services and Digital Preservation Coalition 05-01, 2005. H. MacNeil, C. Wei, L. Duranti, A. Gilliland-Swetland, M. Guercio, Y. Hackett, B. Hamidzadeh, L. Iacovino, B. Lee, S. McKemmish, J. Roeder, S. Ross, W.-k. Wan and Z. Z. Xiu, "Authenticity Task Force Report," InterPARES Project, Vancouver, Canada, 2001. L. Millar, "Authenticity of electronic records: a report prepared for UNESCO and the International Council on Archives," International Council on Archives, London, UK, 2004. C. Lynch, "Authenticity and Integrity in the Digital Environment: An Exploratory Analysis of the Central Role of Trust," in Authenticity in a Digital Environment. Washington, DC: Council on Library and Information Resources, 2000. Authenticity Task Force, "Requirements for Assessing and Maintaining the Authenticity of Electronic Records," InterPARES Project, Vancouver, Canada, 2002. R. J. v. Diessen and T. v. d. Werf-Davelaar, "Authenticity in a digital environment," Koninklijke Bibliotheek & IBM, Amesterdam, The Netherlands, Report 2, 2002. P. Akester, "Internet law - authenticity of works. Authorship and authenticity in cyberspace," Computer Law & Security Report, vol. 20, no. 6, 2004.

[67]

[68]

[69]

[70]

[71]

[72]

[73]

[74]

81

[75]

P. Graham, "Issues in Digital Archiving," in Preservation: Issues and Planning, R. Pilette and P. Banks, Eds. Chicago: IL: American Library Association, 2000. The Cedars Project Team, "The Cedars Project Report," Consortium of University Research Libraries, UK, 2001. R. J. v. Diessen, "Model Driven Object-Oriented Development of Systems: A Behavioural-Oriented Approach." Hilversum, The Netherlands, 1997. N. Beagrie, M. Bellinger, R. Dale, M. Doerr, M. Hedstrom, M. Jones, A. Kenney, C. Lupovici, K. Russell, C. Webb and D. Woodyard, "Trusted Digital Repositories: Attributes and Responsibilities," Research Libraries Group & Online Computer Library Center, Report, 2002. A. Rusbridge, "Migration on Request," University of Edinburgh Division of Informatics, 4th Year Project Report, 2003. C. Lynch, "Canonicalization: A Fundamental Tool to Facilitate Preservation and Management of Digital Information," D-Lib Magazine, vol. 5, no. 9, 1999. C. Lupovici and J. Masans, "Metadata for the Long Term Preservation of Electronic Publications," NEDLIB Consortium, The Hague, The Netherlands 2, 2000. The Cedars Project Team, "Cedars Guide to Preservation Metadata," The Cedars Project, 2002. National Library of Australia, "Preservation Metadata for Digital Collections," 1999. [Online]. Available: http://www.nla.gov.au/preserve/pmeta.html. OCLC/RLG Preservation Metadata Working Group, "A Metadata Framework to Support the Preservation of Digital Objects," OCLC Online Computer Library Center, Inc., Dublin, USA, 2002.

[76]

[77]

[78]

[79]

[80]

[81]

[82]

[83]

[84]

82

[85]

PREMIS Working Group, "Data dictionary for preservation metadata: final report of the PREMIS Working Group," OCLC Online Computer Library Center & Research Libraries Group, Dublin, Ohio, USA, Final report, 2005. C. Rauch and A. Rauber, "Preserving Digital Media: Towards a Preservation Solution Evaluation Metric," presented at International Conference on Asian Digital Libraries, Shanghai, China, 2004. C. Rauch, F. Pavuza, S. Strodl and A. Rauber, "Evaluating preservation strategies for audio and video files," presented at DELOS Digital Repositories Workshop, Heraklion, Crete, 2005. P. Weirich, B. Skyrms, E. W. Adams, K. Binmore, J. Butterfield, P. Diaconis and W. L. Harper, Decision Space: Multidimensional Utility Analysis. Cambridge, 2001. B. F. Lavoie and L. Dempsey, "Thirteen Ways of Looking at... Digital Preservation," D-Lib Magazine, vol. 10, no. 7/8, 2004. R. Burkel, "The Role of Microfilm in Information Management," Information Management Journal, vol. 37, no. 1, pp. 58-65, 2003. D. Waters, "Good Archives Make Good Scholars: Reflections on Recent Steps Toward the Archiving of Digital Information," presented at The State of Digital Preservation: An International Perspective, Washington D.C., 2002. J. C. Bennett, "A Framework of Data Types and Formats, And Issues Affecting the Long Term Preservation of Digital Material," British Library Research and Innovation Centre, West Yorkshire, UK, Report 50, 1997.

[86]

[87]

[88]

[89]

[90]

[91]

[92]

83

ndice
Acesso, 26 actualizao de verses, 35 Agente, 54 Anlise de Utilidade, 55 aplicaes, 17, 19, 31, 32, 34, 43, 67 arqueologia digital, 42 rvore-objectivo, 56, 57 ASCII, 49 udio, 19, 67 autenticidade, xii, 46, 47, 51, 54, 60, 61 bases de dados, 19, 67 canonizao, 50 caractersticas essenciais, 50 CCSDS, 24 CD, 20, 30, 65, 66 comunidade de interesse, 26 diagramas vectoriais, 19, 67 Direitos, 54 disco rgido, 20, 23, 30 disquete, 20, 30 Documentos de texto, 19, 67 DVD, 17, 20, 23, 66 emulao, 31 emulador, 30, 31, 32 encapsulamento, 28, 40 Entidade Intelectual, 53 essncia de um objecto digital, 49 Evento, 54 Ficheiro, 54 formato, 20 formato cannico, 50 formato de preservao, 36 Formato Universal de Preservao, 40 fotografias digitais, 19, 67 Global Digital Format Registry, 44 hardware, 20, 29, 30, 31, 32, 33, 36, 41, 48, 52, 66, 67 incorporao, 25, 51

84

informao, xi, xii, 16, 17, 18, 19, 24, 25, 26, 27, 30, 32, 33, 36, 39, 40, 41, 43, 44, 48, 51, 52, 54, 59, 61, 62, 65, 66, 67, 68 Informao Descritiva, 26 Ingesto, 25, 67 ISO, 24 Java Virtual Machine, 41 JPEG, 23, 35, 36, 67 mquina virtual universal, 41 metainformao, 40 metainformao de preservao, 51 migrao, 28, 33, 34, 35, 37, 38, 39, 40, 50, 60, 61, 62 migrao a-pedido, 34, 37, 39, 62 migrao para suportes analgicos, 34 MIME, 44 MS-DOS, 32 normalizao, 34, 35, 36, 39, 62 OAIS, xi, 24, 25, 26, 52, 59 Objecto, 54 objecto conceptual, 21, 22, 23, 28, 29, 33 objecto digital, xi, 19, 20, 21, 22, 23, 29, 30, 31, 33, 34, 37, 40, 41, 47, 48, 49, 54, 59, 66, 67, 68 objecto experimentado, 21 objecto fsico, 20, 28, 48, 61 objecto lgico, 20 objecto semntico, 21 objectos conceptuais, 21 objectos digitais, 20, 27, 28, 29, 32, 33, 34, 35, 36, 37, 38, 40, 41, 42, 49, 50, 56, 61, 62, 63, 67

OCLC/RLG, 52 Pacote de Informao de Arquivo, 26 Pacotes de Informao de Disseminao, 27 PDF, 38, 44, 49, 68 Pedra de Rosetta, 41 Planeamento de Preservao, 26 PNG, 23, 35, 36, 68 polticas, xii, 26, 36, 49, 60, 63 populao potencialmente utilizadora, 26 PREMIS, xii, 52, 53, 60 preservao digital, iv, xi, 18, 22, 24, 28, 29, 30, 32, 43, 52, 66 propriedades significativas, 48, 49 provenincia, 51 realidade virtual, 19, 67 refrescamento, 30 repositrio, 25, 26, 27, 35, 39, 49, 51 Repositrio de Dados, 26 Representao, 54 Sequncia de bits, 54 Servios, 39 software, 17, 19, 20, 29, 30, 31, 32, 33, 34, 35, 36, 38, 41, 44, 48, 52, 54, 63, 65, 66, 67 submisso, 25 suporte fsico, 20, 22, 30, 40, 68 Thibodeau, 28, 62 TIFF, 23, 35, 69 TOM, 38, 45 Typed Objects Model, 38 Universidade do Minho, iv, ix, 38 vdeo, 16, 19, 61, 67 Web, 19, 38, 39, 44, 65, 67, 68, 69

85

86

87

88