Você está na página 1de 356

Universidade de Braslia

Faculdade de Economia, Administrao, Contabilidade e Cincia da


Informao e Documentao
Departamento de Cincia da Informao e Documentao





Miguel ngel Mrdero Arellano




CRITRIOS PARA A PRESERVAO DIGITAL DA
INFORMAO CIENTFICA













Braslia DF
2008




Universidade de Braslia
Faculdade de Economia, Administrao, Contabilidade e Cincia da Informao e
Documentao
Departamento de Cincia da Informao e Documentao




CRITRIOS PARA A PRESERVAO DIGITAL DA
INFORMAO CIENTFICA



Miguel ngel Mrdero Arellano


Tese apresentada ao Programa de Ps-Graduao
em Cincia da Informao, do Departamento de
Cincia da Informao e Documentao da
Universidade de Braslia como requisito parcial para
obteno do grau de Doutor em Cincia da
Informao.

Orientador: Prof. Dr. Murilo Bastos da Cunha



rea de concentrao: Transferncia da Informao
Linha de pesquisa: Gesto da Informao e do Conhecimento





Braslia DF
2008























Mrdero Arellano, Miguel ngel.

Critrios para a preservao digital da informao cientfica / Miguel
ngel Mrdero Arellano. Braslia: Universidade de Braslia, 2008.
xix, 354 f. : il.

Tese (Doutorado em Cincia da Informao) Universidade de
Braslia.
Possui grficos, tabelas e referncias.


1. Preservao Digital. 2. Critrios de Preservao Digital. 3. Repositrio
Digital. 4. Modelo de Referncia OAIS. 5. Informao Cientfica. 6. MCT.





ii



iii




Agradecimentos

Ao meu orientador, professor Murilo Bastos da Cunha
Aos professores e funcionrios do CID-UnB
A minha amiga, bibliotecria e proofreader, Tereza Walter
A minha amiga, colega e revisora, Margaret de Palermo
A minha amiga, colega e bibliotecria da BPCT, Elise do Nascimento
Aos colegas e chefes do Ibict
Aos colegas das unidades de pesquisa do MCT

Aos amigos de longe e de perto
Aos humanos e animais que gostam de mim...











Confiana - o senhor sabe - no se tira das coisas feitas ou perfeitas;
ela rodeia o quente da pessoa

Joo Guimares Rosa
GRANDE SERTO: VEREDAS
(pg. 49)



iv
RESUMO
O presente trabalho tentou responder ao desafio de identificar um conjunto de
critrios de preservao digital essenciais para os sistemas de informao cientfica
nas unidades de pesquisa do Ministrio da Cincia e Tecnologia do Brasil. Para a
elaborao da proposta de critrios, formularam-se quatro objetivos especficos: a)
caracterizar o estado atual das prticas de preservao digital; b) identificar na
literatura cientfica os critrios usados na construo dos sistemas de preservao
digital em funcionamento; c) identificar as necessidades de preservao digital do
grupo de instituies selecionadas para o estudo, e d) identificar os conceitos e
aplicaes usados que podem interferir ou no na implementao de procedimentos
padronizados de preservao digital da informao cientfica. Constatou-se, por
meio da reviso da literatura, a inexistncia de avaliaes dos fundamentos tericos
dos critrios e requisitos de preservao digital adotados em projetos internacionais,
e que so poucos os estudos que calculam os benefcios observados em sua
aplicao. Tanto a arquivologia quanto a cincia da informao tm na preservao
digital um objeto de estudo que engloba todas as tarefas envolvidas no fluxo
informacional, mas so reas que esto comeando a propor padres, normas,
polticas e procedimentos para o arquivamento digital. Um critrio que se destaca no
desenvolvimento das prticas de preservao digital citadas na literatura o da
confiabilidade, determinante na formao do conjunto de critrios aqui propostos. A
metodologia adotada baseou-se no uso das tcnicas de questionrio, entrevista,
observao e anlise etnogrfica de contedo, sob a perspectiva de David Altheide.
Para poder conhecer as abordagens tericas e metodolgicas que tm sido
publicadas, realizou-se um estudo bibliomtrico descritivo, coletando dados de
referncias bibliogrficas sobre o tema da preservao digital do perodo de 1996
at 2007. A anlise dessa produo cientfica utilizou o Statistical Package for the
Social Sciences-SPSS. A anlise dos dados qualitativos coletados na pesquisa de
campo mostrou que a maioria dos responsveis pelos centros de informao e
bibliotecas do Ministrio da Cincia e Tecnologia percebe a preservao digital como
os procedimentos relacionados com a capacidade de armazenamento, migrao e
disseminao de contedos que, em sua maioria, so administrados de forma
centralizada. Apenas os representantes de uma instituio reconheceram a
importncia das polticas institucionais na definio das funes de insero e
gerenciamento dos contedos arquivados na sua biblioteca digital. Os critrios de
preservao digital propostos esto relacionados aos aspectos institucionais
(Confiabilidade, Responsabilidade Poltica e Sustentabilidade Econmica) e aos
aspectos gerenciais (Incluso em repositrios digitais, Transparncia e
Acessibilidade de longo prazo). Estes critrios so considerados elementos
determinantes das propriedades relativas aos sistemas de gerenciamento de
informao cientfica. Entre as sugestes para estudos futuros, recomenda-se o
desenvolvimento de pesquisas sobre a aprendizagem e aplicao de normas e
padres pelos integrantes das equipes que gerenciam os sistemas de informao
cientfica do governo, a incluso de uma discusso detalhada sobre metadados de
preservao para informao cientfica e sobre o gerenciamento de longo prazo dos
direitos autorais no ambiente digital.

Palavras-chave: Preservao digital. Critrios de preservao digital. Repositrio
digital. Modelo de referncia OAIS. Informao cientfica. Ministrio da Cincia e
Tecnologia.


v
ABSTRACT
This thesis aims to propose a Digital Preservation Criteria Set which is crucial for
scientific information systems in the research units of the Science and Technology
Ministry of Brazil. Four objectives were formulated in proposing the criteria: a)
describe the digital preservation procedures currently being used; b) identify in
scientific literature the key criteria used in building digital preservation systems; c)
identify the digital preservation demands from the sampled research units; and d)
identify both concepts and procedures that might interfere with standard digital
preservation procedures of scientific information. A literature review has highlighted
that a theoretical evaluation of both digital preservation criteria and requirements
from international projects is nonexistent. It also highlighted that there are a very
limited number of studies assessing the benefits produced by the application of this
criteria and these requirements. Within the context of digital preservation both
Archivistic and Information Science systems deal with tasks related to information
flow. Only recently, are these areas proposing patterns, norms, policies and
procedures directed to digital archiving. Trustworthy is a criteria for digital
preservation procedures that stands out in the Scientific literature and is critical in
identifying the digital preservation criteria set for scientific information. The proposed
digital preservation criteria set is related to institutional aspects (Trustworthy, Political
Responsibility and Economic Sustainability) and management aspects (Digital
Repository Inclusion, Transparency, and Long-term Accessibility). These criteria are
considered determinant elements in the management proprieties of administration
systems for scientific information. The methodology in data collection included
surveys, interviews, observation, and ethnographic content analysis according to
David Altheide's approach. A descriptive bibliometric study was conducted in order to
identify both the theoretical and methodological approaches in digital preservation
literature from 1996 to 2007. Data analysis was performed using the Statistical
Package for the Social Sciences-SPSS. Qualitative data from field research indicated
that most of the information unit managers consider digital preservation as
procedures related to storage capacity, migration and content dissemination. They
also realize that these procedures are administered in a centralized manner. Only
one research unit's participants recognized the importance of institutional policies in
defining data ingest functions and management of contents archived in the
institutional digital library. Suggestions for future studies include investigating the
acquisition and application of Norms and Standards by government staff responsible
for the administration of scientific information systems and extensive discussions
both on Preservation Metadata relating to scientific information and Long-term
management of propriety rights within the digital environment.


Key-words: Digital preservation. Digital preservation criteria. Digital repository. OAIS
reference model. Scientific Information. Ministrio da Cincia e Tecnologia.





vi
Lista de Figuras

Figura 1 - Contexto das necessidades de preservao digital da ..............
informao cientfica
53
Figura 2 - Expectativa de vida de vrias mdias para armazenamento de
informao
55
Figura 3 - Modelos do processamento nas perspectivas de preservao
digital
60
Figura 4 - Diferenas entre estratgias de preservao ............................. 62
Figura 5 - Um documento digital encapsulado ........................................... 69
Figura 6 - Esquema de metadados da NZNL ............................................. 79
Figura 7- Estrutura de metadados de preservao das UNT Libraries ...... 82
Figura 8 - Registro de metadados da Victorian Electronic Records ...........
Strategy
84
Figura 9 - Ferramenta para extrao de metadados de preservao da ..
NLNZ
86
Figura 10 - Modelo de referncia Open Archival Information System ........
(OAIS) ou Sistema Aberto para Arquivamento de Informao
(SAAI)
90
Figura 11 - Modelo funcional OAIS ............................................................. 91
Figura 12 - Exemplo de monitoramento de caixas LOCKSS ...................... 116
Figura 13 - Pgina do OJS/SEER opo Arquivamento da Revista no .....
LOCKSS
119
Figura 14 - Crescimento dos arquivos/repositrios .................................... 126
Figura 15 - Primeira interface do DSpace da Cornell University ................. 139
Figura 16 - Interface da Biblioteca Digital Memria do INPE ...................... 146
Figura 17 - Ciclo de vida dos objetos digitais ............................................ 151
Figura 18 - Modelo de Repositrio Digital Confivel (TDR) da RLG e
OCLC
180
Figura 19 - Diagrama da integrao dos dois pilares da preservao .......
digital baseado no modelo TDR da RLG-OCLC
181
Figura 20 - Modelo funcional OAIS no projeto SHERPA ............................ 183
Figura 21 - Subtemas e locais das publicaes ......................................... 216
Figura 22 - Contribuio dos Subtemas no perodo 1996 a 2007 .............. 217
Figura 23 - Freqncia do tipo de autoria em funo do ano de ................
publicao
218
Figura 24 - Tipos de propostas apresentadas no perodo 1996 a 2007 ..... 219
Figura 25 - Tipologia de documentos ......................................................... 223
Figura 26 - Tendncia da produo de documentos no perodo 1996 a ....
2007
223
Figura 27 - Tipo de produo em funo do ano de produo ................... 224





vii
Lista de Quadros

Quadro 1 - Relevncia dos requisitos de preservao ............................... 45
Quadro 2 - Expectativa de vida de algumas mdias para fins de ...............
preservao digital
56
Quadro 3 - Mtodos de preservao digital ................................................ 61
Quadro 4 - Ferramentas para editorao eletrnica de revistas ................ 118
Quadro 5 - Estratgias de preservao no fluxo dos objetos digitais na ....
biblioteca digital
123
Quadro 6 - Gerenciamento dos dados preservao digital ........................ 149
Quadro 7 - Estratgias de preservao adotadas pelos 21 sistemas ........
operacionais
159
Quadro 8 - Classificao das unidades de pesquisa do Ministrio da .......
Cincia e Tecnologia
198
Quadro 9 - Local de preservao e acesso da informao cientfica em
formato digital produzida nas unidades de pesquisa do MCT
200
Quadro 10 - Listagem de respondentes das unidades de pesquisa do
MCT entrevistados na fase exploratria e de pesquisa de
campo
207
Quadro 11 - Plano de procedimento de observao .................................. 208
Quadro 12 - Questes debatidas em cada ano do perodo ........................ 221
Quadro 13 - Tipo de material segundo e setor responsvel no centro de ..
informao e biblioteca
231
Quadro 14 - Bases de dados usadas nos centros de informao e ...........
bibliotecas para o registro .. dos materiais bibliogrficos
233
Quadro 15 - Ferramenta de indexao utilizada segundo o tipo de ...........
material
235
Quadro 16 - Tipo de acesso disponibilizado pelas unidades de pesquisa
do MCT segundo o tipo de material
237
Quadro 17 - Formas de tratamento da produo cientfica da unidade de
pesquisa
238
Quadro 18 - Mtodos de preservao aplicados aos materiais .................
bibliogrficos nas unidades de pesquisa
240
Quadro 19 - Listagem de entrevistados das unidades de pesquisa do ......
MCT
249
Quadro 20 - Entrevistados por setor das unidades de pesquisa do MCT .. 252
Quadro 21 - Funo dos entrevistados nas unidades de pesquisa ............ 253
Quadro 22 - Contedo dos documentos produzidos por servidores do .....
MCT sobre preservao digital
272






viii
Lista de Tabelas

Tabela 1 - Produo dos autores em funo dos subtemas de interesse .. 215
Tabela 2 - Freqncia de publicaes e autoria em funo do subtema ... 216
Tabela 3 - Tipos de propostas para preservao digital ............................ 219
Tabela 4 - Questes debatidas no perodo 1996-2007 .............................. 220
Tabela 5 - Propostas e questes debatidas ao longo do perodo 1996-
2007
222
Tabela 6 - Distribuio de freqncia da rea do conhecimento ............... 225
Tabela 7 - Tipos de Publicao em funo da rea de conhecimento ....... 225
Tabela 8 - Ttulo e pas de origem dos peridicos com artigos sobre ........
preservao digital
226
Tabela 9 - Servidores nas bibliotecas das unidades de pesquisa do MCT 245
Tabela 10 - Produo bibliogrfica sobre preservao digital no MCT ......
(1998-2007)
270
























ix
Lista de Abreviaturas e Siglas

ABEC Associao Brasileira de Editores Cientficas
ACII American Standard Code for Information Exchange
AEB Agncia Espacial Brasileira
AEC Anlise Etnogrfica de Contedo
AHDS Arts and Humanities Data Service
AIA Aerospace Industries Association/Boing Co.
AINFO-NTIA
AINFO/National Telecommunications and Information
Administration
AIP American Institute of Physics
AQD Anlise Qualitativa de Documentos
Arc Australian Research Council
ARK Archival Resource Key
ASCII American Standard Code for Information Interchange
ASP Active Server Pages
BDJur Biblioteca Digital Jurdica
BDTD Biblioteca Digital de Teses e Dissertaes
BIREME Centro Latino-Americano e do Caribe de Informao em Cincias
da Sade
BL British Library
BMC BioMed Central
BOAI Budapest Open Archive Initiative
BPCT Biblioteca de Poltica em Cincia e Tecnologia
C&T Cincia e Tecnologia
CAPES Coordenao de Aperfeioamento do Ensino Superior
CBPF Centro Brasileiro de Pesquisas Fsicas
CCSDS Consultative Committee for Space Data Systems
CDI Coordenao de Documentao e Informao Cientfica
CDPP Centre de Donnes de la Physique des Plasmas
CD-R Compact Disk - Recordable
CD-ROM Compact Disk Read Only Memory
CDU Classificao Universal Decimal
CEDAR Consortium of University Research Libraries (CURL) Exemplars
in Digital Archives


x
CEITEC Centro de Excelncia em Tecnologia Eletrnica Avanada
CENDI U.S. Federal Information Managers Group
CENPRA Centro de Pesquisas Renato Archer
CERN European Organization for Nuclear Research
CETEM Centro de Tecnologia Mineral
CGEE Centro de Gesto e Estudos Estratgicos
CGGI Coordenao-Geral de Gesto e Inovao
cgi Computer Graphic Interface
CLIR Council of Library Information Research
CNEN Comisso Nacional de Energia Nuclear
CNPq Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico
CNRI Corporation for National Research Iniciatives
Conarq Conselho Nacional de Arquivos
CORDIS Community Research & Development Information Service
CPA Commission on Preservation and Access
CRiB Conversion and Recommendation of Digital Object Formats
CSDGM Content Standard for Digital Geospatial Metadata
DARPA Defense Advanced Research Projects Agency
DBMS Database Management System
DCC Digital Curation Centre
DIAS Digital Information Archiving Systems Dutch National Library
DICI Dilogo Cientfico (IBICT)
DIOnAS Data Ingest and Online Access Sub-System
DIP Dissemination Information Package
DiVA Electronic Publishing Centre, Uppsala University Library
DOI Digital Object Identifier
DPC Digital Preservation Coalition
DROID Digital Record Object Identification
DRS Digital Rosetta Stone
DTD Document Type Definition
DTIC Defense Technical Information Center
DTS Data Time Stamping
DVD Digital Video Disk


xi
EAD Encoding Archives Description
EBSCO Elton B. Stephens Company
ECPA European Commission on Preservation and Access
EMBRAPA Empresa Brasileira de Pesquisa Agropecuria
ERA Electronic Record Archives
EROS Earth Resources Observation Systems Data Center
ERPANET Electronic Resource Preservation and Access Network
ESD Elsevier Science Direct also part of the Dutch National Library
FAPESP Fundao de Apoio Pesquisa do Estado de So Paulo
Fedora Flexible Extensible Digital Object Repository Architecture
FINEP Financiadora de Estudos e Projetos do Estado de So Paulo
GIF Graphics Interchange Format
GILS Government Information Locator Service
GPO U.S. Government Printing Office
HD-ROM High-Density - Read Only Memory
HP Hewlett-Packard Co.
HTML Hyper Text Markup Language
HTTP Chat & Hyper Text Transfer Protocol
NGO Non Government Organization
Ibict Instituto Brasileiro de Informao em Cincia e Tecnologia
IBM International Business Machines
ICSTI International Council for Scientific and Technical Information
ICT Informao em Cincia e Tecnologia
IDSM Instituto de Desenvolvimento Sustentvel Mamirau
IES Instituio de Ensino Superior
IFLA International Federation of Libraries Association
IMAGE Imager for Magnetopause-to-Aurora Global Exploration
IMLS Institute of Museum and Library Services
IMPA Associao Instituto Nacional de Matemtica Pura e Aplicada
INB Indstrias Nucleares do Brasil
INIST-CNRS
Institut de lInformation Scientifique et Technique
INPA Instituto Nacional de Pesquisas da Amaznia
INPE Instituto Nacional de Pesquisas Espaciais


xii
INSA Instituto Nacional do Semi-rido
INT Instituto Nacional de Tecnologia
InterPARES
The International Research on Permanent Authentic Records in
Electronic Systems
IPR Intellectual Propriety Rights
ISBN Internation Standard Book Number
ISO International Organization for Standadization
IUCR International Union of Crystallography
JISC Joint Information Systems Committee
JPG Joint Photographic Experts
JSTOR Electronic-Archiving Initiative
KB National Library of the Netherlands
KB Koninklijke Bibliotheek
LATEX LAmport Tex
LC Library of Congress
LNA Laboratrio Nacional de Astrofisica
LNCC Laboratrio Nacional de Computao Cientfica
LNLS Laboratrio Nacional de Luz Sncrotron / ABTLus
LOCKSS Lots of Copies Keep Stuff Safe
LOTAR Long Term Archiving and Retrieval and Product Data Within the
Aerospace Industry
LSDA Life Science Data Archive
MAST Museu de Astronomia e Cincias Afins
MCT Ministrio de Cincia e Tecnologia
MD5 Message-Digest algorithm 5 (para criptografar)
METS Metadata Encoding & Transmission Standard
MIME Multipurpose Internet Mail Extensions
MIT Massachussetts Institute of Technology
MITCET Council on Educational Technology
MIX Metadata for Image in XML
MKA Meta Knowledge Archive
MoReq Model Requirements for the Management of Electronic Records
MPEG Museu Paraense Emlio Goeldi
MS DOS Microsoft Disk Operating System
N2T Name-to-thing


xiii
NARA National Archives and Records Administration
NASA Goddard Space Flight Center Library
NDIIP National Digital Information Infrastructure for Preservation
Program
NEDLIB Network European Deposit Library
NEH The National Endowment for the Humanities
NESTOR Network of expertise in Long-Term Storage of Digital Resources
NHPRC National Historical Publications and Records Commission
NISO National Information Standards Organization
NLA National Library of Australia
NLM Profiles in Science, National Library of Medicine
NLNZ National Library of New Zealand
NMM National Motor Museum
NPO National Preservation Office
NSF National Science Foundation
Nuclep Nuclebrs Equipamentos Pesados
NZLS New Zeland Locator Service
OAI Open Archives Initiative
OAI-PMH Open Archive Initiative Protocol Metadata Harvesting
OAIS Open Archive Information System
OARINZ Open Access Repositories in New Zealand
OCLC Online Computer Library Center
OCW Open Courseware
OE Objetivo Especfico
OhioLINK Ohio Library and Information Network
OJS Open Journal Systems
ON Observatrio Nacional
OpenDOAR Directory of Open Access Reposiories
P&D Pesquisa e Desenvolvimento
PAI Pacote de Arquivamento de Informao
PADI Preserving Access to Digital Information
PANDORA Australias Web Archive
PDF Portable Document Format
PDI Pacote de Disseminao de Informao


xiv
PKP Public Knowledge Project
PLANETS Preservation and Long-term Access through Networked Services
PLEDGE PoLicy Enforcement in Data Grid Environments
PPS Photographic Preservation Society
PREMIS Preservation Metadata: Implementation Strategies
PRO Public Record Office
PSI Pacote de Submisso de Informao
PubMed
Central
National Library of Medicine
PURL Persistent Uniform Resource Locators
RDF Resource Description Framework
RI Repositrio Institucional
RIDI Repositrio Institucional Digital do IBICT
RLG Research Library Group
RNP Associao Rede Nacional de Ensino e Pesquisa
ROAR Registry of Open Access Repositories
SAAI Sistema de Arquivamento Aberto de Informao
SBPC Sociedade Brasileira para o Progresso da Cincia
SciELO Scientific Electronic Library Online
SDSC San Diego Supercomputer Center
SEER Sistema Eletrnico de Editorao de Revistas
SGML Standard Generalized Markup Language
SHERPA Securing a Hybrid Environment for Research Preservation and
Access
SIP Pacote de Submisso de Informao
SNBU Seminrio Nacional de Bibliotecas Universitrias
SOA Arquitetura de Servio Orientado
SPSS Statistical Package for Social Sciences
TCC Trabalho de Concluso de Curso
TCI Tesauro da Cincia da Informao
TCL Tool Command Language
TDR Trust Digital Repository
TOM Typed Object Model
TRAC Trustworthy Respository Audit & Certification: Criteria and
Checklist


xv
UNESCO United Nations Educational, Scientific and Cultural Organization
UPS Universal Preprint Service
URL Uniform Resources Location
URLib Uniform Repository for a Library
URN Uniform Resource Name
USP Universidade de So Paulo
VERS Victorian Electronic Records Strategy Austrlia
VHS Video Home System
VRA Visual Resources Association
WEB Sinnimo de World Wide Web
WIPO World Intellectual Property Organization
XING Instituto de Desenvolvimento Cientfico e Tecnolgico Xing
XML Extensible Markup Language




xvi
SUMRIO

AGRADECIMENTOS...................................................................................... iii
RESUMO......................................................................................................... iv
ABSTRACT.................................................................................................... v
LISTA DE FIGURAS...................................................................................... vi
LISTA DE QUADROS.................................................................................... vii
LISTA DE TABELAS...................................................................................... viii
LISTA DE ABREVIATURAS E SIGLAS......................................................... ix

1 INTRODUO ............................................................................... 20
1.1 APRESENTAO DO TEMA ........................................................ 21

1.2 DEFINIO DO PROBLEMA ........................................................ 26

1.3 OBJETIVOS ................................................................................... 29
1.3.1 Objetivo geral ............................................................................... 29
1.3.2 Objetivos especficos .................................................................. 29

2 REVISO DE LITERATURA ......................................................... 30
2.1 CINCIA E PRESERVAO DIGITAL .......................................... 31
2.1.1 Tecnologia e evoluo dos documentos ................................... 36
2.1.2 Arquivologia e preservao digital ............................................ 38
2.1.3 Cincia da informao e preservao digital ............................ 41

2.2 PRESERVAO DIGITAL ............................................................. 43
2.2.1 Preservao da informao em objetos digitais ....................... 43
2.2.2 Necessidades de preservao digital ........................................ 50
2.2.3 Estratgias para a preservao digital ...................................... 54
2.2.3.1 Preservao da seqncia de bits ................................................. 59
2.2.3.2 Preservao da tecnologia e do objeto digital ............................... 61
2.2.3.3 Migrao ........................................................................................ 62
2.2.3.4 Emulao e encapsulamento ......................................................... 68
2.2.3.5 Conservao de hardware e software ........................................... 71
2.2.4 Metadados de preservao ......................................................... 72
2.2.4.1
Iniciativas de implementao de metadados de preservao ....... 82


xvii
2.2.4.2 A norma OAIS ................................................................................ 87

2.3 PRESERVAO DIGITAL DA PRODUO CIENTFICA ............ 99
2.3.1 Preservao digital e acesso livre .............................................. 99
2.3.1.1 OAI e a preservao do acesso de longo prazo ............................ 100
2.3.1.2 Acesso livre e a comunidade cientfica .......................................... 102
2.3.1.3 Autodepsito e preservao digital ................................................ 105
2.3.1.4 Preservao e preservao ...................................................... 107
2.3.1.5 Tecnologias para o acesso livre ..................................................... 109
2.3.2 Preservao de peridicos eletrnicos ..................................... 110
2.3.2.1 Arquivamento de peridicos eletrnicos ........................................ 113
2.3.2.2 LOCKSS ......................................................................................... 114
2.3.2.3 Gerenciamento editorial e preservao digital ............................... 117
2.3.3 Preservao em repositrios digitais ........................................ 120
2.3.3.1 Bibliotecas digitais .......................................................................... 122
2.3.3.2 Repositrios digitais ....................................................................... 124
2.3.3.3 Repositrios institucionais .............................................................. 127
2.3.3.4 Repositrios institucionais nas bibliotecas ..................................... 131
2.3.3.5 Softwares para repositrios institucionais ...................................... 133
2.3.3.6 Repositrios DSpace ..................................................................... 138
2.3.3.7 Repositrios e identificadores persistentes .................................... 143
2.3.3.8 Repositrio uniforme do Inpe ......................................................... 146

2.4 GERENCIAMENTO DA PRESERVAO DIGTAL ....................... 147
2.4.1 Infra-estrutura tecnolgica .......................................................... 153
2.4.2 Infra-estrutura organizacional .................................................... 155
2.4.3 Consolidao das iniciativas de preservao digital ............... 157

2.5 SUSTENTABILIDADE DA PRESERVAO DIGITAL .................. 162
2.5.1 Sustentabilidade comercial ......................................................... 166

2.6 POLTICAS DE PRESERVAO DIGITAL ................................... 169
2.6.1 Permisses para preservar ......................................................... 171


xviii

2.6.2 Gerenciamento dos direitos de propriedade ............................. 174

2.7 MAPEAMENTO DOS CRITRIOS DE PRESERVAO DIGITAL 177
2.7.1 Atributos de repositrios digitais ............................................... 184
2.7.2 Certificao de repositrios digitais .......................................... 185

2.8 CONCLUSES DA REVISO DE LITERATURA .......................... 189

3 METODOLOGIA ............................................................................ 193
3.1 PROBLEMA INVESTIGADO .......................................................... 196

3.2 UNIVERSO DE PESQUISA E AMOSTRA ..................................... 196

3.3 INSTRUMENTOS DE COLETA DE DADOS ................................. 201
3.3.1 Estudo bibliomtrico ................................................................... 201
3.3.2 Questionrios ............................................................................... 202
3.3.3 Pesquisa de campo ...................................................................... 203
3.3.4 Entrevistas .................................................................................... 204
3.3.5 Observaes de curta durao ................................................... 208

4 ANLISE DOS DADOS ................................................................. 210
4.1 ANLISE BIBLIOMTRICA ........................................................... 210
4.1.1 Bibliometria descritiva da preservao digital .......................... 211
4.1.2 Avaliao da produtividade ........................................................ 214
4.1.3 Temticas e questes discutidas ............................................... 228

4.2 ANLISE DOS DADOS DOS QUESTIONRIOS .......................... 229
4.2.1 Caractersticas dos centros de informao .............................. 230
4.2.2 Perfil profissional das equipes ................................................... 243
4.3 ANLISE DOS DADOS DAS ENTREVISTAS ............................... 246
4.3.1 Perfil profissional dos entrevistados ......................................... 250
4.3.2 Anlise dos contedos das entrevistas ..................................... 253
4.3.2.1 Sobre as prprias funes e atividades de preservao ............... 254
4.3.2.2 Sobre o tratamento dos objetos digitais na instituio ................... 258

4.4 ANLISE ETNOGRFICA DE CONTEDO ................................. 262
4.4.1 Observaes de campo .............................................................. 264
4.4.2 Os documentos ............................................................................ 267
4.4.2.1 Materiais de divulgao ................................................................. 268


xix

4.4.2.2 Documentos oficiais ....................................................................... 268
4.4.2.3 Material bibliogrfico ...................................................................... 269
4.4.3 Questes discutidas .................................................................... 270
4.5 DETERMINAO DE CRITRIOS ................................................ 273
4.5.1 Critrios institucionais ................................................................ 276
4.5.1.1 Confiabilidade ................................................................................ 277
4.5.1.2 Responsabilidade poltica .............................................................. 278
4.5.1.3 Sustentabilidade Econmica .......................................................... 279
4.5.1.4 Incluso em repositrios digitais .................................................... 280
4.5.1.5 Transparncia ................................................................................ 281
4.5.1.6 Acessibilidade de longo prazo ....................................................... 282

5 CONCLUSES E SUGESTES ................................................... 284

REFERNCIAS .............................................................................................. 290

APNDICE A Questionrio ....................................................................... 319
APNDICE B Roteiros de entrevistas ..................................................... 321
APNDICE C Lista de projetos e iniciativas de preservao digital .... 323
APNDICE D Centros de informao e bibliotecas das unidades de
pesquisa do Ministrio da Cincia e Tecnologia
330
APNDICE E Produo bibliogrfica dos servidores do Ministrio da
Cincia e Tecnologia sobre a preservao digital
347
APNDICE F Glossrio de termos tcnicos ........................................... 350




20
1 INTRODUO


O propsito desta investigao foi identificar os critrios de preservao
digital estabelecidos nas polticas, programas e projetos internacionais e as
recomendaes que instituies no exterior e no Brasil esto oferecendo para a
preservao da informao cientfica e tecnolgica em formato digital.
Apresentar-se- um trabalho terico sobre o estado-da-arte e sero
aglutinados os critrios de preservao digital, dentro da proposta de um conjunto
mnimo de critrios que possam ser aplicados nas unidades de pesquisa do
Ministrio da Cincia e Tecnologia (MCT).
A proposio inicial apresentar o tema da preservao digital, as
definies conceituais mais utilizadas e sua aplicao na realidade em um tipo
especfico de instituies de pesquisa.
A preservao digital uma preocupao dos profissionais da informao,
devido principalmente ao uso extensivo que tem sido feito das tecnologias digitais e
do registro de informaes em solues cada vez mais sofisticadas e complexas.
Os antecedentes considerados significativos so, especificamente, a
ausncia de trabalhos cientficos que tratem sobre o contexto desses registros e a
falta de padronizao que possa ajudar no tratamento desses dados. A pesquisa a
ser relatada pretende contribuir para as investigaes das transformaes que os
sistemas de informao vm enfrentando.
Para realizar o trabalho, foram selecionados alguns mtodos a serem
empregadas em diferentes momentos da investigao. Em primeiro lugar foram
feitos levantamentos bibliogrficos, principalmente em textos que abrangem os anos
de 1996 ao final de 2007.
Identificados os principais autores e instituies dedicadas pesquisa na
rea, foram realizadas anlises bibliomtricas para se chegar aos produtores das
normas e padres que poderiam ser usados na construo do conjunto de critrios
adequados a um sistema de preservao digital no Brasil.
Nesse sentido, foi preciso conhecer a atuao de um grupo de instituies
cientficas brasileiras, representadas por rgos pblicos as unidades de pesquisa
do Ministrio da Cincia e Tecnologia. Para chegar compreenso de sua
realidade, foram enviados questionrios e realizadas visitas maioria dessas


21
instituies, observando atividades que a equipe responsvel identificou como
relacionadas preservao digital; e, por ltimo, fez-se um registro sonoro das
entrevistas com as pessoas envolvidas com o tratamento dos dados digitais nessas
unidades.
Na anlise dos dados foi mencionada a definio de documento dentro da
tcnica de Anlise Etnogrfica de Contedo (AEC), na qual ele uma representao
simblica que pode ser registrada e recuperada. Essa tcnica utilizada na anlise
de padres de surgimento e uso de conceitos na divulgao de notcias e eventos
ligados a situaes complexas. Nesta pesquisa, a AEC foi usada para conseguir
identificar os padres que levam construo de conceitos relacionados com a
preservao digital, que servem para configurar a noo que as instituies
empregam para justificar as atividades que tm sido aplicadas no tratamento dos
registros digitais.
Este trabalho no pretendeu fazer um levantamento de todos os sistemas
de preservao digital existentes, mas reconhecer, dentre os mais citados na
literatura, os critrios que possam interessar s organizaes que lidam com
informao cientfica em formato digital, os desafios que elas enfrentam na
preservao do acesso e no gerenciamento dos repositrios digitais de registros da
cincia. Espera-se que esses critrios possam contribuir para o desenvolvimento de
sistemas de gerenciamento de preservao e na implementao de polticas,
programas e projetos dedicados ao tema.


1.1 APRESENTAO DO TEMA


O tema desta pesquisa a preservao da informao cientfica em
documentos digitais, para poder formular o conjunto de critrios que caracterizam
sua implementao e funcionamento em instituies de pesquisa do governo
brasileiro. A proposio surge da necessidade de produzir uma estrutura terica e
uma abordagem metodolgica adequada ao problema da preservao da
informao cientfica em formato digital.
A investigao procurou ordenar uma linha de pensamento terica e
conceitual para produzir conhecimentos e instrumentos apropriados para tratar uma


22
parte fundamental do fluxo interno da gesto da informao digital que o
planejamento das atividades de preservao de longo prazo.
Com base em resolues da United Nations Educational, Scientific and
Cultural Organization (UNESCO), como a Carta sobre a Preservao Digital (2003)
e Recomendaes sobre Software Livre para Repositrio e Sistema de
Preservao (2007), pode-se afirmar que existe necessidade urgente de salvar o
patrimnio cultural e cientfico digital, para garantir o acesso a esses recursos s
funcionalidades dos registros eletrnicos autnticos.
Os documentos digitais so frgeis e no existe segurana suficiente nos
sistemas eletrnicos para garantir sua preservao digital de longo prazo. Essa
fragilidade pode estar em sua rpida degradao fsica, na obsolescncia
tecnolgica, na complexidade e nos custos. Tambm deve ser mencionada a
necessidade da formao de profissionais especializados em todas as reas
envolvidas no processo de preservao digital que inclui bibliotecrios, arquivistas,
muselogos e o pessoal de tecnologia da informao.
A dependncia social na informao digital vai alm do simples acesso
rpido aos dados, mas se expressa no uso desses dados como provas das funes
e atividades de pessoas, grupos e instituies.
O problema da preservao digital est no contedo dos objetos digitais,
nas informaes armazenadas e na maneira como foram armazenadas. No so
apenas seqncias de zeros e uns ou cadeias de bits (bitstream)
1
, mas o conjunto
de decises que definiram a formao bsica do objeto informacional como um
objeto nico. Isso envolve a descrio de documentos que podem ser representados
de diferentes formas, mas o seu contedo ser sempre interpretado do mesmo
modo, no momento da sua recuperao, ou seja, ser a mesma cadeia de bits com
seu significado original.
A maioria dos bibliotecrios e arquivistas aceita que a preservao digital
depende de modo geral da migrao de material digital que permite que ele seja
compatvel com novas tecnologias. Mas a migrao muito mais complexa do que
apenas transferir o bitstream de uma mdia para outra. A estrutura interna e o
contedo do material devem ser preservados e transferidos igualmente, para que,
dessa forma, o novo objeto seja uma representao fiel do original.

1
NA: o bit ou dgito binrio a menor unidade de informao utilizada nas reas de computao e
informtica, o bitstream a camada mais elementar para dotar de significado um objeto digital.


23
Os objetos digitais, freqentemente complexos, so compostos de tipos
heterogneos fechados e sem possibilidade de modificao depois de criados. O
que os cientistas apreciam nesses objetos ou formatos pode estar em conflito com
os mtodos de preservao. Isso produz tenso entre cientistas que desejam ter
uma mdia digital viva e respirando e os preservacionistas que apenas querem que
o objeto seja estvel para seu uso infinito.
Os arquivos digitais com informaes cientficas podem ter seu significado
expresso pelos softwares no qual foram criados, j que eles so dependentes
desses programas, mas a sua preservao no apenas salvar o programa que
interpreta o arquivo. Os documentos digitais precisam tambm da mquina na qual
so lidos, complicando ainda mais sua reteno e recuperao.
A dificuldade da preservao digital deve-se principalmente necessidade
de reteno do objeto digital e do seu significado. A carncia maior est na definio
de tcnicas de preservao digital capazes de compreender e reproduzir a forma e a
funo original do objeto, para garantir sua autenticidade e acessibilidade, pois eles
no so apenas objetos fsicos.
Como respostas a esse desafio, surgem estratgias de preservao digital
que procuram incorporar todos os aspectos relacionados ao problema tecnolgico:
custos, legislao, gesto, acesso, polticas e critrios. So formas de reunir
solues parciais ante um problema complexo no qual esto envolvidos, entre outros
itens, a migrao, emulao, arqueologia digital, criptografia, metadados, formatos-
padro e software livre.
O tema da preservao dos documentos digitais est cada vez mais
presente entre os criadores e gerenciadores de colees digitais. Para aqueles que
comeam a enfrentar a possibilidade de no poder recuperar informaes
produzidas h 5 ou 10 anos, vital contar com estratgias que garantam a
persistncia desses dados.
No caso especfico das informaes cientficas, a importncia do registro e
arquivamento dos dados produzidos durante a pesquisa fundamental. Desde que a
internet se estabeleceu como uma plataforma de comunicao entre cientistas e
para a localizao de informaes relevantes para o desenvolvimento da cincia tm
surgido novas formas de organizao de informao digital, contando com o
respaldo de instituies de ensino e pesquisa para sua manuteno e uso
permanente.


24
As tcnicas de preservao que eram conhecidas pelas bibliotecas e
pelos centros de informao se modificaram e encontraram novas prticas num
contexto de rede de computadores, em que a informao no fica apenas num s
lugar. A preservao da informao em formato digital precisa de um conjunto de
prticas tcnicas e de gerenciamento que mudam constantemente.
Com o surgimento de pacotes de software, pode-se afirmar que a rea de
preservao digital est chegando maturidade. Algumas dessas solues saram
das reas da computao e da cincia da informao, como ferramentas e servios
para bibliotecas e arquivos. Entre os sistemas mais citados esto o DSpace, o
Fedora, o LOCKSS (Lots of Copies Keep Stuff Safe), o PANDAS, o OCLC Digital
Archive, e o DIAS (Digital Information Archive System)
2
da IBM. Todos eles
procedem de organizaes de diferentes perfis: provedores de servio para
biblioteca, grupos de pesquisa de bibliotecas especializadas, equipes de repositrios
universitrios e bibliotecas nacionais trabalhando em parceria com empresas
terceirizadas, mostrando a necessidade de integrao entre todos os interessados
no assunto.
Para a informao cientfica, a preservao dos documentos nascidos
digitais ou que so verses de documentos analgicos tem carter de dependncia
das tecnologias existentes, mas tambm, a necessidade de reformulao das
prticas tradicionais de aquisio, armazenamento e acesso.
Pretende-se mostrar neste estudo os aspectos da preservao da
informao cientfica, que tm trazido um conjunto inovador de prticas e de
decises gerenciais que no eram contempladas no passado. A cincia precisa da
preservao dos resultados das pesquisas desenvolvidas por instrumentos
confiveis para que esses resultados possam ser utilizados futuramente por outros
cientistas.
Os subsdios para esta pesquisa vieram da literatura sobre o item
preservao, que destaca alguns temas tratados com freqncia durante o
desenvolvimento das principais iniciativas internacionais.
Apesar da crescente relevncia que os meios e tcnicas digitais de
gerenciamento da informao digital vm assumindo no mundo, existe pouca

2
Muitas Cpias Deixam as Coisas Seguras; Arquivo Digital; Sistema Digital de Arquivamento da
Informao.


25
avaliao dos fundamentos tericos e metodolgicos das estratgias de preservao
digital.
A literatura da rea, em sua ampla maioria, tem sido produzida por
pesquisadores preocupados com a herana cultural e artstica da humanidade. H
necessidade de um corpo de conhecimentos ligado preservao de materiais
digitais, compreendendo o fluxo da informao, o processamento, o acesso e o uso
otimizado. A carncia de trabalhos cientficos avaliando as tecnologias de
preservao de colees importantes de Cincia e Tecnologia (C&T) tem sido
apontada por raros profissionais da informao (GLADNEY, 2006).
Estudos realizados enfocam alguns mtodos de preservao de objetos
digitais e mostram a sua limitao ante o enorme crescimento desses registros.
Tanto nas reas da arquivstica, quanto da cincia da informao, existe ainda o
desafio de estabelecer padres, polticas e estratgias para as melhores prticas de
arquivamento digital.
Atualmente, vrios estudos vm centrando-se no modelo de preservao
digital das bibliotecas e repositrios digitais, enfocando a necessidade de futuros
usurios disporem de materiais autnticos e certificados por instituies
reconhecidas. A descrio em metadados de todos os detalhes que expressem a
histria de criao de um objeto digital est sendo considerada uma metodologia
que pode garantir a autenticidade de um registro eletrnico.
No mbito nacional, a definio das polticas, obrigaes e metodologias
mais apropriadas preservao dos documentos eletrnicos deve levar em
considerao a implementao de modelos, a fim de verificar se eles atendem s
expectativas dos usurios de instituies nacionais de pesquisa. Recomenda-se,
tambm, comprovar se eles esto em concordncia com os padres internacionais
j testados, que promovem a longo prazo o arquivamento digital da produo
cientfica. Tal discusso no pode ficar isolada ou postergada. Ela parte de um
tema de debate internacional que, certamente, deve incluir o Brasil.
Nesta pesquisa pretende-se identificar o conjunto de critrios de
preservao digital a serem propostos s instituies ligadas ao MCT. Esse conjunto
no foi testado nessas organizaes, mas analisaram-se as percepes dos
responsveis pelos acervos digitais nessas instituies, bem como o estado das
colees digitais dessas unidades de pesquisa.



26

1.2 DEFINIO DO PROBLEMA


O problema de investigao do qual parte a presente pesquisa : verificar
quais critrios de preservao digital, usados na construo sistemas de gesto da
informao cientfica e tecnolgica e reconhecidos internacionalmente, podem ser
adotados pelas instituies de pesquisa do Ministrio da Cincia e Tecnologia do
Brasil.
Levar-se- em conta a compreenso da necessidade de preservao dos
responsveis pelos acervos digitais nas unidades de pesquisa governamentais,
identificando os riscos da ausncia de solues adequadas para a possibilidade de
perda dos registros em formato digital.
Na construo dos princpios e prticas relacionadas com o
gerenciamento da informao, as pesquisas na rea de cincia da informao esto
sempre procurando conhecer as novas tendncias nos espaos de informao e
assinalando particularidades sociais e culturais. A cincia da informao tem nas
prticas de preservao de documentos digitais um objeto de estudo que engloba
todas as tarefas envolvidas no fluxo informacional que, aps serem analisadas pelos
pesquisadores, podem chegar a ser pontos focais de originalidade da rea.
A preservao de documentos em formato eletrnico uma das principais
preocupaes de arquivistas e bibliotecrios. A prpria definio do que seria a
preservao digital no tem sido amplamente disseminada (ver item 2.2.1). Isso
obriga qualquer tentativa de trabalho sobre o tema a ter de identificar o que
realmente um objeto digital e o tipo de processo gerencial que ele sofre.
A complexidade do assunto leva consigo o tratamento de temas ligados a
ele, como so os aspectos tecnolgicos, organizacionais e gerenciais. A
heterogeneidade do tema inclui as formas que o objeto digital pode chegar a
apresentar, provocando uma mudana no gerenciamento de acervos
tradicionalmente identificados como estticos, para uma realidade multimdia,
dinmica e interativa. O futuro parece no vislumbrar ainda uma definio de como
esses documentos viro a ser acessados.
Fala-se na preservao digital como um problema complexo, porque
existem muitas variveis a ser consideradas. Entre essas ramificaes, estariam as


27
de ordem conceitual, as normativas, as jurdicas, as administrativas, as operacionais
e as de segurana e integridade. Especificamente as operacionais envolveriam as
relacionadas com o preparo do pessoal tcnico e as tecnologias aplicadas, sem
deixar de lado os usurios (SAYO, 2005).
Segundo Lyman (2002), 93% da informao que est sendo criada nos
anos recentes j se encontra em forma digital ou nasceu digital. O contexto dessa
informao est definido pela natureza do suporte: ele inerentemente frgil, fcil
de corromper ou alterar, requer para seu acesso tecnologias que mudam
constantemente e tem o mesmo valor na preservao que os materiais tradicionais.
No ltimo aspecto, o tempo dedicado preservao menor.
Segundo Hanna (2001) e Wiggins (2001), existem vrias maneiras de
perder os registros digitais, entre elas, reorganizar o contedo (no usar
identificadores de pginas da Internet permanentes), no valorizao da histria
pelos responsveis; manter uma mdia ultrapassada e com sistemas e hardware
obsoletos; esquecer os softwares e os manuais; perder os metadados importantes
com suas formas de indexao e dependncias; no proteger a autenticidade; e
ignorar os custos da preservao.
Os bibliotecrios e arquivistas sentem a necessidade de preservar esses
registros ao longo do tempo, mas eles se encontram indecisos em relao ao tipo de
estratgia a adotar. O questionamento inicial de como preservar os documentos
digitais e seu contedo continua vigente. No caso especfico deste trabalho, o
contedo a informao cientfica e tecnolgica. Pretende-se identificar as
abordagens com relao preservao digital, discutir suas propostas, documentar
as perspectivas publicadas e reunir as opinies dos responsveis por acervos dessa
natureza no Brasil.
Propor critrios para implementao de sistemas de gesto de
preservao digital da produo tcnico-cientfica no Brasil significa tentar responder
s seguintes questes:

1. Como uma percepo da preservao digital se transforma em critrio para
um modelo/sistema de referncia?
2. Como podem ser avaliados os benefcios conseguidos na aplicao dos
critrios de preservao digital num sistema de gesto da informao
cientfica e tecnolgica?


28
3. Qual o estado atual das atividades de preservao dos documentos em
arquivos digitais no Brasil?
4. Como podem ser analisadas as percepes e as aes relacionadas s
necessidades de preservao digital da informao cientfica?
5. Quais so as necessidades e expectativas dos responsveis pelos acervos
digitais de informao em cincia e tecnologia (IC&T)?
6. Quais seriam os critrios constituintes e o modelo de implementao de um
sistema de preservao digital de informao tcnico-cientfica?

Ao enfocar na implementao das prticas de preservao digital, esta
pesquisa objetiva apresentar os critrios que identificam as percepes e as aes
relacionadas com a sua implementao, assim como avaliar a arquitetura das
solues propostas, com as quais se tenta assegurar que os objetos digitais
considerados relevantes para a C&T estejam armazenados de forma a garantir a
perenidade dos seus contedos.
Uma avaliao dos benefcios conseguidos pelas principais iniciativas
internacionais de preservao digital servir na formulao dos critrios que
sustentem a implantao de um sistema, identificando as variveis que caracterizam
este processo. Constituem interesse desta pesquisa as iniciativas nacionais e a
viso de seus responsveis que podem interferir ou no no entendimento do
significado e propsito da preservao digital, assim como no efeito e extenso das
metodologias adotadas e nas aes das instituies.
Com este estudo, objetiva-se mostrar o alcance das estratgias e propor
os critrios apropriados para a preservao de objetos digitais, gerando, assim,
subsdios para as iniciativas nacionais relacionadas manuteno e controle dos
acervos digitais que sejam de importncia estratgica para o desenvolvimento
cientfico e tecnolgico do pas.
Para fins desta pesquisa, a ser efetuada no mbito da cincia da
informao, o esforo investigativo a ser empreendido estar em reunir
conhecimento sobre as necessidades de critrios de preservao digital no contexto
do gerenciamento da informao cientfica e tecnolgica.




29
1.3 OBJETIVOS


1.3.1 Objetivo geral


O objetivo geral da pesquisa formular um conjunto de critrios
necessrios implementao de sistemas de gesto da preservao de informao
cientfica em documentos digitais. Pretende-se determinar as necessidades de
preservao, as tecnologias mais adequadas, os processos de insero,
manuteno, recuperao e acesso aos documentos eletrnicos. A proposta tem
como base os critrios descritos na literatura especializada da rea da cincia da
informao.


1.3.2 Objetivos especficos


A elaborao da proposta de critrios para a construo de um sistema de
gesto de preservao digital da informao cientfica e tecnolgica envolve os
seguintes objetivos especficos:

OE1) caracterizar o estado das prticas de preservao digital da informao
tcnico-cientfica;
OE2) identificar na literatura da rea os critrios para sistemas de gesto de
preservao digital de informao cientfica e tecnolgica;
OE3) identificar as necessidades de preservao digital da informao
tcnico-cientfica das unidades de pesquisa do Ministrio da Cincia e
Tecnologia;
OE4) resgatar os conceitos e aplicaes usados nessas organizaes que
caracterizam suas prticas de preservao, tendo por parmetro as
condies locais que interfiram no entendimento do significado e
propsito da implantao das metodologias de preservao de
documentos digitais.



30
2 REVISO DE LITERATURA


Com o objetivo de caracterizar a preservao digital da informao
tcnico-cientfica, sob a perspectiva da cincia da informao, procurou-se mapear
os fundamentos tericos e metodolgicos das principais iniciativas empreendidas. A
comunidade da cincia da informao vem realizando esforos para introduzir e
definir as prticas e princpios arquivsticos que sustentem prticas consolidadas de
preservao e acesso de longo prazo
3
a documentos em acervos digitais.
A reviso da literatura apresenta uma anlise descritiva das principais
concluses formuladas desde a segunda metade da dcada de 1990 sobre o tema
preservao digital e o acesso informao cientfica em documentos digitais de
longo prazo. So reflexes desenvolvidas por pesquisadores da cincia da
informao e de outras reas, que levam em considerao algumas concepes que
permitiro compreender a preservao digital dentro do ciclo de vida da informao,
influenciadas por determinadas prticas sociais contextualizadas nas duas ltimas
dcadas.
O desenvolvimento dos trabalhos que foram publicados desde 1996 tem
como caracterstica principal o fato de se ter como contexto a disponibilizao on-
line dos acervos de diferentes tipos de instituies de ensino e pesquisa. A internet
permitiu que as prticas de arquivamento eletrnico se expandissem de tal forma,
que os bancos de dados e colees digitais ficassem acessveis a um nmero maior
de pessoas e mtodos de arquivamento. A preservao digital comeou a ser
chamada como tal a partir desse ano.
A produo bibliogrfica consultada se derivou principalmente de projetos
e iniciativas internacionais. Chegou-se assim a um conjunto de fontes de informao
composto pelos seguintes itens:
a) pginas web de projetos e iniciativas de instituies internacionais;
b) catlogos de bibliotecas e repositrios digitais;
c) bases de dados on-line de peridicos das cincias da informao e
computao;

3
Considera-se preservao digital de longo prazo o armazenamento, a manuteno e o acesso dos
recursos digitais, usualmente conseqncia da aplicao de uma ou mais estratgias de preservao
digital, incluindo a migrao de dados ou a emulao tecnolgica (RUSSELL; SERGEANT, 1999).


31
d) referncias bibliogrficas de trabalhos em eventos que tratavam de
assuntos relacionados com a preservao digital.
Foram contemplados documentos oficiais tornados pblicos em forma de
manuais e relatrios, assim como livros, captulos de livros, artigos avaliados pelos
pares e trabalhos apresentados em eventos. Foi constatado que a produo
cientfica sobre o tema no Brasil reduzida
4
. Especificamente neste captulo, as
fontes citadas so algumas das analisadas no levantamento bibliomtrico da
produo cientfica sobre o tema a ser descrito no captulo 4.
Neste captulo sero mencionadas as principais definies usadas para se
referir s atividades que envolvem os documentos, aps a digitalizao do objeto
fsico ou com objetos nascidos j em formato digital; as estratgias adotadas para
atender s necessidades dos responsveis pelos acervos digitais, aquelas que
garantem o acesso constante e a preservao de materiais digitais; passando em
seguida, a mencionar a variedade de sistemas e solues tecnolgicas que tm sido
testados e que esto sendo considerados pela comunidade cientfica como padres
de preservao digital.
Por ltimo, sero citados os projetos e polticas que esto sendo
implantados em instituies que trabalham com informao cientfica. Essa
identificao das tendncias das atividades de preservao digital contribuir na
estruturao do conjunto de critrios necessrios para a construo de sistemas de
preservao digital aplicveis realidade brasileira.


2.1 CINCIA E PRESERVAO DIGITAL


O conhecimento cientfico pode ser obtido por meio de vrios mtodos. O
objetivo de todos eles construir teorias que permitam a explicao, predio e
controle dos eventos de seu domnio. o cruzamento entre conceitos tericos que
pretendem explicar fatos conhecidos e, ocasionalmente, a descoberta de fatos
novos e suas regularidades.

4
A anlise de alguns trabalhos que condensavam as idias gerais sobre o assunto deu como
resultado a publicao de artigos do autor em algumas revistas da rea (MRDERO ARELLANO,
2004; MRDERO ARELLANO; ANDRADE, 2006), trabalhos em eventos (MRDERO ARELLANO;
BOERES, 2005; MRDERO ARELLANO, 2007) e em trabalhos para disciplinas do programa de ps-
graduao da UnB, entre 2004 e 2006.


32
O progresso tcnico-cientfico de uma sociedade pode ser experimentado
nas atividades dirias e nas necessidades humanas s quais ele serve. A prtica
cientfica unida ao avano tecnolgico confere s sociedades graus de controle
sobre o ambiente. Assim como a tecnologia, a cincia se desenvolveu para atender
s necessidades humanas (GRAY, 2005).
A tecnologia tem estado presente na vida humana de vrias maneiras: ela
transforma e materializa percepes do mundo e desejos individuais. No contexto
atual, a tecnologia chega a nveis de ingovernabilidade, e novos conhecimentos so
requeridos para solucionar os problemas decorrentes do seu uso. O antroplogo
Darcy Ribeiro em sua obra O processo civilizatrio, menciona o conceito de
revoluo tecnolgica para indicar que [...] certas transformaes prodigiosas no
equipamento da ao humana sobre a natureza correspondem a alteraes
qualitativas em todo o modo de ser das sociedades [...] (RIBEIRO, 1975, p. 34). As
revolues tecnolgicas modelam um novo espao-tempo, estruturando inovadores
conceitos culturais e sociais.
Nesse avano vertiginoso da tecnologia, propiciado pelo crescente
conhecimento cientfico, as sociedades contemporneas esperam contar com o
domnio de recursos digitais para garantir o acesso de longo prazo a grandes
estoques informacionais. A nossa dependncia da tecnologia moderna nos conduz
ao risco da perda dos registros materiais da investigao racional.
Tambm, esse avano tecnolgico e a produo do conhecimento
cientfico na fase da industrializao da pesquisa, que se inicia na primeira metade
do sculo XX, colocaram em evidncia as instituies encarregadas pela
preservao e disseminao da informao cientfica e tecnolgica (IC&T)
5
.
Com o advento da internet e o desenvolvimento de tecnologias para o
acesso informao cientfica, comearam a ser testadas solues mais orientadas
para o gerenciamento e armazenamento da informao em formato digital. Uma das
questes que tm surgido em torno das novas tecnologias de informao e
comunicao a preservao digital de longo prazo, tema que tem sido tratado sob

5
IC&T, Informao Cientfica e Tecnolgica: a informao que os cientistas e as organizaes de
pesquisa e desenvolvimento (P&D) precisam para desenvolver suas atividades, sendo importante no
estabelecimento de elos entre a gerao de conhecimentos, seu uso e absoro nas diferentes
esferas da economia e da sociedade. Configura ainda as demandas pelas interfaces da produo
cientfico-tecnolgica com o Estado e suas instncias decisrias, no planejamento e gesto de C&T,
destinadas a ampliar a participao da cidadania e suas expresses organizadas nos processos de
elaborao de polticas pblicas (IBICT, 2001).


33
diferentes enfoques. Os estudos sobre essa temtica tm avaliado os obstculos e
benefcios conseguidos na manuteno de servios e controle de recursos de
informao digitais.
Para Chilvers (2000), a confiana que a sociedade acadmica tem
depositado em certos recursos digitais reconhecidos e qualificados pelos pares leva
a certa urgncia na busca por estratgias para desenvolver, gerenciar e preservar
contedos digitais. Ignorar isso, segundo a autora, pode levar perda de dados
nicos e criar grande dispndio financeiro, de tempo e recursos humanos para
recriar tais dados, sem falar dos que j nasceram digitais, que podem tambm ser
perdidos.
A principal meta de quem deseja fazer com que os documentos da cincia
consigam permanecer no tempo colocar os contedos em lugares com algum tipo
de garantia de acesso de longo prazo. Essa premissa mais urgente no caso das
verses eletrnicas da chamada cincia eletrnica (e-science).
A cincia eletrnica tem como meta aproveitar a rapidez das redes
computacionais permitindo o uso de laboratrios virtuais, novos mtodos de trabalho
colaborativo em rede para permitir o avano da cincia. As atividades relacionadas
com a cincia eletrnica requerem um gerenciamento digital de entrada e sada de
dados via simulao de testes e grande volume de informaes sendo distribudas e
usadas massivamente.
Disponibilizar resultados de pesquisas cientficas na web tem levado
criao de iniciativas de arquivamento financiadas por governos no Japo, Canad,
Estados Unidos e Inglaterra (NATIONAL SCIENCE FOUNDATION, 2005).
Especialistas em preservao digital esperam que, com a adeso a esse tipo de
iniciativa, possa construir-se a base de um sistema distribudo de arquivamento e
preservao de dados, chegando criao de servios de curadoria digital
(POTHEN, 2001). O processo de conexo entre a e-science e a necessidade de
preservao dos dados digitais estariam baseados nos repositrios institucionais,
que proveriam o suporte para as atividades de preservao e curadoria
(MESSERSCHMITT, 2003).


34
A criao de repositrios institucionais dentro dos princpios do Movimento
do Acesso Livre
6
serve para facilitar o autodepsito das verses dos trabalhos
(avaliados ou no) dos autores, permitindo um acesso rpido para aqueles que no
possuem condies de pagar uma assinatura. O objetivo principal dos peridicos e
repositrios de acesso livre aumentar o impacto e permitir o acesso imediato aos
resultados de pesquisa.
A indicao do Movimento do Acesso Livre no induzir os autores e
instituies a construir repositrios com a finalidade de preservao de longo prazo
dos originais, mas apenas para garantir o acesso atual e no breve futuro aos
contedos das pesquisas. Aos editores e responsveis pelas bibliotecas assinantes
ou depositrias, corresponderia a construo de revistas de acesso livre, com
polticas claras de autodepsito para os autores, bem como dedicar-se
preservao dos originais e construo de repositrios digitais confiveis.
O Movimento do Acesso Livre informao cientfica prope que a
preservao dos originais no est sob a responsabilidade dos autores nem das
instituies de ensino e pesquisa. A nica opo que esses autores tm a de
permitir que as verses dos seus originais sejam autodepositados nos seus
repositrios institucionais, quer dizer, a sua preocupao de preservao o acesso
de longo prazo, mas no a preservao dos documentos originais.
Para os idealizadores do Movimento do Acesso Livre, os cientistas e as
instituies a que eles pertencem precisam promulgar mandatos de autodepsito,
para permitir o acesso imediato s verses e cpias dos originais aprovados e
publicados em peridicos cientficos. Esse trabalho de autodepsito seria o resultado
da conscincia da importncia do acesso livre informao cientfica imediata e sem
fronteiras financeiras.
Para Harnad (2003), o problema da preservao dos documentos da
cincia tanto em papel como em outros formatos est nas mos dos editores e dos
responsveis pelas bibliotecas depositrias, quem tm a guarda das verses
originais. Os originais em PDF ou Extensible Markup Language (XML) so de
propriedade das editoras e das bibliotecas que assinam as revistas ou que foram
designadas como depositrias das publicaes cientficas. Similarmente, o problema

6
Movimento do Acesso Livre: surgiu no final da dcada com o propsito de derrubar barreiras de
ordem econmica, devido ao elevado custo das assinaturas dos peridicos cientficos. Mais
informaes podem ser obtidas por meio do blog http://kuramoto.wordpress.com



35
da preservao digital no inclui verses que os autores e leitores guardem em suas
instituies e sites na Internet. Elas no tm o mesmo status das verses publicadas
pelas revistas cientficas. No caso das bibliotecas, se elas assinaram uma dessas
revistas, podem ser consideradas bibliotecas assinantes ou depositrias.
A partir desse principio, o Movimento do Acesso Livre deixa clara a
orientao de que a preservao digital deve estar dirigida aos originais dos autores
publicados nas revistas cientficas. A preservao digital dos originais no um
dever dos autores e das instituies, mas uma ao dos editores de peridicos
cientficos.
Temos assim a separao entre os propsitos do Movimento do Acesso
Livre e os da preservao de longo prazo dos artigos publicados em peridicos
cientficos. O Movimento do Acesso Livre preocupa-se com os materiais
suplementares dos documentos publicados, auxiliando os pesquisadores a usar e
citar as verses oficiais que so propriedade das editoras. Para os fundadores desse
movimento seria um desservio induzir o autodepsito pelo argumento da
preservao
7
.
Em 2006, estatsticas mostraram que 85% dos pesquisadores ainda no
depositavam nenhuma verso de seus trabalhos em repositrios institucionais. Isso
poderia ser uma evidncia de que os autores no esto preocupados com o acesso
de longo prazo aos seus resultados. Para muitos deles, as editoras e as bibliotecas
continuam quase que implicitamente responsveis pela guarda desses documentos.
Segundo Harnad (2006), esses pesquisadores no esto preocupados nem com o
acesso de longo prazo nem com a preservao dos originais.
Nos ltimos 10 anos, tem sido grande o desenvolvimento de softwares
para a construo de repositrios digitais na preservao digital dos demais tipos de
documentos produzidos por cientistas. Algumas dessas solues integram
funcionalidades especficas para a preservao digital. Desde 2001 tm sido
propostos atributos necessrios para que esses repositrios possam ser
considerados confiveis na preservao da produo institucional (RESEARCH
LIBRARIES GROUP, 2001; RLG/OCLC, 2002).
Quem tradicionalmente tem assumido a responsabilidade de preservar
dados cientficos em documentos textuais so os editores de peridicos,

7
Self-Archiving FAQ on Preservation: http://www.eprints.org/openaccess/self-faq/#1.Preservation


36
bibliotecrios e administradores de documentos cientficos, que possuem forte
compromisso institucional e conhecimento tcnico, nas tomadas de decises
gerenciais que envolvam a preservao da produo cientfica.
Nas ltimas dcadas esses documentos no esto apenas em papel,
encontram-se em forma de correspondncia eletrnica, arquivos elaborados em
processadores de texto e arquivos multimdia. O material digital, seja aquele que foi
criado em um computador ou digitalizado, est presente na maioria dos servios de
informao (WEBB, 2000).
A informao cientfica em documentos digitais pode ser perdida quando
ela no recebe a ateno adequada, enquanto os hardware, software, as mdias e
suportes continuam a se desenvolver. No caso da preservao dos documentos
digitais autnticos, necessrio que seja mantido tambm o registro do conjunto de
processos que garantem o seu acesso contnuo, confiabilidade e integridade.


2.1.1 Tecnologia e evoluo dos documentos


A cincia no ocorreria sem a documentao da sua prtica. No existiria
nenhum acesso a essa informao sem a mediao documental. Obter informao
significa ter acesso a uma entidade material ou suporte de armazenamento. Uma
conquista inestimvel da humanidade foi a descoberta do papel, que considerado,
at hoje, um dos suportes mais nobres do conhecimento humano. Depois da
inveno do papel, o registro das descobertas sobre a realidade aumentou e
permitiu um uso para fins que no eram os que motivaram sua criao.
Os novos suportes possibilitaram a transferncia dos contedos
informacionais para outras mdias totalmente diferentes da original. A dissoluo da
relao entre a informao e o suporte cada vez mais acentuada. Essa separao
facilita o desaparecimento da informao, que os suportes sejam reutilizados,
proporcionando uma reproduo documental dos originais em inmeras cpias. Na
prtica documental observa-se, tambm, uma ruptura cada vez maior entre a
mensagem e o suporte original. Toda a parte de codificao da mensagem original
exibe a capacidade de reordenamento a cada nova cpia.


37
A chegada das verses eletrnicas de textos publicados em peridicos
cientficos alcanou a mesma faanha, dirigindo o desmembramento do documento
em inmeras verses e formatos de apresentao. Os chamados e-prints foram
definidos como sendo a duplicata digital de um trabalho de pesquisa cientfica,
disponibilizados na internet (on-line) para aumentar o acesso ao documento. Os e-
prints so cpias eletrnicas de trabalhos de pesquisa acadmica, teses ou
dissertaes. Mas a caracterstica fundamental deles que mesmo sendo pr-prints
ou ps-prints, eles foram avaliados pelos pares.
Os e-prints esto disponibilizados, em sua maioria, no formato texto criado
ou convertido por um software processador de textos fcil de usar; so documentos
predominantemente armazenados em formatos PDF, HTML, MS Word, Postscript,
Rich Text Format, ou Latex/Tex. As propriedades desses documentos esto
determinadas pelas possibilidades que o formato digital permitir.
No caso da informao tcnico-cientfica, as novas tecnologias de
informao colocaram em evidncia o papel dos meios e tcnicas digitais de
gerenciamento da informao digital. Os dados cientficos em formatos digitais so
mutveis devido, principalmente, constante apario de novos softwares. Alguns
dos desenvolvedores de software mudam sua arquitetura e perdem algum tipo de
compatibilidade com verses anteriores. Seu efeito nas polticas de preservao,
que exigem a manuteno de formatos digitais acessveis de longo prazo,
influenciar as aes futuras de seus responsveis.
Os problemas j comearam a ser enfrentados pelos responsveis por
acervos digitais. So bibliotecrios e arquivistas que esto aplicando padres e
normas, estratgias de migrao e converso. So os profissionais da informao
que analisam a preservao a partir da necessidade de assegurar seu acesso e
recuperao, como fundamento para a pesquisa acadmica.
Dentro das prticas arquivstica e bibliotecria, a preservao digital um
fenmeno do maior interesse. Na perspectiva da biblioteconomia, a preservao da
informao uma atividade contnua, permitindo que o seu acesso seja permanente
de longo prazo. J na perspectiva arquivstica, a informao retida segundo
critrios de permanncia motivados pelas necessidades do uso para o qual ela foi
criada. A diferena de abordagem tambm inclui uma discusso sobre a importncia
de arquivar apenas parte da informao, mesmo que ela no tenha um valor de uso
comprovado.


38
Apesar das diferenas metodolgicas de tratamento documental entre as
subreas da cincia da Informao (arquivologia e biblioteconomia), muitos
conceitos so convergentes, seja pelo fato de a informao ser o objeto tratado, ou
pela mudana do ambiente (do fsico para o digital) e suporte informacional em
questo.
Trata-se de duas perspectivas profissionais diferentes, que determinam a
forma como os especialistas so treinados para enfrentar problemas. Bibliotecrios
pensam em termos de colees como uma reunio de objetos: um conjunto de livros
que esto se deteriorando. A meta manter os livros ou o contedo dos livros
disponveis no futuro.
Os arquivistas procuram mais por atividades que agregam e processos
que documentam a tomada de deciso de uma instituio. Suas preocupaes so
menos lidar com o objeto individual e mais com a captura da agregao da
documentao e contexto ao redor dos processos, no de documentos isolados,
mas sim de um grupo de evidncias que provem insight das decises e aes.
Particularmente no mundo digital, partes do contexto do arquivamento de longo
prazo ficam escondidas nos sistemas burocrticos internos e na indefinio de
polticas da infra-estrutura tcnica das instituies.


2.1.2 Arquivologia e preservao digital


Em 1997, Levacov estimava que apenas cerca de 1% da informao
arquivada no mundo encontrava-se em formato digital. Com a digitalizao e a
crescente produo de materiais eletrnicos, as instituies esto enfrentando as
exigncias de manter a informao digital facilmente atualizada e sempre disponvel
(ARMS, 2000). Verifica-se em todo o mundo crescente interesse por parte dos
responsveis por sistemas de informao pelo problema da preservao dos
arquivos eletrnicos.
Segundo Santa'Anna (2001) os documentos digitais devem ser
preservados pelo organismo que os criou ou por alguma instituio arquivstica
responsvel pela sua guarda permanente. Para Hedstrom (1996), o planejamento


39
das organizaes deve alocar recursos e aplicar mtodos e tecnologias para garantir
a preservao de seus arquivos.
A perspectiva arquivstica da preservao digital parte da compreenso
dos limites e significados dos documentos (autenticidade, capacidade probatria,
integridade das informaes, contexto de produo e manuteno), dando nfase s
tarefas que as organizaes e instituies arquivsticas que criam e so
responsveis pela guarda permanente desses documentos devem observar para
lidar com objetos digitais autnticos.
Os arquivos administrativos requerem o desenvolvimento de parmetros
de certificao da qualidade dos seus processos e servios. O chamado
arquivamento relacionado com o gerenciamento do armazenamento de registros
passou a estar unido ao termo mais comum arquivo, que atualmente se encontra
mais identificado com o formato eletrnico de documentos (e-print, pre-print e pos-
print). Para SantAnna (2001), responsabilidade dos arquivos adotar medidas
preventivas e corretivas objetivando minimizar a ao do tempo sobre o suporte
fsico da informao, assegurando sua disponibilidade.
As primeiras consideraes sobre a preservao digital partiram da
arquivologia. Fatores como tempo e custo de armazenamento de longo prazo foram
adicionados a decises sobre o volume e formato do material a ser preservado.
Tambm foram os arquivistas que propuseram algumas das caractersticas das
ferramentas necessrias para a proteo, cuidado e manuteno de colees
digitais. Com base no princpio arquivstico da custdia responsvel, essa
comunidade foi a primeira a apoiar o desenvolvimento dos repositrios digitais como
sendo aqueles que reproduzem os espaos fsicos dos arquivos tradicionais
(LAZORCHAK, 2005).
A informao arquivstica tem sido produzida, distribuda e acessada por
meio da infra-estrutura de novas tecnologias de informao e comunicao, h
algum tempo. A materializao (impresso) dessas informaes, quando textuais,
d-se, na maioria das vezes, para que o documento se torne legalmente vlido ou
para que sua leitura ocorra de forma facilitada para aqueles que se incomodam com
longos perodos frente do monitor.
A validade legal de documentos eletrnicos depende de sistemas que
garantam a autenticidade e integridade das informaes neles contidos. Uma vez
assegurada, os legisladores devero comear a regularizar esse aspecto. A leitura


40
ser mais confortvel, medida que a tecnologia se desenvolve, considerando que
prottipos de papis inteligentes vez por outra so anunciados.
Alguns aspectos diferenciam a preservao digital de documentos
bibliogrficos dos documentos arquivsticos. Os arquivos no podem ser montados.
So criados naturalmente pela prpria dinmica de atividades do seu produtor. As
relaes existentes entre os documentos so, portanto, essenciais para a
recuperao e entendimento das informaes que foram registradas e
armazenadas.
Em arquivos, a necessidade de preservar indefinidamente determinado
tipo de documento est fortemente vinculada ao potencial de esse material ser
utilizado posteriormente para uma pesquisa histrica e ou cultural. A arquivologia
retomou o princpio de que nem tudo precisa ser preservado indefinidamente. Para
Dollar (1994), o conceito de documento permanente relativo, quando os custos
de preservao da vida til dos documentos digitais se sobrepem aos benefcios da
sua reteno definitiva.
Na arquivologia, quando se planeja o gerenciamento de um registro,
importante considerar o contexto no qual ele foi criado:
A perspectiva arquivstica traz um sistema de gerenciamento de
conhecimentos registrados que se baseia em evidncia. O sistema
fundamentalmente vinculado aos processos e contextos organizacionais e
pessoais pelos quais registros e conhecimentos so criados, assim como
as maneiras em que os registros refletem estes processos individualmente
e coletivamente. (GILLILAND-SWETLAND, 2000, p. 5).

O que preservado deve ser uma amostra representativa do que foi
produzido, de modo a ser possvel inferir de forma confivel o todo em relao
parte. Em contrapartida, preservar documentos que ainda possuam valor corrente,
isto , administrativo e ou jurdico, tambm uma necessidade de longo prazo
baseada numa tabela de temporalidade. Alguns documentos que devem ser
preservados por causa deste valor revelam-se destinados a estar disponveis por
dcadas.
Desde a dcada de 1990, alguns projetos de gerenciamento de
documentos eletrnicos tm surgido na comunidade arquivstica internacional.
Segundo Rondinelli (2002), essas iniciativas tm produzido conhecimento para o
bom gerenciamento arquivstico no contexto das novas tecnologias da informao.
Segundo esse autor, contribuies de projetos como os das Universidades de


41
Pittsburgh e da British Columbia tm proposto um conjunto de requisitos funcionais
para o gerenciamento de documentos arquivsticos contemporneos, sem deixar
de lado processos arquivsticos tradicionais, como a observncia da fidedignidade e
da autenticidade.
Na arquivologia, a gesto dos documentos eletrnicos constitui uma rea
de pesquisa que tem produzido contribuies relevantes relacionadas com a
preservao de documentos digitais de valor permanente para instituies
pblicas. Alguns exemplos so a criao do padro 5015.2 do Departamento de
Defesa dos Estados Unidos e o Australian Standard 4390-1996 do Arquivo Nacional
da Austrlia, que evoluiria para o padro ISO 15489.
A informao arquivstica, quando possui valor histrico, deve ser
preservada por tempo indeterminado; idealmente deve receber uma ordenao
baseada na estrutura organizacional que a produziu, criando fundos, que muito
podem revelar sobre o funcionamento interno da instituio produtora (BELLOTTO,
2004). Essa organizao difere daquela aplicada aos documentos bibliogrficos. Por
isso, h a necessidade de observncia da natureza da informao digitalizada para
que no se cometam equvocos metodolgicos.


2.1.3 Cincia da informao e preservao digital


O desenvolvimento de atividades de preservao digital requer um
conhecimento refinado das atividades gerenciais das bibliotecas, j que elas
envolvem diversos processos, tais como:
a) aquisio de objetos digitais, publicados ou no, em vrios formatos;
b) armazenamento de muitos objetos digitais comprimidos em gigabytes ou
terabytes de dados;
c) processamento de grande volume de material, por exemplo, migrao de
objetos mltiplos para evitar a obsolescncia dos formatos;
d) disseminao de objetos digitais para usurios de forma fcil, segura e
significativa.
Nos ltimos anos esto sendo testados esquemas conceituais que permitem
identificar as partes integrantes do processo de preservao digital, assim como sua


42
padronizao em modelos de referncia para iniciativas de repositrios e de
bibliotecas digitais.
A preservao digital assume diferentes significados, conforme o contexto.
Para os profissionais da cincia da informao, por exemplo, ela se refere infra-
estrutura e ao comprometimento institucional necessrio para proteger a informao
representada digitalmente enquanto para os especialistas da cincia da computao
ela seria uma maneira de atenuar a obsolescncia tecnolgica e aumentar a
memria humana.
A compreenso sobre os desafios associados a esse tipo de preservao
parece comear a ser mais bem focalizada, mudando da estratgia tecnolgica para
o tema do gerenciamento digital (LAVOIE; DEMPSEY, 2004). Novas questes
surgem dessa atual viso, a qual no considera a preservao digital apenas como
um processo isolado, mas tambm como componente de um conjunto agregado de
servios, polticas e especialistas que constituem o contexto do ciclo de vida da
informao digital.
Na rea da cincia da informao, o uso da tecnologia digital que toma o
lugar dos tradicionais meios de preservao, como a microfilmagem, trouxe consigo
a preocupao com as normas para o uso das tcnicas digitais e sua prontido na
tarefa da preservao de longo prazo (CHEPESUIK, 1997).
A pesquisa sobre sistemas de preservao digital mais um campo de
estudo da cincia da informao. Nele esto refletidas, mais uma vez, as ligaes
interdisciplinares dessa cincia. Por se tratar de experincias iniciais, esses sistemas
demandam abordagens e solues multidisciplinares. A cincia da informao como
prottipo de uma nova cincia est sendo construda por abordagens estratgicas
voltadas para a soluo ou trato de problemas (PINHEIRO; LOUREIRO, 1995). Ela
trata da informao que transportada, conservada no tempo e afetada pelo
imperativo tecnolgico (SARACEVIC, 1992).
A informao que representada, transmitida e recuperada por meio de
mecanismos de comunicao seletiva objeto da pesquisa aplicada na cincia da
informao, assim como o , tambm, o tratamento dos problemas decorrentes do
uso das novas tecnologias de informao e comunicao, nos contextos individual
ou institucional.
Foi Belkin (1978) quem afirmou que o objeto de investigao da cincia da
informao exclusivamente a informao cientfica formalmente documentada.


43
Com o impacto da tecnologia no processamento da informao tcnico-cientfica,
foram levantadas novas questes relacionadas com o gerenciamento, a perenidade
dos registros do conhecimento cientfico e sua acessibilidade.


2.2 PRESERVAO DIGITAL


2.2.1 Preservao da informao em objetos digitais


A preservao um dos grandes desafios do sculo XXI. Durante os
ltimos anos do sculo XX, as bibliotecas, os arquivos e os centros e institutos de
pesquisa e organismos governamentais criavam contedo digital relevante. Segundo
Cunha (1999, p. 266), duas das funes bsicas das bibliotecas esto sofrendo [...]
perigo de extino: a proviso de acesso informao e a preservao do
conhecimento para futuras geraes [...].
Muitas colees digitais importantes esto sendo construdas fora das
bibliotecas e dos arquivos por diferentes organizaes, ou sendo publicadas
diretamente na Internet. Com o aumento da produo de informao em formato
digital, tem sido questionada cada vez mais a importncia de garantir a sua
disponibilizao e preservao por grandes perodos de tempo. Os objetos digitais
no podem ser deixados em formatos obsoletos para serem transferidos, depois de
longos perodos de esquecimento, para repositrios digitais, pois existe o risco de a
tecnologia no conseguir recuperar as informaes. Esta preocupao envolve tanto
os produtores dos dados quanto os rgos detentores dessa informao.
Para Hedstrom (1996, p. 189), a preservao digital se refere ao [...]
planejamento, alocao de recursos e aplicao de mtodos e tecnologias para
assegurar que a informao digital de valor contnuo permanea acessvel e
utilizvel [...]. A preservao digital compreende os mecanismos que permitem o
armazenamento em repositrios de dados digitais que garantem a perenidade dos
seus contedos. Para atingir esse fim, os objetos digitais devem ser compreendidos
e gerenciados em vrios nveis: como um objeto fsico, como uma codificao lgica,
como objetos conceituais ou possuidores de significado para os humanos e como


44
um conjunto de elementos essenciais que devem ser preservados para oferecer aos
futuros usurios a essncia do objeto (UNESCO, 2003).
A condio bsica preservao digital seria, ento, a adoo desses
mtodos e tecnologias que integrariam a preservao fsica, lgica e intelectual dos
objetos digitais. A preservao fsica est centrada nos contedos armazenados em
mdia magntica (fitas cassete de udio e de rolo, fitas VHS e DAT) e discos ticos
(CD-ROM, WORM e discos ticos regravveis). A preservao lgica procura, na
tecnologia, formatos atualizados para insero dos dados (correio eletrnico,
material de udio e audiovisual e material em rede), novos software e hardware que
mantenham vigentes seus bits, para conservar sua capacidade de leitura.
A preservao digital a parte mais longa e tambm a ltima do ciclo de
gerenciamento de objetos digitais. Ela permite o emprego de mecanismos que
viabilizam o armazenamento em repositrios de objetos digitais e que garantem a
autenticidade e perenidade dos seus contedos. So necessrios, no apenas,
procedimentos de manuteno e recuperao de dados, no caso de perdas
acidentais para resguardar a mdia e seu contedo, mas tambm estratgias e
procedimentos para manter sua acessibilidade e autenticidade atravs do tempo,
podendo requerer colaborao entre diferentes financiadoras e boa prtica de
licenciamento, metadados e documentao, antes de aplicar aes tcnicas.
Ao analisar o ciclo da informao (gerao, tratamento, preservao e
conservao e, finalmente, difuso da informao), percebe-se que a preservao e
conservao necessitam ser revistas no mbito da informao digital. At pouco
tempo, entendia-se a preservao no sentido de conservar e prevenir os
documentos do risco de deteriorao. importante analisar a preservao a partir
da necessidade de assegurar o acesso e recuperao da informao cientfica como
fundamento para a pesquisa acadmica. Aliado a isso, deve-se considerar o
crescente uso dos computadores e a quantidade de informaes disponveis em
meio eletrnico (algumas, inclusive, somente neste meio).
A natureza dos documentos digitais est permitindo ampla produo e
disseminao de informao no mundo atual. fato que, na era da informao
digital, muita nfase dada gerao e/ou aquisio de material digital, em vez de
manter a preservao e o acesso de longo prazo aos acervos eletrnicos existentes.
Outro conceito associado ao da preservao digital, que surgiu da
comunidade arquivstica, o de ciclo de vida do material digital. Nos primeiros


45
estudos do grupo de trabalho do National Preservation Office e do Joint Information
Systems Committee (JISC/NPO) (BENNETT, 1997), encarregado de desenvolver um
arcabouo para uma poltica estratgica de criao e preservao de objetos
digitais, o ciclo de vida foi dividido em cinco partes: criao de dados; gerenciamento
de colees e preservao; aquisio, reteno e descarte; gerenciamento de
dados; dados de uso. Foi graas a esses trabalhos que ficou esclarecido que os
envolvidos (stake-holders) tm variados interesses em estgios diferentes do ciclo,
assim como a importncia que h em considerar o assunto preservao em todas as
etapas, e no apenas no final do ciclo, exigindo a cooperao entre as grandes
iniciativas.
A partir da formulao dessa estrutura, comearam a ser desenvolvidos
guias estratgicos para os responsveis por todos e cada um dos estgios do ciclo
de vida dos objetos digitais. Neles, existem recomendaes sobre a valorizao de
um estgio do ciclo em particular, assim como a relao entre eles, e como as
decises podem afetar as tarefas dos outros responsveis. Em geral, as tarefas
relacionadas com a preservao digital seriam os procedimentos de manuseio e
armazenamento da mdia digital, a cpia da informao contida, a migrao para
novas mdias e a preservao da integridade da informao digital.
Como mostra o Quadro 1, a preservao fsica continua relevante na
mdia eletrnica, ainda que o seu armazenamento haja demonstrado a necessidade
de constante atividade de migrao para novos materiais que favoream sua
disseminao e uso (disquete, fita VHS, CD-ROM, DVD).


Requisitos
Documentos
Impressos
Documentos
Digitais
Preservao fsica Relevante Relevante
Preservao lgica Pouco relevante Relevante
Preservao intelectual No relevante Relevante
Quadro 1 Relevncia dos requisitos de preservao

Na preservao intelectual, o foco so os mecanismos que garantem a
integridade e a autenticidade da informao nos documentos eletrnicos. Uma


46
soluo tem sido a autenticao digital (digital time-stamping
8
, DTS). Essa tcnica
permite que os documentos sejam criptografados no momento em que so
depositados (GRAHAM, 1998).
No caso dos materiais impressos, a preservao lgica pouco relevante,
por estar garantida no formato especfico em que foram publicados (peridico, livro,
entre outros formatos). Na publicao digital, a preservao lgica est associada
necessidade de garantir a converso dos formatos originais que se tornaram
obsoletos ou de custosa manuteno. O Quadro 1 mostra, tambm, que a
importncia da preservao intelectual maior no caso dos materiais digitais devido,
principalmente, capacidade de o objeto digital ser passvel de modificao no seu
leiaute, apresentao ou interao no formato de publicao. Com isso, a perda do
contedo intelectual original pode ser declarada inaceitvel pelo autor.
Esse requisito envolve a preservao da propriedade intelectual
(Intellectual Propriety Rights
9
, IPR), que tem um significado mais argvel do que na
mdia tradicional. O IPR deve considerar no apenas o contedo, mas tambm
qualquer ao relacionada ao software (cpias, encapsulamento de contedo,
emulao de software, migrao de contedo) que envolva atividades que podem
infringir permisses especficas daqueles que mantm os direitos. Para Bullock
(1999), o IPR uma das principais barreiras que interferem na preservao dos
objetos digitais. Ela enumera os aspectos tcnicos da preservao dos documentos
digitais da seguinte forma:
limites do objeto digital;
presena fsica;
contedo bsico (ex.: arquivo ASCII);
apresentao;
funcionalidades;
autenticidade;
localizao e rastreamento do objeto digital no tempo;
provenincia;
contexto.
Esses requisitos especificam os elementos que devero ser efetivamente
mantidos de um documento digital, a cadeia de bits que dever ser recuperada.

8
Selo de tempo digital. Traduo nossa.
9
Direitos de Propriedade Intelectual.


47
Referem-se capacidade de acesso aos contedos dinmicos independentemente
da sua apresentao, componentes de multimdia, hipertextualidade e interatividade.
Observar essas condies significa identificar o objeto digital na sua origem e pelas
suas dependncias de hardware e software.
Um documento digital pode estar representado em um ou vrios objetos
digitais, em diversos formatos lgicos, e pode ser suportado por grande variedade
de representaes fsicas. A sua dependncia de software tem origem em sua
natureza binria, armazenada em forma codificada, apenas legvel por programas.
Sem esses programas, os objetos digitais no podem ser acessados, lidos ou
impressos.
Salvar os bits de um objeto digital necessrio, mas no suficiente para
preserv-lo. necessrio tambm conhecer os atributos da aplicao na qual ele foi
criado e com o qual ele pode ser interpretado. O esforo da preservao engloba
tambm o software e o hardware no qual o objeto digital pode ser executado, j que
eles tambm podem ficar obsoletos.
A problemtica dos objetos digitais aumenta a partir do momento no qual
eles so inerentemente digitais, quando no podem ser representados em forma de
imagem ou pginas de texto; tentar representar documentos audiovisuais dessa
forma significa perder aspectos essenciais dos seus contedos e comportamento,
como no caso de artefatos interativos e dinmicos (multimdia, dados meteorolgicos
em imagens ou gerados automaticamente em JavaScript, cgi, pginas ASP, entre
outros). Sem deixar de mencionar simulaes de experimentos, bases de dados e
realidade virtual interativa.
As solues propostas para a preservao desse tipo de objeto digital vo
desde a arqueologia digital, at solues mais completas, como a formalizao
(substituio dos artefatos pelas descries formais deles), a migrao (converter os
artefatos em novos formatos repetidamente) e a emulao (rodar os softwares
originais em hardware recriados virtualmente); passando pela reproduo dos
objetos em forma de imagens e salvando os componentes principais dos artefatos.
Em geral, um objeto digital um componente digital necessrio para
reproduzir um documento eletrnico. Ele no apenas um arquivo, dentro de uma
biblioteca digital, mas est composto de vrias partes:
metadados (descritivos, administrativos, estruturais, de preservao);
arquivos de preservao;


48
arquivos de disseminao.
Para mant-los organizados e conectados, necessria uma prtica
correta de organizao de diretrios e projetos de documentao. O lugar ao qual
pertencem o repositrio de documentos digitais.
preciso chamar a ateno para a importncia de informar o contexto do
objeto digital a ser registrado (e preservado) para que, assim, futuros usurios
possam entender o ambiente tecnolgico no qual ele foi criado
10
. A preservao dos
documentos continua a ser determinada pela capacidade de o objeto informacional
servir s utilizaes que lhe so imputadas, s suas atribuies que garantem que
ele continue a ser satisfatrio s utilizaes posteriores. Porm no caso especfico
dos documentos em formato digital, a preservao depender principalmente da
soluo tecnolgica adotada e dos custos que ela envolve.
Tanto a arquivologia quanto a cincia da informao prevem a descrio
de documentos digitais como uma maneira de possibilitar o armazenamento e a
recuperao da informao. A descrio arquivstica e a descrio bibliogrfica
compreendem o contexto e o contedo dos documentos digitais (os padres de
metadados resultantes comeam a homogeneizar-se, e espera-se a criao de
redes interoperveis de arquivos e bibliotecas digitais).
Na preservao de documentos digitais, assim como em papel,
necessria a adoo de ferramentas que protejam e garantam a sua manuteno.
Essas ferramentas devero servir para restaurar registros protegidos, prevendo os
danos e reduzindo os riscos dos efeitos naturais (preservao prospectiva), ou para
restaurar os documentos j danificados (preservao retrospectiva).
O suporte fsico da informao, o papel e a superfcie metlica
magnetizada se desintegram ou podem se tornar irrecuperveis. Existem, ademais,
os efeitos da temperatura, umidade, nvel de poluio do ar e das ameaas
biolgicas; os danos provocados pelo seu uso indevido e o uso regular; as
catstrofes naturais e a obsolescncia tecnolgica. A aplicao de estratgias de
preservao para documentos digitais uma prioridade, pois sem elas no existiria
nenhuma garantia de acesso, confiabilidade e integridade dos documentos de longo
prazo.

10
Um documento eletrnico um registro que foi criado (elaborado ou recebido) de forma eletrnica.
Um documento digital aquele que existe em formato eletrnico, mas que pode ou no ter sido
criado em formato eletrnico - pode ter sido criado em papel e digitalizado. (CONSELHO NACIONAL
DE ARQUIVOS, 2004).


49
Quando a primeira verso eletrnica de um documento criada, inicia-se
uma longa lista de ameaas inerentes aos documentos digitais. Segundo Greenstein
e George (1998), para proteger a informao digital da destruio causada pelo
tempo, a obsolescncia tecnolgica e a deteriorao da mdia magntica, precisa-se
de mtodos apropriados para diferentes tipos de dados e estruturas.
Uma das principais ameaas o problema da obsolescncia tecnolgica.
Hardware e software so dispositivos para gerar e acessar informaes gravadas
que requerem estratgias tcnicas diferenciadas para garantir seu funcionamento
(FEENEY, 1999). Nesse contexto, os documentos multimdia so os mais
comprometidos, pois no existem garantias de que a essncia da informao possa
ser preservada, se no houver dispositivos que leiam as mdias magnticas usadas.
A busca por estratgias de preservao digital requer no apenas
procedimentos de manuteno e recuperao de dados, no caso de perdas
acidentais, para resguardar a mdia e seu contedo, mas tambm estratgias e
procedimentos para manter sua acessibilidade e autenticidade atravs do tempo,
podendo requerer colaborao entre diferentes organizaes, boa prtica de
licenciamento, aplicao de padres de metadados e documentao.
Todas as tarefas aplicadas s colees digitais tm sido objeto de aes
por parte da comunidade da rea da cincia da informao, que tem entre seus
desafios viabilizar a recuperao e o processamento da informao no futuro
(FUNARI, 2004). Especificamente a preservao digital est sendo observada como
o resultado do uso de normas nos processos de arquivamento dos documentos
digitais. O uso de repositrios digitais que adotam essas normas est sendo
apontado como uma melhoria na qualidade da produo da informao digital a ser
preservada pelas organizaes.
Os especialistas da rea que trabalham com informao em formatos
digitais esto elaborando normas necessrias para armazenar e compartilhar em
repositrios digitais esses materiais, assim como buscam a formulao de polticas
institucionais de preservao.
Segundo Jones (2003), existem trs tipos de criadores de documentos
digitais: 1) aqueles que no acreditam que os repositrios digitais tenham a
habilidade de preservar seus materiais; 2) aqueles que desconhecem que esses
repositrios existem; 3) aqueles que desejam que seus materiais digitais sejam
preservados, mas para os quais tais recursos so inexistentes. Como Jones aponta,


50
existe relutncia por parte desses criadores de documentos digitais em lidar com a
responsabilidade da preservao desses materiais, alm do desconhecimento das
necessidades reais de preservao dos seus acervos digitais.
Se os criadores de materiais digitais originais no compreendem as
implicaes das suas aes em termos de viabilizao a mdio e longo prazo dos
materiais criados, eles no sero capazes de proporcionar o suporte e o
acompanhamento necessrios com as infra-estruturas tcnica e organizacional que
possam dar assistncia e facilite um gerenciamento eficiente da preservao digital.


2.2.2 Necessidades de preservao digital


O estudo da preservao digital tem passado do reconhecimento da sua
necessidade e da sua definio, para abordagens mais tcnicas e propostas de
aes mais claras. O foco da preservao digital mudou da necessidade de uma
ao imediata de resgate dos materiais ameaados, para a conscientizao de que
perpetuar os materiais digitais ao longo do tempo envolve a observncia de um
conjunto de prticas gerenciais que integrem os sistemas de preservao digital.
No incio, as prticas relacionadas com a preservao digital estavam
baseadas na idia de garantir a longevidade dos arquivos, entretanto essa
preocupao est agora centralizada na ausncia de conhecimento sobre as
estratgias de preservao digital e o que isso poder significar na necessidade de
garantir a longevidade dos arquivos digitais.
O desafio muito mais um problema social e institucional do que tcnico,
porque, principalmente para a preservao digital, depende-se de instituies que
passam por mudanas de direo, misso, administrao e fontes de financiamento.
Muitos materiais publicados digitalmente so resultados de servios de informao
disponibilizados por organizaes que adotam alguma infra-estrutura tecnolgica.
Essas instituies levam em considerao aspectos legais e culturais que atingem a
oferta desses servios orientados a atender s necessidades de determinados
usurios. Porm muitas vezes essa preocupao no a mesma que tm os
produtores das novas tecnologias.


51
Em 1996, Waters e Garrett referiam-se queles que seriam os
responsveis pela preservao digital como [...] a linha de frente na defesa contra a
perda da informao digital valiosa [...] (p. 21). Para esses detentores de acervos
digitais, cada vez mais imperiosa a necessidade de contar com mecanismos que
garantam a preservao de seus documentos em formato digital. Especificamente,
essa preocupao parte das comunidades responsveis pelas bibliotecas e pelos
arquivos, para as quais o desenvolvimento de padres e de mecanismo legais para
lidar com arquivos eletrnicos precisa de estratgias metodolgicas bem definidas.
A necessidade de preservao digital, do modo como percebida por
vrios autores, refora a importncia do planejamento na criao e gerenciamento
de objetos digitais. A comunidade arquivstica tem ressaltado a necessidade da
preservao da integridade da informao digital. Para Elkington (1997), em citao
de Chilvers (2000, p. 27), a necessidade de preservao est presente na motivao
das aes empreendidas para garantir a integridade do contedo digital, tais como:
a) a percepo do uso corrente ou antecipado dos recursos que so
criados;
b) o interesse da pesquisa;
c) as imposies legais;
d) as imposies de negcios;
e) a misso pblica;
f) os propsitos para os quais os contedos so criados.
Chilvers (2000) menciona a prioridade da preservao digital como a
necessidade de seleo e avaliao dos custos baseados no ciclo de vida de um
objeto digital. Boeres (2004), aps uma investigao junto s bibliotecas
universitrias brasileiras, identificou a necessidade de preservao digital no
momento da seleo das colees. Para ela, a questo de seleo de documentos
digitais deve ser observada na tomada de deciso, na qual seriam reavaliados os
critrios da seleo e detectada a necessidade de uma poltica de seleo.
No caso das bibliotecas universitrias, a seleo do que ser preservado
deve estar de acordo com a misso da unidade de informao e a necessidade de
seu corpo acadmico. A necessidade de preservar tem um papel de destaque na
garantia do acesso e recuperao de informao, a fim de fundamentar a pesquisa
acadmica.


52
Neste mbito, Funari (2005, p. 8), ao mencionar a necessidade da gesto
da preservao dos documentos eletrnicos gerados por uma instituio de ensino
superior brasileira, enumera as aes a serem empreendidas como resposta a
necessidades administrativas e de pesquisa acadmico-cientfica. Segundo ele:
Para alm da manuteno da integridade fsica, necessrio prever uma
srie de procedimentos, em constante reavaliao, de transposio de
dados de equipamentos e programas informticos antigos para novos.

Verifica-se, nas instituies de ensino e pesquisa, um aumento na
necessidade de modernizao dos servios de informao que elas prestam. A
necessidade de digitalizar e ou copiar seus acervos um indcio de necessidade de
preservao digital.
Para Boeres (2004), a necessidade de preservao digital percebida
tambm pelos gestores dos acervos, pois seu objeto de trabalho est em constante
mudana e existe pouco investimento em cursos de atualizao. A natureza dos
documentos digitais permite a reproduo do documento em inmeras verses, e a
sua preservao precisa de novos conhecimentos e ferramentas.
Com base nos estudos dos autores consultados, as necessidades de
preservao podem ser agrupadas da forma como mostra a Figura 1.


















53



Figura 1 Contexto das necessidades de preservao digital da informao cientfica

O ambiente onde a informao cientfica criada e disponibilizada est
sendo afetado pela rapidez dos meios de comunicao e de redes, pelos ambientes
de aprendizagem virtuais e pelo trabalho colaborativo. Cada vez mais sistemas de
informao para armazenamento e recuperao de informao so requeridos para
conseguir acompanhar esse avano na produo de conhecimento cientfico. Alguns
aspectos do contexto em que ocorrem as necessidades de preservao digital
incluem conceitos como novas tecnologias, comunicao cientfica, depsito legal e
direitos autorais, entre outros.
Para atingir todo o potencial dos sistemas de preservao digital e
aumentar a probabilidade de adoo nas instituies, preciso uma efetiva
identificao das necessidades de preservao. O desafio para os implementadores


54
desses sistemas a adoo de polticas, modelos de negcios, estratgias, suporte
tecnolgico e guias para o desenvolvimento de repositrios digitais confiveis.


2.2.3 Estratgias para a preservao digital


No incio da era digital, a preocupao das organizaes com a
preservao concentrava-se na estratgia de fazer cpias de segurana (backup).
Atualmente, em vrios pases, h urgncia na definio das polticas, obrigaes e
metodologias mais apropriadas para a administrao dos recursos digitais. Em nvel
mundial, as iniciativas se multiplicam (Apndice C) e novas solues so testadas
por instituies detentoras de acervos de especial relevncia para o
desenvolvimento cientfico e tecnolgico de seus pases de origem.
Muitos projetos e iniciativas tm conseguido estabelecer os benefcios de
algumas metodologias ou estratgias. A concluso a que essas iniciativas chegam
que devem ser usados padres e preciso converter os documentos nos formatos
abertos, para que eles sejam acessados aps a obsolescncia dos equipamentos e
programas de informtica em que foram criados. O uso de padres abertos permitiria
seu estudo e sua converso para novos padres.
Alguns dos tpicos relacionados com a preservao digital, citados por
vrios autores, esto relacionados com a aplicao de mtodos e tecnologias para
garantir a integridade e acessibilidade da informao (HODGE; FRANGAKIS, 2004;
LEVACOV, 1997; THOMAZ; SOARES, 2004). A obsolescncia da tecnologia coloca
em questionamento todas as estratgias de preservao existentes. A execuo de
estratgias est condicionada aos conhecimentos do alcance das tecnologias e s
limitaes oramentrias nas instituies. Por tais motivos, existe imperiosa
necessidade de planejamento da preservao digital de baixo custo.
Rothenberg (1995) afirma que a vida mdia de uma mdia ptica est em
torno de 30 anos. Seu estudo tambm apresentou outro dado o qual mostra que o
equipamento de leitura estar obsoleto em 10 anos. Estudo realizado por Stinson,
Ameli e Zaino (1995) apontou que 95% das mdias Kodak Writable CD e Photo CD
Media tm seu tempo de vida estimado em 217 anos, quando conservadas a uma
temperatura de 25 C e 40% de umidade relativa. J no incio das mdias digitais


55
alguns especialistas mencionavam a fragilidade dos suportes eletrnicos (ver Figura
2).


Figura 2 Expectativa de vida de vrias mdias para armazenamento de informao
Fonte: VanBogart (1995)

O acompanhamento das normas e padres de preservao cada vez
mais difcil devido ao rpido avano das tecnologias, especificamente no que se
refere aos problemas trazidos pelos formatos digitais (MARCUM; FRIEDLANDER,
2003). Para Woods (1998), h trs critrios que as novas mdias devem cumprir
antes de serem escolhidas para a preservao digital: 1) a mdia deve proteger o
documento original; 2) a mdia deve possuir mecanismos de verificao da
integridade, de tal modo que o documento no possa ser alterado ou modificado, e
3) a mdia deve ser de acesso fcil. Por conseguinte, tambm seriam preservados a
propriedade intelectual e o hardware e software usados para acessar o documento.


56
Autores como Thomas (2003) propem que a preservao deveria ser
apenas do contedo intelectual, e que separadamente seria desenvolvido o software
para ler e acessar os dados, no sendo aplicvel aos recursos em mdia interativa.
Dois aspectos importantes relacionados com a mdia digital so a
expectativa de vida e a estabilidade. Para Stephens e Wallace (2003), a expectativa
de vida de uma mdia o espao mnimo de tempo que uma informao est
prevista a ser recuperada; estabilidade da mdia a habilidade que tm vrias
mdias de reter o contedo para uso em determinado perodo de tempo (Quadro 2).

Mdia Tipo Expectativa de vida (anos) Estabilidade
Papel ANSI/NISO 200-300 Boa
Microfilme 500 tima
Microformas
Microficha 100 Boa
WORM (write once,
read many)
25 Pobre
CD-R 100 Boa
Mdia ptica
CD-ROM 25 Pobre
Disquetes 5 Pobre
Mdia
Magntica
Fitas 10-20 Pobre
Quadro 2 - Expectativa de vida de algumas mdias para fins de preservao digital
Fonte: verso traduzida e adaptada de Stephens e Wallace (2003)

Os dados mostram que a mudana para uma mdia nova significa alguma
perda na durabilidade e longevidade dos recursos. No seu estudo sobre as mdias,
Stephens e Wallace (2003) citam como exemplo as fitas magnticas usadas
comumente como mdia para armazenamento de dados computacionais inativos,
para pelo menos 10 a 20 anos, para mostrar como cada tipo de informao a ser
preservada acrescenta algum elemento de avaliao da mdia escolhida. Esses
autores tambm mencionam a durabilidade de uma mdia como outro dos aspectos
da preservao digital que tm de ser levados em considerao, pois o software
requerido para ler menos durvel do que a mdia na qual o registro foi gravado.
Os estudos atuais sobre os problemas relacionados com os softwares vm
mostrando que eles superam em nmero aqueles relacionados com o hardware.
Para Dukart (2002), os formatos XML (eXtensible Markup Language) e o PDF


57
(Portable Document Format) so os mais promissrios, apesar das suas vantagens
e desvantagens.
A linguagem XML pode ser considerada como um tipo particular de
migrao. Ela participa como uma linguagem de enriquecimento de informao
sobre estruturas e significado, um padro aberto, independentemente da
plataforma onde ir funcionar. Favorece a interoperabilidade e pode ser usada como
formato de criao de documentos. Pode considerar-se como uma estratgia de
preservao por si s. Junto com o formato PDF, a opo XML complementar na
rea da preservao de longo prazo.
Nos Estados Unidos, o Goverment Printing Office adotou o PDF como o
formato oficial para seus documentos eletrnicos por consider-lo seguro para
futuros projetos de preservao, mas nenhum dos formatos existentes at hoje pode
ser considerado imune obsolescncia tecnolgica (TEPER; KRAEMER, 2002).
Terrio (2002) defende um estudo mais profundo dos formatos no
proprietrios, para poder ter argumentos que mostrem o cenrio diferente daquele
onde as licenas no permitem o acesso ao hardware ou ao software necessrio
para representar os dados. Em contrapartida, sistemas como o DSpace do
Massachussett Institute of Technology (MIT) disponibilizam uma lista de formatos
que so suportados e que continuaro disponveis e legveis no futuro (FALK, 2003).
Algumas estratgias implementadas continuam considerando o mtodo de adotar
softwares no proprietrios e salvar o contedo intelectual dos documentos como o
mais apropriado para resolver os problemas da preservao digital.
A publicao de relatrios por parte de grupos de estudo sobre materiais
eletrnicos, como o Studies on the Preservation of Electronic Material da JISC/NPO
e o da European Commission on Preservation and Access (ECPA) tem favorecido a
construo de um corpo de guias e recomendaes para o gerenciamento dos
materiais digitais (BENNETT, 1997). As concluses sugerem a manuteno desse
tipo de acervos em formatos, sistemas e mdia padro. As sugestes envolvem
mtodos operacionais para materiais especficos e mtodos estruturais para atender
s necessidades de comunidades especficas de usurios.
A Commission on Preservation & Access/Research Libraries Group
(CPA/RLG) mencionou trs das principais estratgias para a preservao digital: a
preservao da tecnologia, a tecnologia de emulao e a migrao da informao
(WATERS; GARRETT, 1996). Desde o surgimento desses relatrios em 1995, as


58
sugestes apontam um ou vrios mtodos como o processo tcnico que melhor
garante a preservao. Para a ECPA, por exemplo, seria a emulao
(ROTHEMBERG, 1995); j para os detentores do projeto Cedar (CURL Exemplars in
Digital Archives), o foco no uma mdia especfica, mas o acesso de longo prazo
ao contedo intelectual do recurso.
Em 1995, a JISC e a NPO (HAYNES, 1997), j afirmavam que a
preservao digital precisa ser uma responsabilidade compartilhada, principalmente
pelo grande volume de informao digital que est sendo produzido e pela natureza
da tecnologia digital. A responsabilidade de que a informao cientfica e tecnolgica
seja preservada para benefcio das futuras geraes est nas mos dos criadores
desses materiais. Para o desenvolvimento de uma infra-estrutura para a
preservao de materiais digitais, necessrio esclarecer a importncia dos
criadores desses objetos e apontar as suas responsabilidades. Alguns dos criadores
de materiais digitais de informao cientfica e tecnolgica no possuem os
conhecimentos arquivsticos necessrios para realizar essa tarefa.
A literatura especializada indica que os responsveis pelos acervos devem
buscar uma viso sistmica, segundo a qual a informao esteja resguardada pela
preservao. Pesquisadores em vrias partes do mundo esto desenvolvendo
modelos do que seria a infra-estrutura para a preservao de longo prazo da
informao em formato digital. Muitas das iniciativas propostas pelos grandes
centros de pesquisa continuam sendo utpicas, mas proporcionam uma base para a
discusso sobre a implantao de solues futuras ao problema (GRANGER, 2002).
Para Beagrie e Greenstein (1998), algumas precaues devem ser tomadas para
reduzir o perigo da perda dos materiais digitais:
1) armazenar os materiais em ambiente estvel e controlvel;
2) implementar ciclos de atualizao (refreshment) para cpia em nova
mdia;
3) fazer cpias de preservao (assumindo licenas e permisses de
copyrights);
4) implementar procedimentos apropriados de manuseio;
5) transferir materiais para uma mdia de armazenamento padro.





59
2.2.3.1 Preservao da seqncia de bits


De acordo com Rothenberg (2003), o dado e a mdia que suportam a
informao devem possuir um nvel de funcionalidade representacional que permita
a sua reproduo a qualquer momento em que a instituio mantenedora precise
recuperar o dado. Cada mdia pode armazenar uma seqncia de bits de forma
diferente, segundo as propriedades fsicas da mdia. A cadeia de bits (a seqncia
de zeros e de uns que compreende o dado) precisa ento ser interpretada, pois toda
seqncia significativa de bits pode representar qualquer coisa. Os objetos digitais
so salvos como colees de bits representando documentos especficos,
significativos apenas para o programa que os criou.
A orientao bsica com relao s cadeias de bits que eles tenham
sido transformados para um formato de mdia neutro ou padro; que suas
propriedades mais significativas tenham sido capturadas e descritas; que exista a
possibilidade de retornar em qualquer momento para a cadeia de bits original, no
caso de alguma solicitao de acesso ao contedo intelectual original. Para que a
cadeia de bits continue tendo sentido, algumas opes tm sido apontadas:
a) manter a cadeia de bits original;
b) manter a ferramenta que interpreta a cadeia de bits;
c) focalizar a preservao para a ferramenta que interpreta;
d) usar tcnicas para a longevidade do software.

Os motivos para escolher a estratgia de salvar a cadeia de bits vo
desde o fato de ser uma escolha que deixa de lado o controle do desenho/criao do
objeto a ser preservado, direcionando o foco para a ferramenta que interpreta, at o
desenho de uma ferramenta que facilite a sua preservao.
A interpretao da cadeia de bits e do dado envolve definies de
hardware (para cpia e visualizao) e software ou aplicativos para as mais
complexas entidades. Mas todo software interpretado por um hardware. Ele, como
um processo ativo, executa comandos especificados em uma linguagem formal.
Assim como Levy (1998), Bearman j ressaltava que salvar o contedo
necessrio, mas no o suficiente.
O contedo, a estrutura e o contexto da informao digital devem ser
enlaados s funcionalidades do software que preserva suas conexes


60
executveis ou representaes de suas relaes, permitindo a sua
reconstruo (BEARMAN, 1994, p. 302).

O motivo dessa limitao que para salvar uma cadeia de bits de um
registro necessrio salvar tambm o seu intrprete. Interpretao significa que a
recuperao dos arquivos digitais, tais como textos, figuras, imagens e sons
decodifica-os e transforma-os em representaes inteligveis. Rothenberg (2003)
mostrou que isso desencadeia, em todas as estratgias aplicadas, um ciclo de
atividades repetitivo (ver Figura 3).


Figura 3 - Modelos do processamento nas perspectivas de preservao digital
Fonte: verso traduzida e adaptada de Rothenberg (2003)

Copiar a mdia garante que o original bitstream do documento digital ser
preservado. Mas um bitstream no pode ser auto-explanatrio. Um bitstream pode
representar qualquer coisa como um smbolo. No apenas texto, mas tambm
dados, udio, vdeo, grficos animados e outras formas ou formatos, atuais ou
futuros, nicos ou combinados em formatos de hipermdia. Cada software est tendo
diferentes tipos de codificao. Por isso cada computador precisa de alguma
especificao de software para ativar os documentos digitais. Um bitstream pode ser


61
inteligvel apenas dentro de um software que o criou, ou algum software prximo que
possa entend-lo.


2.2.3.2 Preservao da tecnologia e do objeto digital


Atualmente, os principais mtodos recomendados para a preservao dos
objetos digitais podem ser agrupados em dois tipos: os estruturais e os operacionais.
Os estruturais tratam dos investimentos iniciais por parte das instituies que esto
se preparando para implementar algum processo de preservao e que adotam ou
adaptam um dos modelos de metadados existentes ou seu prprio esquema. As
atividades operacionais so as medidas concretas aplicadas aos objetos digitais. O
Quadro 3 enumera os mtodos de preservao mais freqentemente usados.

Mtodos Estruturais Mtodos Operacionais
Adoo de padres Conservao de software/hardware
Elaborao de normas Migrao de suporte
Formao de consrcios Preservao do contedo
Metadados de preservao digital Converso de formatos
Montagem de infra-estrutura Emulao
Quadro 3 - Mtodos de preservao digital

As estratgias operacionais que englobariam os novos requisitos de
preservao seriam a migrao de suporte e a atualizao do meio (preservao
fsica), a converso dos formatos, a emulao (preservao lgica) e a preservao
do contedo (intelectual). Para Thibodeu (2002), o que diferencia as estratgias de
preservao o grau de especificidade e o enfoque na tecnologia ou no objeto
digital (ver Figura 4).



62

Figura 4 - Diferenas entre estratgias de preservao
Fonte: verso traduzida e adaptada de Thibodeu (2002)

Outra questo relativa preservao digital a autenticidade dos dados,
pois os usurios precisam ter certeza de que a informao que esto utilizando o
que diz ser e no foi alterada nem por outros usurios, nem em alguma atualizao
de dados. Na manipulao dos objetos digitais existe o risco de corromper a
originalidade, integridade e autenticidade da informao.
Sero mencionadas a seguir, as trs metodologias mais usadas para
enfrentar o problema da preservao digital: migrao, emulao/encapsulamento e
conservao de hardware e software.


2.2.3.3 Migrao


Para Martin e Coleman (2002), no ambiente tecnolgico atual, todos os
dados eletrnicos devem ser migrados a cada ano para que possam sobreviver. A
migrao peridica da informao digital a partir de um ambiente de hardware ou de
um software para outro a estratgia operacional para a preservao digital mais
freqentemente usada pelas instituies detentoras de grandes acervos.


63
Segundo a definio da Task Force on the Archiving of Digital Information
da Commission on Preservation and Access e o Research Library Group (1996),
migrao a transferncia peridica de materiais digitais de uma configurao de
hardware/software para outra, ou de uma gerao de tecnologia computacional para
a gerao seguinte. O propsito da migrao preservar a integridade dos objetos
digitais e assegurar a habilidade dos clientes para recuper-los, exp-los e us-los
de outra maneira diante da constante mudana da tecnologia. A importncia da
migrao transferir para novos formatos enquanto for possvel, preservando a
integridade da informao.
Um arquivo digital pode converter objetos digitais para um reduzido
nmero de formatos-padro. Por exemplo, dados textuais podem ser estocados em
um formato de software relativamente independente como ASCII, em formatos
proprietrios de grande difuso como PDF, ou em formatos baseados em aplicaes
de Standard Generalized Markup Language (SGML) como XML (COLEMAN;
WILLIS, 1997).
Com o passar do tempo, os dados podem ser copiados, recriados e
atualizados como migraes peridicas necessrias em novos formatos para seu
uso em novas geraes de hardware e software. Na rea de documentos digitais,
alguns modelos comeam a surgir com a finalidade de converter materiais de
formatos proprietrios para a linguagem XML.
Os metadados tm um papel importante em qualquer estratgia de
migrao bem-sucedida. Esse tipo de estratgia depender dos metadados criados
para registrar a histria da migrao de um objeto digital. Tambm, existe a
necessidade de informao do contexto para ser registrada (e preservada) para que,
dessa maneira, futuros usurios possam entender o ambiente tecnolgico no qual
um objeto digital foi criado. A International Federation of Library Associations (IFLA)
recomenda a utilizao de formatos padro nos objetos digitais e nos metadados.
Esses formatos devem permitir a migrao dos prprios metadados para outros
padres.
Vrios estudos tm mostrado que a migrao a estratgia mais adotada
pelas instituies que produzem informao cientfica (OCLC/RLG PREMIS
WORKING GROUP, 2004). Mas como a Task Force on the Archiving of Digital
Information apontou, [...] apenas uma nica estratgia aplicada para todos os


64
formatos de informao digital e nenhum dos mtodos de preservao atuais so
inteiramente satisfatrios [...] (TASK FORCE, 1996, p. 38).
A metodologia de migrao est evoluindo, as tcnicas ligadas a essa
estratgia esto sendo amplamente aceitas, mas a sua adoo est apenas
comeando a ser aplicada no caso dos objetos digitais complexos. Para alguns
especialistas a migrao continua sendo experimental e permanece como uma rea
de pesquisa interessante.
Para a Task Force a migrao no opcional, mas sim uma operao
essencial:
Existe uma variedade de estratgias de migrao para a transformao de
informao digital contida em sistemas obsoletos para sistemas de hardware
software atuais, para que essa informao continue acessvel e usvel.
Nenhuma nica estratgia pode ser aplicada a todos os formatos de
informao digital e nenhum dos mtodos de preservao atuais totalmente
satisfatrio. As estratgias de migrao e seus custos variam dependendo
dos contextos de aplicao, dos formatos, dos graus de preservao que as
estratgias atendem e das suas possibilidades de recuperao. (TASK
FORCE, 1996 p.27)

A migrao continua sendo a estratgia mais adotada; entretanto, para
muitas instituies ainda cedo para pensar em uma grande mudana tecnolgica.
Alm das grandes e antigas instituies, os arquivos e bibliotecas no tm iniciado
nenhuma mudana tecnolgica significativa. A prevalncia da migrao significa a
prevalncia de produtos comerciais como os da Microsoft Office e dos produtos da
empresa Adobe na rea cientfica (PDF/A). Os assuntos ligados com a atualizao
de software e hardware no esto sendo tratados pelas instituies, que manifestam
estar mais preocupadas em coletar e inserir os contedos nos sistemas atuais.
Assim como aumenta o nmero de verses de software ou documentos
que so movidos de uma aplicao para outra (por exemplo, de WordStar para
WordPerfect ou Microsoft Word para o Open Office), o risco de corrupo e de
perdas essenciais de informao tambm crescem.
O trabalho das bibliotecas na estratgia de migrao envolve grande
nmero de formatos, complexos e proprietrios. Uma tarefa que diminui a sucessiva
migrao de formatos a transferncia de recursos digitais em formatos
preservveis no momento da submisso em um repositrio. Um autor pode escrever
seu trabalho em Microsoft Word e submet-lo dessa forma no repositrio. Como o
repositrio considera o Word no ajustvel para preservao, os bibliotecrios o


65
convertem para PDF, que possui especificaes de formatos pblicos e que promete
uma representao imutvel no futuro.
Como sendo um componente da estratgia de migrao, vrias iniciativas
de preservao esto sistematicamente documentando formatos de dados, os
softwares nos quais eles esto sendo criados, e coletando suas especificaes dos
formatos quando elas esto disponveis. Nos Estados Unidos, a Library of Congress
est construindo sites com informaes sobre formatos de contedo digital. Na
Inglaterra, a National Archives criou o primeiro registro operacional de formato,
Pronom, e a comunidade internacional de preservao est trabalhando na criao
de um formato de registro de dados internacional. Mesmo assim, um registro
operacional de formato pode oferecer uma variedade de servios, incluindo
identificao de formato, verificao e converso. Entretanto, isto ainda pode
demorar alguns anos, devido principalmente a assuntos organizacionais.
O DSpace do MIT utiliza a migrao como sua principal estratgia de
preservao. O MIT mantm o original e permitir o suporte atravs da migrao de
formatos classificada como suportada (ou no proprietria). Espera-se, mas sem
nenhuma garantia, que sero migrados os arquivos de sistemas proprietrios como
Word, Excel, etc., para os quais as ferramentas de converso tornam-se possveis
de serem disponibilizadas porque so formatos originais instalados pelos usurios.
Existe tambm a migrao a pedido, na qual a verso original do material
retida, e quando necessrio, so aplicadas ferramentas prprias para converter o
original para os formatos requeridos pelo usurio (MELLOR, 2003). Com ela
possvel poupar tempo, pelo fato de que os usurios no atualizam uma verso de
software ou hardware para a seguinte com a mesma velocidade. Esse conceito foi
testado no projeto CAMiLEON (CAMiLEON, 2001).
Nos ltimos 10 anos, um grande nmero de estratgias de preservao
surgiu, como projetos desenvolvidos em todo o mundo (LEE et al., 2002). Todos os
trabalhos analisados mostraram que a estratgia mais citada e aplicada a de
migrao (WHEATLEY, 2001). Essa estratgia tem sido usada principalmente nos
contextos em que no existem objetos digitais interativos, apenas imagens, bases
de dados e documentos de texto.
O tipo e a quantidade de recursos devem ser levados em considerao na
escolha de uma estratgia de preservao. A deciso dever garantir que a melhor
estratgia de preservao foi escolhida entre as opes disponveis. Como todas as


66
estratgias usadas at hoje, a migrao depende de fatores tais como: experincia
tcnica, expectativas de usurios, oramento institucional, equipamento existente e
tempo disponvel.
Para Ferreira, Baptista e Ramalho (2006), necessrio entender todos os
passos envolvidos no processo de migrao, considerando uma seqncia de
atividades:
1. Seleo da estratgia: as decises a serem tomadas inicialmente
envolvem os formatos e as aplicaes. As instituies devem procurar
otimizar a combinao do formato a ser tratado e o software para a
converso [...] um que preserve o maior nmero das propriedades do
objeto digital a um custo baixo [...]. Especificamente com relao ao
custo, esses autores falam que ele deve ser considerado como uma
varivel multidimensional.
2. A converso: a tarefa da converso consiste na reorganizao dos
elementos que compreendem o objeto digital em estruturas lgicas
definidas por formatos diferentes. Para o responsvel pela
preservao, a ao da converso consiste na preparao de uma
aplicao de converso e sua execuo em uma coleo de objetos
digitais. O processo pode ser automatizado com a ajuda de scripts de
programao.
3. Avaliao dos resultados: aps o processo de converso, os objetos
resultantes devero ser avaliados para determinar a quantidade de
dados perdidos durante a migrao. Para conseguir isso, as
propriedades que compreendem o objeto original devem ser
comparadas (chamadas de propriedades significativas) com as
propriedades dos objetos convertidos. Se os resultados da avaliao
no correspondem s expectativas (ex.: as propriedades do objeto
foram degradadas para nveis inaceitveis), dever ser selecionada
uma alternativa de migrao diferente e o processo reiniciado na
integra. O processo de avaliao requer de trabalho manual com
relao aos documentos comprimidos de arquivos de imagem e a
elementos grficos nos documentos de texto.
Em Portugal, na Universidade do Minho esto sendo realizados estudos
para automatizar as trs atividades relacionadas com a migrao (seleo das


67
opes de migrao, converso e avaliao). Os pesquisadores da Universidade do
Minho esperam testar uma Arquitetura de Servio Orientado (SOA) para combinar
vrios sistemas distribudos ou repositrios digitais que permitam s instituies
preservar suas colees automaticamente. O sistema trabalharia na fase inicial da
entrada de dados (ingest processes) oferecendo uma srie de servios. O exemplo
que eles apresentam o do Arquivo Nacional de Portugal: na instituio est sendo
desenvolvido um sistema de repositrio digital para preservar objetos digitais
autnticos produzidos por instituies filiadas (Projeto RODA).
Ao mesmo tempo est sendo criado o processo de ingest e as polticas de
preservao, para ajudar aos produtores na preparao do material antes de ele ser
submetido ao repositrio. Dessa forma, ser realizado um processo de normalizao
para lidar com objetos em formatos no identificados. Na presena de um formato
no reconhecido o repositrio solicitar um servio de identificao de formato ao
SOA, para obter informao e conferir a sua integridade. Aps essa tarefa, a
instituio solicita ao SOA uma lista de formatos para os quais o documento pode
ser convertido, informando suas preferncias e requisitos de preservao
(provenientes das polticas), por exemplo:
- as intervenes de preservao devero ser acessveis e rpidas;
- as intervenes devero preservar o nmero mximo de propriedades
do objeto original;
- as intervenes no devero recorrer a formatos que sejam
dependentes de pagamentos ou direitos autorais (FERREIRA,
BAPTISTA; RAMALHO, 2006).
Na estratgia de migrao a habilidade de decodificar o formato atual
deve estar sempre presente, garantindo a compatibilidade retroativa, a
interoperabilidade dos programas e o uso de formatos padro. Os recursos digitais
podem ser transportados de uma plataforma para outra atravs de migraes
mltiplas, considerando as corrupes acumulativas que podem alterar algumas
dessas caractersticas (ROTHENBERG, 2000).
Uma das vantagens da migrao que ela permite o acesso rpido ao
recurso, j que o documento estar sempre em formato padro. Dessa forma os
usurios encontraram como resultado da converso, recursos digitais considerados
suficientes apesar da perda de algum atributo visual (look-and-feel).



68

2.2.3.4 Emulao e encapsulamento


Com a emulao pretende-se preservar os documentos digitais e suas
funcionalidades (ROTHENBERG, 1999). As tcnicas de emulao sugerem a
preservao do dado no seu formato original, por meio de programas emuladores
que poderiam imitar o comportamento de uma plataforma de hardware obsoleta e
emular o sistema operacional relevante. O processo consiste na preparao de um
sistema que funcione da mesma forma que outro de tipo diferente, para conseguir
processar programas. Essa estratgia est relacionada preservao do dado
original no seu formato original. No lugar de preservar o software e hardware
hospedeiro, os engenheiros de sistemas poderiam construir programas emuladores
(ROTHENBERG, 1995).
Na prtica, os dados podem ser encapsulados junto com a aplicao de
software utilizado na sua criao, assim como uma descrio do ambiente de
software e hardware requerido para seu funcionamento. Para facilitar seu uso no
futuro, Rothenberg (1996) sugere que seja anexada uma anotao de metadados na
superfcie de cada encapsulao que poderia explicar como decodificar os dados
obsoletos contidos e prover qualquer informao desejada sobre esses registros. A
emulao precisa do desenvolvimento de tcnicas de encapsulamento de
documentos, seus metadados, software e especificaes de emulador de forma a
assegurar sua coeso e prevenir sua corrupo (ver Figura 5).













69

Figura 5 - Um documento digital encapsulado
Fonte: verso traduzida e adaptada de Rothenberg (1995)

A emulao uma estratgia importante que possui aplicaes teis
quando a aparncia do recurso digital original importante, desde que no seja
aconselhvel investir em uma tecnologia da informao de alto custo. Hendley
(1998) pede precauo no caso de se usar apenas esta abordagem e comenta que
os gerentes de colees ficaro dependendo da habilidade tcnica dos engenheiros
de software para emular um ambiente especfico e sustent-lo, para processar em
computadores futuros e desconhecidos e recriar o comportamento de documentos
digitais.
Segundo Hendley (1998), a metodologia de emulao a nica que pode
potencialmente preservar os objetos digitais originais e a capacidade deles serem
executados como eles foram inicialmente. Para isto, ele prev o entendimento do
software necessrio para a visualizao do recurso, sem nenhum outro esforo
necessrio no decorrer do tempo. Esta metodologia retarda a necessidade da
converso dos registros em novos formatos, at o momento em que uma deciso
gerencial determine que para acessar os documentos necessrio que o registro
original seja acessado em formatos novos.
Rothenberg (1995) afirma que no futuro alguns programas como o MS
DOS continuaro sendo ubquos e que os gerentes das colees digitais tero que
continuar instruindo aos seus usurios a usarem programas como esse. Prev-se
que os programas proprietrios ficaro obsoletos e que em conseqncia seu valor


70
comercial e restries de direitos autorais expirem, ficando assim disponveis para
os futuros usurios.
Para alguns especialistas (GRANGER, 2000; LAWRENCE et al., 2000), a
estratgia de emulao uma metodologia a curto e a mdio prazo, especialmente
para aqueles que precisam do recurso original pela sua importncia para os usurios
da coleo (ROTHENBERG, 1999). A emulao deve ser usada nos casos em que
os recursos digitais no podem ser migrados dada a sua complexidade, nem
convertidos para formatos de software independentes. A implementao desta
estratgia complexa e difcil, devido principalmente, ao tipo de necessidades
efetivas a serem preenchidas.
A estratgia de emulao est sendo usada quando o recurso digital no
pode ser convertido em formatos de software independentes, e migrados no futuro.
Ela exige uma descrio da tecnologia usada durante a criao do recurso, e a
encapsulao:
a) do recurso digital, acompanhado pelo sistema operacional e seus
aplicativos e,
b) das especificaes do emulador a ser usado e o histrico do recurso
digital.
A emulao ocorre em nvel de software e de hardware. No primeiro caso,
a dificuldade est na descrio das aplicaes que permita a reproduo posterior.
Isto exige uma atualizao constante dos conceitos usados devido principalmente s
mudanas freqentes de arquivos multimdia e hipertextuais (GRANGER, 2000). J
a emulao do hardware atravs de um software precisa da informao detalhada
sobre suas caractersticas.
A estratgia de emulao tem algo em comum com a preservao de
tecnologia e envolve os seguintes critrios:
a) uma mdia de informao digital estvel deve ser armazenada em um
sistema
b) a mdia digital ser preservada enquanto o documento est sendo
preservado como uma machine language;
c) dados sero representados como um formato de mdia novo atravs da
converso e reformatao;
d) a integridade da informao digital ser incrementada atravs de um
processo de cpias;


71
e) a aplicao original deve ser preservada e usada para criar ou acessar
o recurso digital.
A linguagem XML est sendo considerada capaz de assegurar o
encapsulamento dos metadados e das informaes necessrias para a interpretao
do objeto digital original. O projeto VERS (Victorian Electronic Records Strategy) na
Austrlia implementou a estratgia e recomenda que a estrutura dos dados
encapsulados em um nico objeto, em linguagem XML permita a incluso de
metadados e informaes de identificao.


2.2.3.5 Conservao de hardware e software


A perspectiva de preservao digital que prope a conservao do
software e do hardware (technology preservation) sugere que os dados digitais
sejam preservados em mdia estvel e copiados para nova mdia, caso seja
necessrio, e associados s cpias preservadas de uma aplicao de software
original. Esse sistema operacional ser normalmente usado para ser lido sob uma
plataforma de software relevante. Essa estratgia pode ter valor para casos
particulares ou histricos de software e hardware, bem como ser til para a
comunidade dos museus (SWADE, 1992), de longo prazo, entretanto, cara e
pouco prtica.
Segundo Hendley (1998), a perspectiva da tecnologia da preservao no
pode ser apreciada como vivel, mas apenas, para o curto e mdio prazo, como
uma medida de relativo desespero em casos em que valiosos recursos digitais no
possam ser convertidos para formatos independentes de software e hardware e,
assim, migrados para outros formatos.
A preservao do hardware e do software envolve algumas aes
especficas, tais como: o armazenamento das cadeias de bits em uma mdia digital
estvel e a preservao dessa mdia; copiar ou atualizar os dados para uma nova
mdia e preservar sua integridade e tambm, preservar a aplicao original, os
programas e as plataformas para processar essas aplicaes. Em concluso, a
aplicao desta metodologia tem sentido quando o objeto digital foi criado em
formato proprietrio e em um software obsoleto.


72
Esta estratgia envolve os seguintes critrios:
a) converter a informao atravs de uma mquina de linguagem como
um mio estvel;
b) a mdia digital deve ser preservada pela tecnologia;
c) informao pode ser atualizada e copiada como uma mdia de acordo
com os requerimentos;
d) os programas de aplicao precisam criar ou acessar os documentos
digitais;
e) preservar a integridade da informao digital durante o processo da
cpia;
f) o hardware ou o sistema de software devem suportar a aplicao de
software;
g) preservar a plataforma de hardware na qual opera o sistema de
software no qual o documento pode ser processado.
A conservao de software e hardware pode ser adotada quando um
recurso digital valioso est sendo acessado por uma aplicao de software que deve
ser operada em um sistema de software. Esta estratgia est sendo considerada em
declnio.


2.2.4 Metadados de preservao


Na preservao digital, ao criar uma estrutura que guarde o contedo e a
estrutura da informao, as informaes devem ser preservadas de modo a evitar
que sejam corrompidas. Para isso, vrias tcnicas esto sendo usadas, tais como a
criao de metadados de preservao que so atributos especiais de dados ou
documentos, geralmente descritivos. Para Hodge (2000), a preservao e o
processo de arquivamento devem comear no momento da criao do objeto digital,
indicando o valor que ele tem e enfatizando os assuntos ligados com a consistncia
dos metadados no incio do seu ciclo de vida.
Harnad (2003) enftico ao afirmar que os e-prints autodepositados,
como verses para acesso livre, no precisam de nenhum trabalho tcnico em
relao aos metadados, e que o mnimo do protocolo de coleta de metadados da


73
Open Archive Initiative (OAI) satisfatrio. Para ele, os metadados usados para criar
a interoperabilidade
11
entre repositrios tm mostrado sua eficcia desde 1999. Os
tericos do acesso livre concordam que para os originais necessrio esse
gerenciamento de longo prazo.
Na rea da cincia da informao, o papel dos metadados tem sido
tratado amplamente, enfocando a sua necessidade e desafios que eles criam no
gerenciamento de recursos digitais. Alemneh, Hastings e Hartman (2002)
mencionam que o princpio fundamental dos metadados integrar colees digitais,
heterogneas, em mltiplos formatos e de vrias instituies, permitindo que elas
sejam acessveis a qualquer pessoa, em qualquer lugar ou hora.
Segundo vrios autores (Besser, 2000; Moen, 2001; Sutton, 1999; Waibel,
2000; Zeng, 1999), o uso de metadados est centralizado na identificao,
autenticao e contextualizao dos registros, das pessoas, dos processos e dos
sistemas que criam, gerenciam, mantm e usam esses objetos digitais. A funo
bsica dos metadados prover informaes sobre o documento digital, dando
subsdios aos processos de gesto, recuperao e reproduo. Com eles, a
interoperabilidade dos estoques informacionais pode estar garantida, configurando-
se em mais uma soluo para a preservao digital (SANTANNA, 2001).
Os metadados tm vrias funes e servem para vrios propsitos. Eles
do suporte aos processos de registro e de negociao, das seguintes formas:
a) realizando a proteo dos registros como evidncias e garantindo sua
acessibilidade e usabilidade atravs do tempo;
b) facilitando a habilidade de entender os registros;
c) apoiando e garantindo o valor de ser evidncias dos registros;
d) ajudando na comprovao da autenticidade, confiabilidade e
integridade dos registros;
e) apoiando e gerenciando o acesso, a privacidade e os direitos autorais;
f) apoiando uma recuperao efetiva;
g) apoiando as estratgias de interoperabilidade, permitindo a captura dos
registros criados em diversos ambientes tcnicos e gerenciais e sua
sustentabilidade;

11
Capacidade de um sistema ou dispositivo comunicar de forma transparente com outro sistema ou
dispositivo.


74
h) provendo e mantendo a lgica dos links entre registros e o contexto da
sua criao.
Os metadados so expressos em grupos de elementos e atributos, sendo
que o agrupamento de elementos depende das suas relaes. Os elementos e
atributos podem ser mandatrios ou opcionais. Estruturados em esquemas de
metadados eles especificam e descrevem o conjunto padro de elementos de
metadados e suas inter-relaes Os esquemas provem uma sintaxe formal (ou
estrutura) e semntica (ou definies) para os elementos de metadados (ex.: ISO
Metadata for Records).
Baseados na experincia de vrios projetos de implementao de
metadados, autores como Rosenthal; Lipkis; Robertson e Morabito (2005) tm
reforado a viso de que os padres atuais so prematuros e insuficientes em um
futuro previsvel. Assim tambm, o seu uso e evoluo requereram sempre um
tradutor. A traduo ou transformao de um padro para outro no tem garantido, a
inexistncia de perda ou a cobertura de todos os dados, sendo, dessa forma,
impossvel a reconstruo de um objeto digital original.
Na viso desses autores, a evoluo dos padres de metadados sempre
ficar atrs das novas verses que estaro sendo usadas considerando que a
cincia da informao continua avanando e os novos objetos digitais no param de
ser criados, permanecendo rfos de padres desde seu surgimento.
Na literatura da rea podem ser encontrados comentrios sobre a
necessidade de fazer uma clara definio dos atributos de um documento atravs de
metadados para que, alm de minimizar os riscos de perda do contedo, possam
ser feitas revises da informao mantida em repositrios e identificar como ela
pode ser aperfeioada (CAPLAN, 2004; DAY, 2004; McGOVERN, 2007; CANDS
ROMERO, 2006). Um primeiro passo seria a reviso de todos os metadados
existentes em repositrios em uso para, em seguida:
1) localizar os metadados para descoberta;
2) localizar os metadados de preservao mnimos e,
3) identificar os metadados adicionais requeridos para a preservao e
mtodos de captura, tcnicos e de provenincia.
Uma parte importante do suporte que os metadados oferecem permitir
as estratgias de interoperabilidade, conseguindo capturar os registros criados e
ambientes tcnicos e de negcios diferentes e possibilitar sua sustentabilidade. Com


75
os metadados, os links entre registros e seu contexto de criao so mantidos e
podem ser informados. Os atributos dos metadados podem ser identificados como
tipos de metadados necessrios para ser aplicados em diferentes reas da
organizao, dependendo dos riscos e necessidades (Ex.: ISO RM Standard).
As comunidades que tm implementado algumas das iniciativas de
metadados concordam que um nico padro de metadados no pode atender a
todas as necessidades dos diferentes contextos digitais (OCLC/RLG, 2001). Nem
mesmo o projeto Dublin Core tem conseguido prover uma soluo que abranja todo
tipo de recurso de informao digital. Por isso, alguns formatos de metadados tm
sido desenvolvidos para ser usados em diferentes contextos de informao digitais.
Entre eles esto os seguintes:
- Government Information Locator Service (GILS);
- Visual Resources Association (VRA);
- Content Standard for Digital Geospatial Metadata (CSDGM) e,
- Encoding Archives Description (EAD).
Tambm, tem sido foco da ateno o desenvolvimento de ferramentas
para a descoberta de materiais digitais, para facilitar a interoperabilidade entre os
recursos de diferentes reas. Alguns desses esforos so o Resource Description
Framework (RDF), o Extensible Markup Language (XML)
12
e o Z39.50. Entretanto,
Mullen (2001) mostra que essas iniciativas no garantem o acesso de longo prazo
dos recursos digitais, pois a abordagem que elas do aos metadados enfatiza a
descoberta de recursos de informao, e no sua preservao.
Os metadados de preservao so aqueles relacionados com o contedo
do documento, seu contexto e estrutura no momento da sua criao, assim como
das mudanas acontecidas em todo seu ciclo de vida. Essa perspectiva inclui sua
estrutura fsica, tcnica e lgica (a relao entre registros). Nos ltimos anos tm
surgido vrios esquemas e padres de metadados de preservao. A maioria
originou-se da comunidade de profissionais da cincia da informao, entre os quais
se encontram:



12
Extensible Markup Language (XML) um formato padro para publicao,
armazenamento e transferncia de documentos por via eletrnica, independente dos
fabricantes de software, facilmente interpretvel por mltiplas aplicaes e, em certa forma,
auto-explicativo.


76
a) National Library of Australia;
b) CEDARS;
c) California Digital Library;
d) National Library of New Zealand;
e) Open Archival Information System (OAIS) Reference Model;
f) OCLC Digital Archive Metadata;
g) VERS;
h) AUDIOMD e VIDEOMD;
i) Creative Commons Metadata.
Alguns formatos de metadados esto sendo usados para a identificao,
validao e extrao de dados:
a) GDFR/JHOVE;
b) PRONOM/DROID;
c) Toolkit da National Library of New Zealand;
d) A base de dados de software NIST;
e) CRiB.
Tambm, arquivos nacionais e outras agncias governamentais tm
desenvolvido padres para o registro de metadados:
j) Public Record Office [PRO];
k) National Archives of Australia;
l) Public Record Office Victoria, VERS e Information Interchange Office of
the e-Envoy;
m) METS: Metadata Encoding and Transmission Standard;
n) MIX ou NISO Z39.87 Technical Metadata for Digital Still Images;
o) Library of Congress;
p) NEDLIB;
q) Arquivo Nacional do Brasil.
Os metadados de preservao so uma forma especializada de
administrar metadados que podem ser usados como um meio de estocar a
informao tcnica que suporta a preservao dos objetos digitais. No seu
documento sobre as diversas classes de informao que devem estar presentes
num esquema de metadados de preservao, a iniciativa da OCLC/RLG (2002)
afirma que existem trs condies bsicas para o uso dos metadados de
preservao:


77
a) abrangncia: metadados estendidos a todos os aspectos do processo
de preservao digital;
b) estruturao: ser complemento aos componentes e processos
funcionais de um sistema de arquivamento digital;
c) larga aplicabilidade: aplicveis a uma extensa faixa de tipos de objetos
digitais, atividades de preservao digital e instituies.
Para Besser (2000), os metadados de preservao tm como objetivo
prover informao suficiente sobre os recursos digitais para que metodologias de
preservao, tais como a migrao e a emulao, possam ser aplicadas, e dessa
forma contar com as informaes necessrias sobre as verses, os esquemas de
descompresso e conexes.
A criao e o uso de metadados representam uma parte importante em
todas as estratgias operacionais de preservao digital, por no estarem baseados
na conservao de software e hardware, emulao ou migrao, como um meio
para garantir a autenticidade, registrar o gerenciamento de direitos e colees de
dados. Alm de assegurar a interao com recursos de busca (ROTHENBERG,
1996), eles tambm informam sobre a origem do material e os detalhes tcnicos dos
registros, como qual foi a verso do software usado, como foi construdo, por
exemplo, o registro.
Para Lavoie (2004), os metadados de preservao so empacotados
(fsica ou logicamente) com os objetos digitais, acompanhando-os durante todo o
perodo do arquivamento. As informaes sobre o contexto contidas nesses
metadados so essenciais para garantir a acessibilidade e usabilidade dos objetos.
O desafio dos esquemas de metadados de preservao antecipar a informao
que ser necessria para cumprir determinados objetivos de preservao. So
informaes sobre a provenincia, autenticidade, aes de preservao, o contexto
tecnolgico e condies legais (LAVOIE; GARTNER, 2005).
Em 1998, o Research Libraries Group (RLG) recomendou, a utilizao de
16 elementos de metadados para garantir a preservao de longo prazo. Mas o
consenso sobre o modelo nico de metadados de preservao no foi ainda
alcanado (McGOVERN, 2007).
Segundo Searle e Thompson (2003), a implementao de um esquema de
metadados de preservao requer no mnimo a limitao do escopo dos metadados
para preservao, a fim de maximizar o potencial para sua automao e garantir o


78
controle da mudana nos metadados. Na parte operacional do desenvolvimento do
esquema de metadados para preservao, algumas atividades so necessrias:
1. implementao do padro de metadados;
2. criao de repositrios de metadados de preservao integrados a
outros repositrios de metadados usados pela instituio;
3. definio do script para extrair os metadados de preservao, que
produza um relatrio em XML daquilo que os metadados identificaram
como importante para a preservao, para depois serem transferidos
para o repositrio de metadados.
Vrias instituies internacionais tm construdo marcos conceituais para
identificar elementos especficos de metadados de preservao. Esto sendo
desenvolvidos dicionrios de metadados de preservao utilizados nesses projetos e
que refletem o tipo de necessidades que as instituies enfrentam (CEDAR
PROJECT TEAM, 2002; LUPOVICI; MASANS, 2000; NATIONAL ARCHIVES OF
AUSTRALIA, 1999).
A National Library of New Zealand produziu um esquema de metadados
para preservao, orientado para ser um ponto de equilbrio entre os princpios
expressos no modelo de referncia Open Archival Information System (OAIS) para a
preservao de metadados e a praticidade de implementao de um conjunto de
metadados operacionais de preservao. Ele est dividido em quatro entidades: o
objeto, o processo, o arquivo e a modificao de metadados (Figura 6).















79



















Figura 6 - Esquema de metadados da NZNL
Fonte: National Library of New Zealand (2003)

No artigo de Searle e Thompson (2003), o esquema da NLNZ
apresentado identificando-se as reas nas quais ele pode ser desenvolvido: para a
expanso dos dados de definio dos elementos do esquema; para criao de um
repositrio baseado nesses dados de definio, e para o desenvolvimento de
ferramentas de extrao automtica de metadados para alimentar o repositrio. O
esquema identifica os dados que a biblioteca coletar e manter. O arquivo original
(preservation master file) deve ser preservado, gerenciado e disseminado atravs do
tempo. Segundo a NLNZ (2003), os metadados de preservao contm informaes
sobre:
a) polticas e tcnicas de preservao adotadas;
b) efeitos da estratgia adotada;
c) gerenciamento de colees;
d) gesto de direitos autorais;
ENTITY 4 - METADATA MODIFICATION
4.1 Object identifier
4.2 Metadata record modifier
4.3 Date and time
4.4 Field modified
4.5 Data modified
ENTITY 3 FILE (cont.)
3.14 VIDEO:
3.14.1 Frame dimensions
3.14.2 Duration
3.14.3 Number of frames
3.14.4 Frame rate
3.14.5 Codec method
3.14.6 Aspect ratio
3.14.7 Scan mode
3.14.8 Sound indicator
3.15 TEXT:
3.15.1 Character set
3.15.2 Mark up language
3.16 DATASETS:
Use common elements only
3.17 SYSTEM FILES:
Use common elements only
ENTITY 1 - OBJECT
1.1 Name of object
1.2 Reference number
1.3 Object identifier
1.4 Group Identifier
1.5 Persistent identifier
1.6 Preservation Master Creation Date
1.7 Logical composition
1.8 Is part of group
1.9 Structural type
1.10 Hardware environment
1.11 Software environment
1.12 Installation requirements
1.13 Access inhibitors
1.14 Access facilitators
1.15 Quirks
1.16 Metadata record creator
1.17 Date of metadata record creation
1.18 Structural composition
1.19 Comments
ENTITY 2 - PROCESS
2.1 Object identifier
2.2 Original identifier
2.3 Process type
2.4 Purpose
2.5 Person/agency performing process
2.6 Permission
2.7 Permission date
2.8 Hardware used
2.9 Software used
2.10 Steps
2.11 Result
2.12 Guidelines
2.13 Completion date and time
2.14 Comments
OBJECT
METADATA
MODIFICATION
FILE PROCESS
ENTITY 3 - FILE
3.1 Object identifier
3.2 File identifier
3.3 File path
3.4 Filename and extension
3.5 Former filename
3.6 File size
3.7 File date and time
3.8 MIME type
3.9 File format
3.10 File format version
3.11 Target indicator
3.12 IMAGE:
3.12.1 Resolution
3.12.2 Dimensions
3.12.3 Bits per sample
3.12.4 Colour space
3.12.5 ICC Profile Name
3.12.6 Colour map reference
3.12.7 Orientation
3.12.8 Compression
3.13 AUDIO:
3.13.1 Resolution
3.13.2 Duration
3.13.3 Bit rate
3.13.4 Compression
3.13.5 Encapsulation
3.13.6 Channels


80
e) autenticidade do recurso digital.
Tambm a NLNZ afirma que os metadados de preservao podem ser
usados para:
1) armazenar informaes que do suporte s decises e aes
relacionadas com a preservao;
2) documentar processos de preservao, tais como migrao,
transformao e emulao de registros que afetam os processos de
preservao;
3) garantir a autenticidade da verso original preservada ao longo do
tempo;
4) permitir a identificao dos objetos que so responsabilidade da
biblioteca.
A National Library of Australia (2003) tem mostrado como os metadados
de preservao (considerados como uma forma especializada de metadados
administrativos) podem ser usados como um meio de estocar a informao tcnica
que sustenta a preservao dos objetos digitas.
Em 2005, o OCLC-RLG Metadata Implementation Strategies Working
Group (PREMIS) que trata dos [...] aspectos prticos da implementao de
metadados de preservao nos sistemas de preservao digital [...] (OCLC/RLG,
2005) lanou a primeira verso do Preservation Metadata Data Dictionary
13
. O
PREMIS quase um padro para metadados de preservao, mas muitos
envolvidos com projetos de preservao digital no conseguem implementar
metadados de preservao porque trabalham com apenas reduzida parte deles no
gerenciamento da preservao digital.
O Dicionrio de Dados PREMIS descreve o conjunto de elementos bsico
de metadados necessrios para dar suporte preservao digital e como eles
devem ser usados na estruturao de um repositrio digital (OCLC/RLG, 2005). O
Dicionrio classifica esses elementos em cinco entidades:
1) Intelectuais: descrevem a manifestao fsica do objeto digital.
2) Agentes: descrevem pessoas, organizaes e aplicaes envolvidas.
3) Eventos: descrevem aes de preservao direcionadas a um objeto
digital.

13
Dicionrio de dados sobre metadados de preservao


81
4) Objetos: descrevem o conjunto de manifestaes fsicas de uma
entidade intelectual.
5) Direitos: descrevem os direitos e as permisses relacionadas com o
objeto digital.
As prticas de aplicao de metadados de preservao mencionada na
literatura assinalam que, para cumprir com seu objetivo, elas devem ser mantidas
consistentemente atravs do tempo. Para isto, fundamental a criao da
documentao que controle e informe cada passo na criao dos metadados.
Alemneh, Hasting e Hartman (2002) recomendam o detalhamento do workflow e um
guia para que os usurios possam prover toda a informao requerida sobre o
processo de criao de metadados, com exemplos para diferentes formatos de
arquivos. O guia, segundo esses autores, dever informar as regras, sintaxe e
descrio necessria para identificar a fonte de informao para cada elemento.
Eles citam como exemplo disso o esboo do sumrio da estrutura dos metadados de
preservao da University of North Texas (Figura 7).










82

Figura 7 - Estrutura de metadados de preservao das UNT Libraries
Fonte: verso traduzida e adaptada de Alemneh; Hastings e Hartman (2002)


2.2.4.1 Iniciativas de implementao de metadados de preservao


A medida que os objetos digitais vo se convertendo no mtodo
dominante de registrar e disseminar informao cientfica, o gerenciamento dos
metadados de preservao torna-se uma rea de crescente interesse por parte dos
responsveis por tais recursos.
A rea dos metadados de preservao continua a ser o foco das principais
iniciativas de preservao digital devido quantidade macia de informao que
est sendo colocada nos arquivos, bibliotecas e repositrios digitais, assim como
tambm pela nfase na criao de colees digitais mais do que em documentos
isolados. Internacionalmente, vrias iniciativas esto desenvolvendo estruturas para
incluir metadados de preservao. Entre elas conta-se com grupos de trabalho da


83
iniciativa conjunta da OCLC/RLG, o projeto CEDARS (Universidade de Leeds),
PADI (National Library of Australia) e a NEDLIB (da Biblioteca Nacional da Holanda).
No existe consenso sobre qual seria o padro de metadados de
preservao, mas todos esses grupos coincidem em alguns pontos, como o caso
do CEDARS Guide to Preservation Metadata e o OCLC Preservation Metadata
Framework, sendo que esta ltima considerada o mais avanado desenvolvimento
no campo dos metadados de preservao. Outros modelos existentes so:
National Library of Australias Guidelines for the Preservation of Digital
Heritage;
Esquema de metadados para preservao da National Library of New
Zealand;
Elementos de metadados propostos pela Cornell University Library;
Library of Congress Metadata Encoding and Transmission Standard
(METS);
Open Archival Information System Reference Model, publicado pelo
Consultive Committee for Space Data Systems (CCSDS).
O trabalho da OCLC e a RLG vm discutindo a necessidade de
metadados de preservao e as diferenas entre os tipos de metadados e seus
objetivos, sejam estes na descoberta ou na disseminao de contedos. Os
especialistas envolvidos tm analisado os elementos de metadados de preservao
identificados em outros grandes projetos, como o NEDLIB, CEDAR e HARVARD,
tentando integrar todos eles.
Nessa mesma linha, est o trabalho realizado pelo Defense Technical
Information Center (DTIC) dos Estados Unidos, que publicou um guia para
metadados de preservao em 2002 (DEFENSE TECHNICAL INFORMATION
CENTER, 2002), para apoiar a criao da sua Defense Virtual Library. Os
metadados de preservao nesse guia abarcam vrios tipos de objetos, como
imagens, vdeos e relatrios tcnicos. O conjunto de elementos chega a mais de
100, propostos pelo DTIC como os elementos necessrios para dar incio
preservao a longo prazo de objetos digitais e em concordncia com o Modelo de
Referncia OAIS.
Uma experincia relevante foi a da Public Record Office Victoria na
Austrlia, que criou a Victorian Electronic Records Strategy (VERS) com registro de
um nmero extenso de metadados de preservao identificados. Uma caracterstica


84
especial que o VERS inclui, tambm, metadados para descrever a prpria
estratgia. Dessa forma, no futuro, um usurio que acesse um objeto encapsulado
sem documentao poder extrair um documento em XML com as descries
textuais das tcnicas usadas na construo do objeto encapsulado e dessa forma
recriar o software no qual foi criado e at substituir o repositrio (Figura 8).


Figura 8 - Registro de metadados da Victorian Electronic Records Strategy
Fonte: Public Record Office Victoria (1999)



85
Alm disso, cada registro leva includa uma referncia textual aos padres
de metadados como uma forma de documentar o formato de preservao usado.
Essa estratgia converge com a linha de atuao proposta por Hodge e Carroll
(1999), quando sugerem que, para melhor funcionamento dos objetos digitais, os
metadados devem estar embutidos no prprio documento e serem extrados pelos
mecanismos de busca como etiquetas no prprio recurso on-line.
A estratgia VERS pressupe que os objetos digitais provm de sistemas
de gerenciamento digital que contm metadados. Esses metadados podem formar
um conjunto simples ou um arranjo de metadados qualificados. Segundo os
proponentes dos metadados VERS, estes podem chegar a servir como lngua
franca em que os metadados originais podem ser mapeados (QUENAULT, 2004).
H 141 elementos para a preservao e suporte do acesso de longo prazo. Destes,
34 so obrigatrios; 11 o sistema cria automaticamente; 8 vm preenchidos
(defaulted); e 2 so derivados de outros elementos. Dos restantes 13 elementos, 11
so selecionados de uma lista e com apenas dois o responsvel deve criar seu
contedo (SINCLAIR, 2003).
Os padres continuam a ser revisados e melhorados. Com o
desenvolvimento da tecnologia, o conhecimento sobre a estratgia de metadados de
preservao precisa evoluir junto. Ferramentas relacionadas com a gerao, a
marcao e a editorao de metadados esto surgindo. Os softwares para
construo de repositrios comeam a integrar ferramentas direcionadas para a
preservao digital. Entre eles est o NLNZ metadata extractor (RESEARCH
LIBRARY GROUP, 2006), um dos projetos da iniciativa da NLNZ na criao de uma
estrutura de padres de metadados que comeou no ano de 2000 (Figura 9)
14



14
NLNZs Metadata Standards Framework 2000. Disponvel em:
http://www.natlib.govt.nz/en/whatsnew/4initiatives.html#meta Acesso em: 22/out/2008



86

Figura 9 - Ferramenta para extrao de metadados de preservao da NLNZ
Fonte: verso traduzida e adaptada de National Library of New Zealand (2007)

A ferramenta permite lidar com objetos digitais dentro de um processo de
workflow identificado pela NLNZ, contendo especificaes sobre o modelo de
negcios, a infra-estrutura do material digital e as estratgias segundo o tipo de
formato dos arquivos. Nesse desenvolvimento de padres, modelos e
representaes, a ferramenta de extrao de metadados (Extract Tool) est sendo
considerada a concretizao da experincia da NLNZ na manuteno de objetos
digitais (ex.: The New Zealand Locator Service (NZGLS) e o Metadata Standard and
Reference Manual).
As solues propostas para enfrentar os desafios trazidos pelas
mudanas constantes no ambiente digital esto sendo desenvolvidas e atualizadas
em grandes projetos de preservao digital. Cada vez mais, informaes sobre
criao, entrega, operao e administrao dos recursos digitais vm sendo
consideradas cruciais para determinar seu acesso e preservao (OCLC/RLG,
2001). Os metadados que informam aos usurios sobre o contexto tecnolgico e sua


87
segurana esto ajudando a resolver questes que acompanham a vida desses
recursos, tais como:
- que tipo de recurso ?
- como ele pode ser usado?
- como pode ser modificado? e,
- quem esteve envolvido na sua criao/modificao?
Considerando esses objetivos dos metadados de preservao, a National
Library of Australia (1999) definiu as cinco funes principais desse tipo de
metadados:
1) armazenar informao tcnica que apie as decises e aes de
preservao;
2) documentar as aes de preservao tomadas (ex.: migrao ou
emulao);
3) registrar os efeitos das estratgias de preservao;
4) garantir a autenticidade dos recursos digitais ao longo do tempo;
5) anotar informao sobre gerenciamento de colees e direitos de
autor.
importante o consenso nos metadados de preservao e nos padres
para o gerenciamento dos documentos digitais ao longo do tempo, a fim de garantir
sua longevidade, interoperabilidade, veracidade, consistncia e, desta maneira,
motivar que empresas criem solues que possam dar suporte a eles. Alm disso,
deve-se apontar que existem elementos lgicos nos arquivos que precisam ser
conservados, assim como o registro da evoluo da estrutura lgica dos objetos
digitais.


2.2.4.2 A norma OAIS


Vrios autores mencionam a importncia dos padres na rea da
preservao digital. Nos ltimos anos, tm sido formulados diversos modelos de
referncia, e algumas iniciativas de preservao afirmam j estar seguindo esses
requerimentos e fatores condicionantes.


88
Em 1998, Fresko ressaltava que as normas aceitas para a preservao
digital eram poucas e nenhuma cobria todos os aspectos relacionados com a
informao digital. Em 2003, a Digital Preservation Coalition (DPC)
15
realizou uma
pesquisa entre seus membros sobre necessidades de preservao digital. O
resultado mostrou que, tanto as grandes organizaes nacionais estavam
comeando a lidar com o problema, quanto as de pequeno porte no tinham
elaborado nenhum projeto relacionado ao assunto. Nesse mesmo ano, a OCLC e a
RLG criaram um grupo de trabalho para estudar os aspectos prticos da
implementao de metadados de preservao e projetos de preservao digital
(OCLC, 2003).
Como mencionado anteriormente, fundamental o uso de padres
internacionais de arquivamento de metadados para proporcionar uma gesto mais
efetiva de estratgias de preservao de documentos eletrnicos. A mais importante
proposta de modelo de metadados de preservao foi produto de 10 anos de
trabalho do Consultative Committee for Space Data System (CCSDS), ligado
NASA, quem props o modelo de referncia Open Archival Information System
(OAIS), cercado de polticas e procedimentos arquivsticos em sua arquitetura
(CCSDS, 2002).
Considerado o modelo para repositrios de metadados de preservao
mais usado atualmente, o modelo de referncia Open Archival Information System
(OAIS), traduzido para o portugus como Sistema Aberto de Arquivamento de
Informao (SAAI) (THOMAZ; SOARES, 2004) , desde fevereiro de 2003, uma
iniciativa da International Organization for Standardization (ISO 1471). Ela define um
alto nvel de modelo de referncia para organizaes e pessoas que criam
informaes que podem necessitar de preservao de longo prazo, bem como das
organizaes que adquirem tais informaes.
Originalmente, a norma era destinada a regular o armazenamento de
longo prazo de informaes digitais obtidas de observaes de ambientes espaciais
e da Terra, mas ela aplicvel a qualquer tipo de arquivo digital e compatvel com
os sistemas baseados no protocolo de coleta de metadados da Open Archives
Iniciative (DAY, 2001).

15
Disponvel em: Digital Curation Centre http://www.dcc.ac.uk/ Acesso em: 23/set/2008


89
Um arquivo nos termos do OAIS significa considerar os arquivos como
organizaes de pessoas e sistemas, que aceitaram a responsabilidade de
preservar a informao e torn-la disponvel, melhorando a comunicao e
produtividade entre diferentes comunidades (CCSDS, 2002).
O modelo de referncia no especifica um projeto ou qualquer tipo de
implementao, mas ele est dirigido para organizaes que tm a responsabilidade
de tornar a informao disponvel de longo prazo. Cada vez mais, comunidades
esto adotando o modelo OAIS como uma estrutura para reunir atividades
cooperativas entre diferentes reas de interesse. Vrias instituies esto usando a
estrutura conceitual para metadados de preservao do OAIS para identificar seus
elementos de metadados especficos, os componentes funcionais de sistemas de
informao dedicados preservao digital: a Cornell University, as Bibliotecas
Nacionais da Austrlia e da Nova Zelndia, On-line Computer Library Center
(OCLC), Massachussetts Institute of Technology (MIT), entre outras.
Mesmo proporcionando uma terminologia prpria que facilita a
comunicao entre os envolvidos na preservao, o modelo de referncia no uma
implementao especfica, mas proporciona uma lista de condies daquilo que
deve ser considerado no estabelecimento de um projeto de preservao de qualquer
tipo de documento, seja digital ou analgico.
No modelo de referncia OAIS, o primeiro objeto o pacote de informao
(packaging information); ele seria um recipiente que encapsula informao de
contedo e de descrio para metadados de preservao e outros metadados. No
esquema do OAIS, est includo um modelo de informao para insero dos
metadados de preservao (ver Figura 10).









90

Figura 10 - Modelo de referncia Open Archival Information System (OAIS) ou Sistema Aberto
de Arquivamento de Informao (SAAI)
Fonte: Thomaz e Soares (2004)

No modelo, os objetos fsicos e digitais podem ser coletivamente
referenciados como objetos de dados. Eles so interpretados pela combinao da
base de conhecimento da comunidade-alvo e a informao de representao
associada ao objeto de dados. O objeto de dados pode ser complementado com
informao de representao, para ser entendido pela comunidade-alvo. No modelo
OAIS existem dois grupos de objetos de informao (metadados) unidos e
identificados pelo pacote de informao, categorias j definidas no Relatrio da
CPA/RLG de 1996, so elas:
1. informao de contedo (content information): uma informao que o
objeto primrio da preservao. Ela contm o objeto digital primrio e
informao representada necessria para transformar esse objeto em
informao com significado;
2. informao de descrio de preservao (preservation description
information): qualquer informao necessria para preservar


91
adequadamente a informao de contedo com a qual est associada,
acrescentando significado em quatro aspectos:
1) informao de referncia (reference information) (ex.:
identificadores);
2) informao de contexto (context information) ex.:
classificaes por assunto);
3) informao de provenincia (provenance information) (ex.:
copyright, histrico);
4) informao de integridade (fixity information): documenta os
mecanismos de autenticao;
No esquema conceitual do OAIS atuam quatro entidades: produtores,
consumidores, administrao e o arquivo propriamente dito, e existem seis
entidades funcionais: recepo, armazenamento, gerenciamento de dados,
administrao do sistema, planejamento de preservao e acesso (Figura 11)
16
.

Figura 11 Modelo funcional OAIS
Fonte: Thomaz; Soares (2004)


16
PSI: Pacote de Submisso de Informao
PAI: Pacote de Arquivamento de Informao
PDI: Pacote de Disseminao de Informao


92
As entidades funcionais gerenciam o fluxo de informao entre as
entidades que formam o ambiente OAIS e identificam os componentes funcionais
dos arquivos relacionados com a preservao dos objetos digitais. No ambiente
OAIS cada entidade responsvel por algum dos processos do sistema:
1) produtor: a pessoa ou sistema cliente que fornece a informao;
2) consumidor: a pessoa ou sistema cliente interessado no material
arquivado ou por uma verso transformada da mesma;
3) comunidade-alvo: so os usurios potenciais, a serem reconhecidos
para a realizao da meta maior da preservao de longo prazo.
Com a norma OAIS, as instituies podem configurar sistemas
responsveis pela preservao da informao de longo prazo e torn-la disponvel
para uma comunidade de usurios. A definio dos componentes necessrios para
a criao desses sistemas que o modelo proporciona serve para suportar uma gama
de servios de preservao. Essa descrio est relacionada com as atividades de
submisso, organizao e gerenciamento e acesso contnuo de um repositrio em
funcionamento. Especificamente, o PAI (Pacote de Arquivamento de Informao)
17

contm o material a ser preservado e que ser conservado no repositrio, assim
como a informao para sua representao.
A conceitualizao do modelo OAIS serve para compreender os
componentes necessrios para preservar e acessar informao de longo prazo.
Essa descrio do arquivamento de objetos digitais serve para que instituies no
arquivsticas participem efetivamente no processo de preservao, permitindo
tambm:
1) efetuar comparaes entre arquiteturas, operaes, estratgias e
metodologias de preservao;
2) estabelecer o mesmo modelo para informaes em formatos
analgicos;
3) ampliar o consenso entre as partes comprometidas com a preservao
digital, e,
4) guiar na identificao e produo de normas relacionadas com o
modelo.

17
O PAI [...] uma forma concisa de fazer referncia a um conjunto de informao que tem em
princpio, todas as qualidades necessrias para a permanente, ou indefinida preservao de longo
prazo de um objeto designado de informao [..] (CCSDS, 2002 p. 33). Traduo nossa.


93
Um repositrio que segue as definies do modelo OAIS est obrigado a
cumprir as seguintes responsabilidades:
1) negociar com os produtores de informao a aceitao dos critrios
relacionados s caractersticas dos documentos (tipo, assunto, fonte,
originalidade, singularidade, mdia, formatos, etc.) e a conformao
com padres e polticas;
2) obter controle das informaes que garantem a preservao de longo
prazo (propriedades e direitos autorais);
3) determinar as comunidades de usurios potenciais;
4) garantir a compreenso da informao fornecida;
5) seguir polticas de documentao de procedimentos para auxiliar na
localizao dos originais;
6) definir as condies de acesso, distribuio e preservao do acesso.
A administrao de um sistema de preservao que siga o modelo do
OAIS deve acompanhar o desenvolvimento de padres para apoio, com isso ele ter
a garantia de ser uma ferramenta na interoperabilidade entre bibliotecas e
repositrios digitais. Suas funes principais de Recepo, Gerao de Pacotes de
Arquivamento e Acesso so fundamentais na determinao da existncia, descrio,
localizao e disponibilidade da informao armazenada no OAIS.
No caso da Recepo dos PSI (Pacote de Submisso de Informao), a
administrao deve definir os formatos, a forma de transferncia (harvesting ou
convencional) e se ela ser para custdia. Nessa primeira etapa quando os PSI
so transformados em PAI (Pacote de Arquivamento de Informao), reformatando
os arquivos, convertendo os dados de representao e reorganizando as
informaes de contedo.
A administrao do PSI fundamental para a gerao de informaes
descritivas (metadados) que facilitaro a recuperao dos PAI. Toda atualizao
dever ser coordenada para uma correta transferncia de informaes novas dos
PAI para a etapa de armazenamento de gerenciamento de dados. O
armazenamento envolve a manuteno e recuperao dos PAI e sua incorporao
na rea de arquivamento permanente.
Na vasta lista de componentes, servios e funes de um OAIS, o acesso
auxilia os consumidores a determinar a existncia, descrio, localizao e
disponibilidade da informao armazenada. A gerao de um Pacote de


94
Disseminao de Informaes (PDI) facilita a solicitao e recebimento dos produtos
de informao contidos nas bibliotecas e repositrios digitais.
Coordenar um sistema OAIS para e-prints, de acesso livre, significa no
apenas lidar com interfaces, pedidos de consulta, relatrios e pedidos de ajuda, mas
representa lidar especialmente com as autorizaes para usurios de documentos
digitais. Para Harnad (2003), alcanar o modelo OAIS no uma prioridade para os
repositrios digitais de e-prints, mas sim, o fato de estar em concordncia com o
protocolo dos Arquivos Abertos (OAI-PMH).
Para a preservao digital de e-prints o modelo OAIS ilustra o tipo de
atividades e complexidade de relaes por detrs de um repositrio digital. So as
organizaes que devem determinar o tipo de sistema, parcerias e polticas de
acesso a serem implementados para o estabelecimento e crescimento dos
repositrios. Um repositrio que possui o protocolo de coleta de metadados da
Iniciativa dos Arquivos Abertos e est em concordncia com o modelo de referncia
OAIS pode oferecer garantias de acessibilidade de longo prazo, segurana e
integridade, beneficiando o avano da pesquisa cientfica (HIRTLE, 2001;
HITCHCOCK et al., 2007).
Em 2002, o relatrio do OCLC/RLG apontava que um repositrio digital
que estiver fundamentado no modelo OAIS deve estar baseado no Pacote de
Submisso de Informao (PSI) que inclui tanto o objeto digital como os metadados
necessrios. No primeiro momento, os objetos devem ser submetidos no repositrio
como um PSI, o qual contm os objetos digitais e sua respectiva informao. Em
seguida, o PSI reconhecido e encapsulado como um Pacote de Arquivamento de
(PAI). O objeto digital original armazenado como um bitstream no PAI, junto com
os metadados necessrios para que o bitstream seja entendvel e til como recurso
digital.
Para os pesquisadores da iniciativa OCLC/RLG e outros autores
(STEENBAKKERS, 2001), toda publicao eletrnica contm trs elementos: o
bitstream, o objeto lgico no bitstream e a funcionalidade necessria para
decodificar esse formato lgico, sendo que cada um deles possui seus prprios
critrios e requisitos de preservao. o caso do bitstream que s pode ser
preservado se os bits forem copiados e o ambiente de armazenamento atualizado.
Steenbakkers (2001) identifica trs normas principais para a preservao digital:


95
1. separar o documento do seu suporte original e armazenar o documento
em um ambiente de arquivamento controlado;
2. o ambiente de arquivamento controlado deve ser construdo em
concordncia com o modelo de referncia OAIS;
3. o ambiente de arquivamento ou sistema de depsito deve estar
separado do ambiente computacional para publicao da instituio,
enfocado em arquivamento e no em recuperao ou autenticao.
Isto faz com que o sistema de depsito dure mais e torne-se capaz de
ser atualizado assim que novas tecnologias forem surgindo.
A estrutura conceitual do OAIS est construda para atender as
necessidades desse ambiente de arquivamento digital, mas isso no evita que ela
possa ser aplicada em qualquer tipo de objeto fsico (impresso ou digital), assim
como tambm, ela no para um nico tipo de implementao ou sistema. Qualquer
instituio pode ter mais de um arquivo OAIS com diferentes misses, objetivos e
comunidades, apenas se faz necessrio que cada arquivo providencie todas as
funes especificadas na norma, sendo possvel que algumas dessas funes sejam
compartilhadas entre os arquivos e at entre diferentes organizaes, seguindo o
modelo do OAIS.
O desenvolvimento de um sistema de preservao baseado no modelo
OAIS apresenta a dificuldade de no haver na literatura muitos exemplos; a
informao que o prprio modelo oferece no suficiente, forando as organizaes
a planejar como os componentes do sistema precisam ser includos.
Uma das caractersticas do OAIS que ele no prov um conjunto de
metadados, mas um modelo em que os padres de metadados devem ser
propostos. Nesse sentido ele tanto um modelo funcional como um modelo de
dados. Um exemplo disso a National Library of New Zealand, que criou seu prprio
esquema de metadados de preservao [...] para encontrar um equilbrio entre os
princpios expressos no modelo de informao do OAIS e os aspectos prticos da
implementao de um conjunto de metadados de preservao que podem ser
trabalhados [...] (NLNZ, 2003, p. 4).
Os desenvolvedores do esquema de metadados de preservao da NLNZ
identificaram algumas reas que devem ser estudadas:
a) desenvolvimento de definies de dados para os elementos no
esquema;


96
b) design do repositrio baseado nessas definies de dados, e
c) desenvolvimento de ferramentas para extrao automtica de
metadados para incrementar o repositrio.
Alguns conjuntos de metadados esto sendo propostos para comportar o
modelo OAIS, tais como:
- padro de metadados da National Library of Australia;
- especificao de Metadados CEDAR;
- metadados da NEDLIB (Networked European Depository Library);
- estrutura de metadados da OCLC/RLG (Online Computer Library
Center/Research Libraries Group).
Entre as iniciativas e sistemas que abordam o problema da preservao
digital e que de alguma maneira seguem o modelo OAIS, encontram-se as seguintes
(ver Apndice C):
1) CDPP (Centre de Donnes de la Physique des Plasmas) ;
2) DIAS (Digital Information Archival System);
3) DIOnAS (Data Ingest and Online Access Sub-System);
4) DiVA Project (Digitala Vetenskapliga Arkivet);
5) IMAGE project (Imager for Magnetopause-to-Aurora Global
Exploration);
6) Iniciativa DSpace do MIT (Massachusetts Institute of Technology)
7) JSTOR (Journal Storage);
8) LOCKSS (Lots of Copies Keep Stuff Safe);
9) LOTAR (Long Term Archiving and Retrieval and Product Data within
the Aerospace Industry).
10) MoReq (Model Requirements for the Management of Electronic
Records)
11) Digital Archive (OCLC)
12) PANDORA (National Library of Australia)
Com o nmero de iniciativas crescendo
18
, a deciso de qual sistema
adotar deve levar em considerao as necessidades da comunidade de usurios do
sistema. Uma experincia mencionada na literatura a da British Library. Em 2000,

18
O CCSDS continua informando sobre as atividades que o centro desenvolve relacionadas com o
modelo, e uma lista de requisitos para repositrios nele baseados
(http://nssdc.gsfc.nasa.gov/nost/isoas/).



97
a biblioteca, que recebe materiais digitais como depsito legal, por aquisio e
digitalizao, precisou de um sistema que pudesse auxiliar no armazenamento,
preservao e acesso de longo prazo a uma grande variedade de objetos digitais.
Foi realizada uma definio inicial das especificaes funcionais para que o sistema
estivesse em concordncia com os conceitos do modelo OAIS. Dessa forma, a
British Library conseguiu apresentar s empresas um sistema adequado s suas
necessidades. Houve dificuldades no incio devido ausncia de guias de
implementao.
19

O modelo foi considerado perfeito pelo seu nvel de estruturao e
justificativa poltica para o desenvolvimento de sistemas desse tipo, assim como pela
adaptabilidade da terminologia de comunicao semelhante ao sistema que a
instituio queria construir. Mesmo que o sistema aparente ser uma unidade, ele
precisou da definio de seus limites uma vez que alguns dos seus componentes j
existiam na instituio. Para isso, os processos foram analisados, encontrando-se
seus equivalentes.
Elaborou-se um glossrio com a finalidade de entender o modelo e sua
terminologia e publicou-se o conjunto de elementos de metadados na Internet. A
British Library divulgou que alguns grupos de metadados foram inspirados nos da
Biblioteca Nacional da Austrlia, considerando os metadados do padro Dublin Core
limitantes para seus propsitos. O conjunto de metadados definitivo foi de 30
elementos.
Experincias, como a da British Library, mostram que algumas decises
independem do Modelo OAIS. Como o caso do tipo de material a ser armazenado,
sobre o local do armazenamento das informaes descritivas, de relacionamento
entre objetos e se outros componentes do gerenciamento devem ou no ser
includos. Em concluso, o modelo apresenta desafios para as instituies. Assim
como ele pode ser considerado uma estratgia de preservao de longo prazo de
informao digital, ele prov conceitos importantes e a adequao necessria dos
componentes que podem chegar a ser desenvolvidos no futuro.
Outra aplicao do modelo OAIS o projeto InterPARES
20
que surgiu
dentro da comunidade arquivstica. A caracterstica principal desse modelo que ele

19
Disponvel em: Library of Congress. National Digital Information Infrastructure and Information
Preservation Program (NDIIPP). http:/www.digitalpreservation.gov/ Acesso em: 10/09/2008
20
Disponvel em: http://www.interpares.org Acesso em: 13/out/2008


98
leva em considerao aspectos relacionados com os elementos intelectuais e
fsicos, sob a perspectiva de quem os preserva (GREENAN, 2003). Tanto esses
como outros projetos que usam o OAIS tm sua motivao nos interesses nas
potenciais comunidades utilizadoras.
O CCSDS produziu o documento Producer Archive Interface Abstract
Methodology Standard (CCSDS, 2003) para prover uma estrutura geral para a
relao entre o produtor e o arquivo. A metodologia no especifica apenas uma
implementao, mas uma lista de requisitos a serem considerados no momento de
negociar um acordo entre as partes. A primeira fase envolve o contato inicial, a
definio preliminar do projeto e se ele praticvel; ele tambm identifica os objetos
digitais e os padres que devem ser aplicados para que esses objetos possam ser
identificados, assim como informaes sobre o nmero de itens, segurana,
aspectos legais e contratuais, operaes de transferncia e validao. A segunda
fase ou fase de formalizao inclui mais informaes sobre os objetos a serem
transferidos, metadados especficos e a criao de um dicionrio de dados e um
modelo formal. Aps a formalizao dos aspectos legais e as possveis mudanas
gerenciais especificadas inicia-se a fase da transferncia, procurando-se testar e
validar o sistema. Na seo final da Metodologia descrito como o sistema ser
adaptado para criar um padro para uma comunidade especfica (SAWYER, 2002).
Todas as iniciativas mencionadas indicam a necessidade de mais
orientaes sobre a implementao do modelo OAIS. No existem na literatura
muitos exemplos de projetos ou relatos de problemas encontrados, na sua aplicao
em diferentes processamentos de informao em bibliotecas e arquivos. Existe sim a
recomendao de que profissionais das reas da cincia da informao e
arquivologia trabalhem junto com profissionais da informtica na implementao do
modelo (GREENAN, 2003).
Pelo fato de que o modelo OAIS pode atender a necessidades de
comunidades individuais, no existem dois sistemas que sigam o modelo da mesma
forma. Isso coloca o OAIS no como uma funo de preservao, mas como parte
da administrao e do planejamento da preservao de documentos digitais.





99
2.3 PRESERVAO DIGITAL DA PRODUO CIENTFICA


2.3.1 Preservao digital e acesso livre


Acesso Livre (Open Access), segundo entendimento amplamente
difundido na comunicao cientfica, significa a disponibilizao livre na Internet de
literatura de carter acadmico ou cientfico, permitindo a qualquer pessoa ler,
descarregar (download), copiar, distribuir, imprimir, pesquisar ou referenciar (links) o
texto integral dos documentos. A expresso comeou a ser utilizada a partir do
momento em que a quantidade de peridicos eletrnicos aumentou
significativamente, surgindo, assim, os primeiros ttulos que permitiam o acesso
gratuito ao seu contedo (ex.: PACS Review, Postmodern Culture, Bryn Mawr
Classical Review). Entretando, Sally Morris, membro da Association of Learned and
Professional Society Publishers, sugere uma definio mais simples, em que o
acesso livre significa o acesso aberto a artigos cientficos sem restries para todos
(MORRIS, 2004).
A comunidade de especialistas dedicada ao estudo dos fenmenos da
comunicao na cincia particularmente relacionados com o acesso livre parece ser
unnime em concordar que se trata efetivamente de um novo modelo de
comunicao cientfica. Nesse modelo permitido ao autor retomar o controle sobre
o conhecimento que ele prprio gerou, sobre a integridade do seu trabalho e,
paralelamente, a possibilidade de ser citado e reconhecido apropriadamente. As
barreiras do acesso informao cientfica ficam limitadas apenas ao preo e s
permisses associadas com o uso e direitos autorais (BUDAPEST OPEN ACCESS
INITIATIVE, 2002).
No Movimento do Acesso Livre informao cientfica a questo da
preservao deve ser uma ao especfica orientada a dois tipos de objetos digitais
diferentes, cujos requerimentos no podem ser considerados ao mesmo tempo que
os da proviso do acesso. Com isso se quer dizer que cpias da verso final de
artigos cientficos depositadas em repositrios digitais respondem necessidade
primordial do acesso imediato aos resultados das pesquisas, diminuindo
consideravelmente o tempo entre a produo do conhecimento e o seu uso por parte
de outros pesquisadores.


100
Em contrapartida, a verso oficial publicada em peridicos cientficos deve
ser objeto das aes de preservao de longo prazo. Desse modo, o problema da
preservao continua sendo como garantir o acesso para esses originais por parte
dos que podem pagar hoje e no futuro. Esse problema, em princpio, no possui
relao com a problemtica das restries de acesso impostas aos pesquisadores e
instituies que no podem pagar as assinaturas; para estes esto sendo criadas
verses duplicadas autodepositadas em repositrios digitais, uma vez que, para a
maioria dos 2,5 milhes de artigos publicados anualmente, no existem verses
autodepositadas (HARNAD, 2007).
Na perspectiva da OAI, o problema do acesso livre no a preservao
de longo prazo, mas a proviso do acesso hoje. Transpor o problema da proviso
para o da preservao futura outra forma de prolongar o fato de que 85% dos
peridicos no esto provendo o acesso livre aos seus contedos.


2.3.1.1 OAI e a preservao do acesso de longo prazo


A Open Archives Initiative (OAI) possui relao com dois aspectos
diferenciados. O primeiro diz respeito iniciativa que deu origem a uma nova
perspectiva dos contedos digitais conectados na Rede de forma simples e
federada, e o outro, relacionado com um protocolo de comunicao, OAI Protocol for
Metadata Harvesting (OAI-PMH). Os dois respondem mesma misso, proposta em
1999 na propalada Conveno de Santa F (VAN DE SOMPEL; LAGOZE, 2000),
cujos esforos eram desenvolver e promover padres de interoperabilidade para
facilitar a disseminao eficiente de contedos.
O OAI representa uma mudana de perspectiva dos padres de estrutura
de dados para aquela dos protocolos de intercmbio de dados. A palavra Open
refere-se viso da arquitetura dos dados e ao conceito de uma interface que
possibilita o acesso a uma variedade de materiais provenientes de diferentes
provedores de dados. Portanto, nesse sentido, ser livre no significa que ele seja
gratuito. O termo Initiative, por seu turno, refere-se ao aspecto da governana da
instituio que est por trs dos provedores de dados, uma idia que remete ao


101
governo de todas as partes constitutivas do corpo de instituies que suportam e
promovem o intercmbio de dados.
Com o surgimento de mais repositrios digitais, a OAI tem ganhado
aceitao e contado com o apoio financeiro de vrias agncias internacionais (nos
Estados Unidos sobressai-se a IMLS e na Inglaterra a JISC). J a expresso
Archives advm da origem histrica dos repositrios de e-prints, utilizada como
sinnimo de repositrios e sem conotao arquivstica.
O OAI-PMH, lanado em 2001, o mecanismo que permite alcanar os
objetivos dessa organizao (atualmente na verso 2.0), usado por instituies de
todo o mundo. Mesmo tendo surgido dentro da comunidade cientfica para promover
e manter o acesso on-line aos resultados das pesquisas acadmicas, o protocolo
passou a ser de interesse de outras comunidades que lidam com arquivos digitais e
redes de bibliotecas.
O problema que a OAI enfrenta o compartilhamento de metadados de
colees digitais e objetos digitais. O protocolo OAI tem sido usado, ainda, para
coletar dados sobre objetos anlogos de bibliotecas e museus. At o momento, o
OAI centraliza seus esforos apenas nos dados que podem ser coletados, e no
com a coleta ou interoperabilidade entre contedos. Para tanto, os dados a ser
coletados devem estar descritos em esquemas de linguagem XML; o protocolo
trabalha com os metadados descritivos expressados no padro de metadados
Dublin Core, no qualificado e simples como requisito. Outros padres de
metadados ainda esto sendo estudados para serem adaptados ao protocolo no
futuro.
As comunidades que integram o OAI esto divididas em duas: as
provedoras de dados interessadas em compartilhar dados e as provedoras de
servios, interessadas em usar esses dados compartilhados. Uma instituio pode
cumprir os papis das duas comunidades ao mesmo tempo. As solicitaes que o
protocolo OAI lana so feitas como um pedido em HTTP, trazendo como resposta
um XML que pode ser formatado em um registro de metadados descritivo ou apenas
dar as informaes sobre determinado repositrio.
Em contrapartida, o OAI ainda no permite o gerenciamento dos direitos
autorais dos dados intercambiados, assim como tambm no prov o acesso aos
contedos, apenas aponta para o local onde esto armazenados, e no suporta
outros formatos de metadados que no sejam os do Dublin Core. A razo disso a


102
inteno dos desenvolvedores em manter o OAI simples para poder alcanar as
suas principais metas.
Para muitos especialistas, o esforo da OAI para que seja aberto o acesso
aos contedos deveria ser o mesmo para que eles continuassem accessveis de
longo prazo. Porm, uma das lies aprendidas com o protocolo que no
necessrio pensar mais em grandes repositrios centrais (anlogos a bibliotecas). O
protocolo permite que se pense mais em termos de pequenos arquivos distribudos
unificados pelos mecanismos da interoperabilidade. Dentro da OAI alguns arquivos
precisam de um tipo de metadados mais detalhados. No caso dos repositrios das
verses, esse grau de detalhamento nos metadados apenas necessrio para
depurar o acesso.
Segundo Harnad (2007), a necessidade atual fazer com que os arquivos
sejam interoperveis, via protocolo OAI, incluindo outros arquivos da mesma
instituio, sem tentar forar todos a usar o mesmo esquema de metadados. Isso
significa deixar que os esquemas detalhados de metadados trabalhem para a
preservao digital, pois so eles os que precisam de mais tempo para
implementao.
Os repositrios institucionais deparam-se com o problema de gerenciar
suas prprias colees on-line ou qualquer outro material que possuam, acarretando
a sua preservao. Essa carga, no caso da literatura de peridicos por assinatura,
aquela que deve ser compartilhada com bibliotecas universitrias e as editoras de
literatura seriada. Essa afirmao pode ser relativa, uma vez que muitas editoras
acreditam que o trabalho da preservao deve ser de responsabilidade das
bibliotecas.


2.3.1.2 Acesso livre e a comunidade cientfica


O movimento a favor do acesso livre informao cientfica vem
crescendo, os esforos empreendidos para tornar a informao cientfica acessvel a
todos deixou claro que a preocupao com a preservao dos documentos digitais
pertence ao grupo de motivos que poderiam fazer com que os pesquisadores e as
editoras autodepositassem seus manuscritos originais. Para alguns autores, o


103
acesso livre aparenta favorecer a preservao digital da informao cientfica,
mesmo que as implementaes da Iniciativa enfatizem e estejam focadas no
acesso imediato. Nesse novo modelo de comunicao cientfica, a preservao
considerada mais um requisito para o arquivamento em repositrios digitais do que
uma necessidade urgente na construo dos repositrios institucionais (SUBER,
2003).
A evoluo do movimento a favor do acesso livre tem revelado algumas
interaes entre os papis de vrias comunidades envolvidas, entre elas:
1. a comunidade de pesquisadores (autores de artigos avaliados pelos
pares, assim como seus leitores e usurios);
2. a comunidade de bibliotecrios de bibliotecas especializadas (os
compradores e curadores do acesso de artigos de peridicos da
comunidade de pesquisadores);
3. a comunidade de editores de peridicos cientficos (os administradores
dos pareceristas, os certificadores desses produtos e os provedores de
acesso a esses artigos, anteriormente em papel, mas agora tambm
on-line);
4. os empregadores dos pesquisadores (universidades, instituies de
pesquisa que se co-beneficiam da produtividade e impacto da pesquisa
que eles financiam);
5. as agncias de fomento (que respondem para os contribuintes sobre o
uso dos fundos e pela produtividade e o impacto da pesquisa e
pesquisadores que eles beneficiam).
Embora a comunidade cientfica tenha sido a primeira a descobrir o poder
da mdia on-line para aumentar o uso e o impacto dos artigos avaliados, foi a
comunidade das bibliotecas a primeira a direcionar a ateno para o escopo e a
urgncia do problema do acesso pesquisa, resultado do problema dos
custos/possibilidade financeira.
Constata-se que so os pesquisadores, as instituies (de ensino e
pesquisa) e os financiadores os nicos que se encontram na posio de resolver o
problema do acesso/impacto. As instituies e as agncias de fomento so os que
podem estabelecer mandatos de depsito compulsrio para seus pesquisadores
(pelo seu prprio interesse e o interesse da pesquisa em si) do mesmo modo que


104
tm obrigado aos pesquisadores publicar os resultados de suas atividades
cientficas.
A comunidade da biblioteconomia e cincia da informao percebeu que
existia o problema do impacto dos resultados de pesquisa e acesso, e que ele
deveria ser atendido. Mas ela est sendo lenta em perceber qual o prprio papel
na soluo do problema, considerando que a questo da falta de recursos no diz
respeito ao problema do acesso/impacto. Como resultado, essa comunidade
inadvertidamente torna-se parte do problema do acesso e do impacto, no lugar da
soluo, questionando, no lugar de afirmando, a necessidade de prover o acesso
imediato aos resultados das pesquisas. Nesse sentido, Harnad (2007) ressalta que
h resistncia por parte dos bibliotecrios de que todos sejam apenas peridicos de
acesso livre, mesmo que alcanar os 100% disso seja extremadamente lento,
enquanto a via verde do acesso livre mais rpida, direta e segura.
Harnad observa que a comunidade de bibliotecrios no deve perceber o
acesso livre como um assunto relacionado com a aquisio de contedo, como so
as colees das bibliotecas, mas deve encara-lo como assunto relacionado
proviso. Os prprios autores das instituies so os provedores de contedo,
mesmo que eles publiquem em peridicos de acesso livre ou em peridicos com
acesso restrito, mas que autodepositem seus artigos nos repositrios digitais de
suas instituies para, dessa maneira, torn-los contedos de acesso livre.
Ao compreender que no se trata de um assunto relacionado com a
aquisio e sim um tema de interesse da comunidade de pesquisadores, e, cientes
desta necessidade, os bibliotecrios no apenas podem contribuir na reduo dos
preos dos peridicos, mas, sobretudo, garantir que aquilo que j est em acesso
livre continue permanentemente acessvel.
Os bibliotecrios no devem trabalhar junto aos autores persuadindo-os a
prover o acesso livre sua produo cientfica fazendo uso dos seguintes
argumentos: a) isso diminuiria os custos com a aquisio dos peridicos; b)
resolveria a crise dos peridicos, ou c) garantiria a permanncia das verses
autodepositadas (suas verses publicadas j esto permanentes como nunca
tinham sido), nem para reformar a lei de direitos autorais, entre outros. Para Harnad
(2003), os pesquisadores e bibliotecrios no apresentam as mesmas motivaes
para o progresso do acesso livre, so os pesquisadores os nicos que podem prover
esse acesso e, portanto, isto deve ser enfatizado.


105

Mas a pior coisa que uma biblioteca pode fazer no lugar de promover o
autodepsito para o acesso livre, levantar a bandeira das preocupaes com
a preservao e falar das irrelevantes dvidas dos seus possveis
depositantes. A preservao uma preocupao fora de lugar quando se fala
de aumentar o acesso e o impacto da pesquisa. Se a biblioteca no tem
recursos para contribuir com o acesso livre melhor no fazer nada agora,
pois, agora melhor do que no ter nada agora, mesmo que o agora no
seja para sempre (HARNAD, 2003).
21


Para os defensores do acesso livre, as bibliotecas poderiam usar seus
fundos para fazer melhores negcios com as bases de peridicos pagos, depois
investir o restante dos recursos comprando assinaturas institucionais em peridicos
de acesso livre, promovendo a publicao nesses peridicos por parte dos seus
autores institucionais e desenhando um acesso fcil para os peridicos de acesso
livre pelos seus usurios. Isso no precisa de financiamento, apenas tempo por
parte da equipe da biblioteca.
22



2.3.1.3 Autodepsito e preservao digital


Como foi mencionado, o objetivo do autodepsito no a preservao
digital, mas sim o acesso e uso. O autodepsito compatvel com o trabalho em
paralelo de qualquer meta de longo prazo, incluindo preservao e transio para a
publicao de acesso livre.
As verses de artigos cientficos depositadas pelos autores em
repositrios digitais so apenas suplementos do artigo cientfico; elas no so
verses que apresentam o problema da preservao, do qual os especialistas em
preservao mostram estar preocupados. A verso oficial dos editores em XML/PDF
a que apresenta esse problema.
Desde a perspectiva do Movimento do Acesso Livre, a ateno com a
preservao de longo prazo uma preocupao dos editores, das bibliotecas que
assinam as bases de dados e das bibliotecas depositrias, e no dos autores.
Apenas o acesso aos resultados das pesquisas, uso e impacto constituem as

21
Documento eletrnico. Traduo nossa.
22
Ex.: St Andrews University Library Disponvel em: http://eprints.st-
andrews.ac.uk/proxy_archive.html. Acesso em: 20/set/2008


106
preocupaes dos autores, das instituies e agncias que financiam a pesquisa.
Para Harnad (1999), essa a principal razo pela qual o autodepsito deve ser
mandatrio. Portanto, temas que distraem e confundem os autores, tais como
direitos autorais, avaliao pelos pares, reforma editorial e preservao devem ser
deixados de lado em benefcio da promoo do acesso livre informao cientfica
de fato. Segundo ele, declaraes e manifestos continuam declamando esses
obstculos como se eles fossem parte da problemtica, quando, na realidade, o
acesso livre significa apenas acesso on-line a artigos cientficos.
No existe uma preocupao de preservao por parte dos pesquisadores
na hora de autodepositar seus documentos. As estatsticas revelam que apenas
15% dos pesquisadores autodepositam sua produo cientfica. A Iniciativa dos
Arquivos Abertos tem como meta chegar a 100% dos pesquisadores
autodepositando seus trabalhos.
Harnad (2007)
23
assegura que nenhuma sugesto que se faa para que
os autores autodepositem seus documentos em repositrios institucionais
conseguir ajudar no aumento das taxas de autodepsito. Levantar o interesse na
preservao pode chegar a ser uma razo negativa e exigir um trabalho extra para a
concretizao dessa ao. A prioridade para a Iniciativa dos Arquivos Abertos o
autodepsito, que no deve ser negligenciada por outras prioridades arquivsticas,
como a preservao digital. Para o acesso livre o problema no a preservao de
longo prazo, mas a proviso para hoje.
A razo do autodepsito para o acesso livre no preservar o artigo do
editor nem substitu-lo. O propsito prover um suplemento dele, para aqueles que
poderiam ser usurios e que no podem pagar pelo aceso verso proprietria do
editor, com o fim de maximizar o uso da pesquisa e seu impacto.
Harnad sugere que no se deve induzir as instituies de pesquisa e as
agncias financiadoras a criar mandatos de autodepsito para fins de preservao
da verso dos autores. Isto compatvel com a continuidade de um trabalho paralelo
com metas de longo prazo, incluindo a preservao e a transio para a publicao
em acesso livre. Trata-se de assuntos que ocorrem simultaneamente, mas que so
distintos porque as solues de alguns podem no ser adequadas para outros.

23
Comunicao pessoal em 9 de julho de 2007, Belm, Par.


107
A mudana de paradigma, segundo Harnad, ser quando 100% dos
artigos estiverem autodepositados, o que causar mudanas radicais no sistema de
publicao atual. Tais transformaes foraro os editores a se tornarem apenas
provedores de servios de avaliao pelos pares e certificadores de conhecimento
cientfico, no lugar de serem provedores de acesso a produtos analgicos e digitais,
como se verifica atualmente. Desse modo, no momento em que os editores
cederem, por fora das circunstncias, a proviso do acesso e o arquivamento para
as instituies dos autores, estas herdaro a misso de preservar as verses
originais e no apenas aquelas dos contedos suplementares.


2.3.1.4 Preservao e preservao


Harnad (2003) distingue dois tipos de preservao: small-p preservation e
large-P Preservation. Para ele, os repositrios institucionais realizam a chamada
small-p preservation e continuaro a faz-lo. O motivo principal porque o acesso
livre para conseguir o acesso imediato, portanto, a small-p preservation um meio
necessrio para esse fim.
Harnad chama de small-p preservation aquela na qual os repositrios de
acesso livre garantem que o acesso aos contedos continuar para um futuro
prximo. Dessa maneira, o problema no a preservao em si, mas sim a
ausncia de 85% dos peridicos cientficos que podem no ser depositados porque
os responsveis pelos repositrios continuam tornando o processo complicado. Se
no existe contedo a ser preservado, a preservao simplesmente no acontece.
Harnad cita, como exemplo, o caso do quadro La Gioconda. O original da
obra de arte deve ser o objeto de preocupao pela preservao, e no as rplicas
que so disponibilizadas para aqueles que no podem pagar para ir ao Museu do
Louvre. Assim, enquanto os especialistas trabalham para resolver o problema de
preservar o original, os visitantes de qualquer parte do mundo podem apreciar a
rplica. O autor argumenta que
[...] o pressuposto prover hoje acesso imediato aos possveis usurios do
que esperar at encontrar uma forma de garantir que o acesso ser para
sempre. Alguns autores acreditam que os pesquisadores precisam de um
acesso permanente, mas no livre. O Movimento do Acesso Livre no
sobre esforos para a digitalizao, sobre aumentar o impacto da pesquisa,


108
alm do que os autores imaginam. As nicas universidades que no tm
interesse em aumentar o impacto das pesquisas so aquelas que no tm
produo cientfica, nesses casos no um assunto que tenha a ver com
dinheiro, mas com poltica. (HARNAD, 2003)
24


Alguns dos principais repositrios digitais baseados em arquivos abertos,
como o Arxiv (fundado em 1991) e o CogPrints (fundado em 1997), atendem s
necessidades de preservao digital, classificada por Harnad de small-p
preservation. O contedo desses repositrios permanece acessvel sem nenhuma
pretenso de que estejam atendendo a preservao denominada large-P
Preservation, aplicada nos originais guardados pelas editoras. Isto ocorre,
principalmente, porque a preservao no era o principal motivo para o autodepsito
nesses repositrios.
Em contrapartida, a large-P Preservation a Preservao como um fim
em si mesma: como a motivao para o arquivamento em primeiro lugar; ou como
uma necessidade urgente dos contedos efmeros e de contedos frgeis nascidos
digitais; ou como uma responsabilidade para os provedores de contedo
(provedores de peridicos) ou compradores de contedo (bibliotecas assinantes) ou
preservadores de contedo (depsitos/bibliotecas que registram contedo) que
precisam garantir a perenidade dos produtos que vendem ou que adquirem. Mesmo
assim, segundo Harnad,
absurdo imaginar que software como EPrints ignorem a small-p
preservation ou que seu contedo um pouco plausvel de desaparecer
amanh assim como qualquer outro contedo digital que tem sido
conscientemente preservado e migrado e atualizado hoje, ainda que
atualizado segundo os desenvolvimentos das estratgias de preservao
(HARNAD, 2003)
25
.

A diferena entre preservao e Preservao est em que preservao
no um fim por si s, ela apenas um meio para um fim (que o acesso imediato,
assim como a proviso do acesso e uso), enquanto Preservao um fim por si
mesmo. As verses e documentos suplementares autodepositados no requerem
um tipo de preservao denominado de large-P Preservation.
A preservao com p minsculo assegurada pelos arquivos de acesso
livre e para um previsvel futuro. Harnad ressalta (2003) que quando todos os artigos
avaliados pelos pares forem autodepositados, ento o p minsculo se converter

24
Documento eletrnico. Traduo nossa.
25
Documento eletrnico. Traduo do autor.


109
em P maisculo, pois o problema da preservao com p minsculo ser idntico
ao problema da preservao com P maisculo. Ainda por algum tempo, a
preservao digital, na perspectiva da OAI, dever continuar a ser aplicada aos
originais guardados pelas editoras.


2.3.1.5 Tecnologias para o Acesso Livre


Argumenta-se, portanto, que a fuso da misso de preservao e
arquivamento com a misso do acesso e proviso est adiando e esvaziando a
motivao para a proviso do acesso livre, que a principal razo dos repositrios
digitais, tais como aqueles construdos com plataformas, como o Eprints ou Dspace.
Para o acesso livre o que est faltando a motivao por parte dos autores. As
evidncias dos benefcios decorrentes do acesso livre, como o aumento do uso e do
impacto dos resultados de pesquisa parece ainda no chegar at eles. Um dos
fatores apontado como o principal estimulador do autodepsito nas instituies que
criam seus repositrios digitais tem sido a elaborao e implementao de polticas
mandatrias que obrigam o autodepsito por arte dos autores, e no unicamente o
argumento de o acesso livre como mais uma camada na plataforma genrica
institucional da preservao.
Mesmo que softwares como o EPrints, Dspace e Fedora possam prover
longevidade e acompanhem o desenvolvimento na rea da preservao digital, a
motivao primeira no a preservao de longo prazo. Dos 2,5 milhes de artigos
publicados anualmente nos mais de 24 mil peridicos existentes no mundo, 85% no
esto sendo autodepositados, assim como no tm sido as edies anteriores
desses peridicos. Os contedos, no entanto, no esto perdidos, pois continuam
preservados nas verses proprietrias pelos produtores (editores) juntamente com
as bibliotecas, suas compradoras.
As ferramentas para repositrios institucionais no so originalmente
destinadas a projetos de preservao digital. A motivao primordial no diz respeito
garantia da longevidade dos contedos digitais, mesmo que elas acompanhem o
desenvolvimento nas reas de preservao de longo prazo de contedos digitais. O
contedo dos repositrios institucionais em ferramentas para repositrios digitais


110
pode ser preservado, mesmo que seu objetivo no seja a preservao, e
principalmente, porque o contedo de acesso livre est em risco de no ser
preservado devido ao fato de ele no estar sendo totalmente disponibilizado, sem
restries.


2.3.2 Preservao de peridicos eletrnicos


Os peridicos eletrnicos esto deixando de representar apenas uma
extenso da verso impressa, para serem uma garantia do acesso informao
cientfica, e projetos de criao de arquivos de e-journals continuam aparecendo. As
evidncias demonstram que as publicaes peridicas so mais facilmente
acessveis nas novas mdias eletrnicas (via web), assim como esses formatos
podem oferecer algum tipo de garantia de que estaro disponveis por muito mais
tempo.
A opo pela publicao eletrnica, disponvel desde os anos 1980, vem
crescendo a cada dia. Em 2006 eram 14.338 ttulos de peridicos registrados no
Ulrichs International Periodicals Directory, representando 62% de todos os
peridicos referenciados nesse diretrio (os 38% restantes tinham verso apenas
em papel). Os peridicos de acesso livre eletrnicos j eram 1.429. A Electronic
Publishing Services, em estudo sobre o futuro das publicaes cientfica elaborado
em 2003, projetou que, em 2016, a metade dos peridicos j ter migrado para a
verso unicamente eletrnica; predizendo que as reas das cincias exatas, da
sade e das tecnologias sero as primeiras a faz-lo (COUNCIL ON LIBRARY AND
INFORMATION RESOURCES, 2006).
No caso das bibliotecas no mundo, a EBSCO estima que as assinaturas
de ttulos impressos das reas das cincias exatas, sade e das tecnologias,
assinaturas de verses analgicas de peridicos sero superadas pelas assinaturas
das verses on-line (BRUCE, 2005). Outros levantamentos mostram que 84% das
bibliotecas universitrias do mundo cancelam a assinatura da verso impressa
quando a verso eletrnica fica disponvel (HAHN, 2006).
Pensar na necessidade de preservao dos peridicos eletrnicos
significa captar o valor do artigo eletrnico quanto s ligaes que ele possui:


111
grficos e bases de dados multimdia. So elementos que tm se tornado partes
intrnsecas da moderna literatura cientfica. As publicaes cientficas de
universidades e instituies de pesquisa esto adotando os arquivos de acesso livre
porque a informao que elas produzem est, na sua maioria, em formato digital, o
que facilita a sua transferncia, a transposio do problema da obsolescncia da
informao cientfica, assim como a criao de um espao para a produo e
armazenamento dentro da prpria instituio. Trata-se da garantia da existncia de
um avanado conjunto de servios no qual est includa, principalmente, a questo
da preservao digital (CAF et al., 2003).
No modelo atual de publicao cientfica, a preocupao dos responsveis
pelas bibliotecas e centros de informao est na centralizao dos peridicos em
poucas bases de dados, que detm o acesso e o controle das publicaes, sem
permitir o direito a reter cpias digitais nas suas prprias instituies.
A preservao digital de peridicos eletrnicos est dirigida especialmente
a assegurar que seus contedos podero ser acessados sempre de alguma
maneira. Os gerentes das bibliotecas precisam reconhecer que a preservao dos
objetos digitais uma forma de gerenciar riscos e um direito ante o possvel
descumprimento de acordo com as editoras e donos de bancos de dados. Para
alguns editores, a preservao considerada uma extenso da sua misso com
vistas a preservar o conhecimento de uma rea e justificar os recursos conseguidos
para as suas atividades.
Em torno das discusses sobre preservao digital de longo prazo, os
peridicos eletrnicos aparecem sempre em primeiro plano. Isso se deve ao seu
papel na comunicao cientfica e pelos interesses comerciais envolvidos. A soluo
sugerida por vrios grupos de pesquisadores que sejam construdos repositrios
digitais fora do controle dos editores e provedores de bases de dados comerciais
para os peridicos, assim como para outros tipos de publicaes cientficas.
Preservar peridicos eletrnicos uma responsabilidade dos editores e
das bibliotecas depositrias. A aplicao de alguma das metodologias mencionadas
depender da poltica de preservao que elas adotam. No caso das editoras que
no permitem que nenhum dos seus autores e leitores copie e deposite verses dos
artigos originais em repositrios institucionais, elas esto declarando a sua
responsabilidade pela preservao e o acesso aos artigos de longo prazo. Alguns
casos apresentam mais caractersticas restritivas ao acesso quando os editores


112
provem acesso temporrio apenas a arquivos criptografados, criando maiores
dificuldades de recuperao, se porventura a editora fechar.
No caso especfico de peridicos cientficos de acesso livre, quando o
editor permite aos autores o autodepsito da verso final dos autores como
suplementos da verso final em repositrios digitais, essas verses no substituem
os originais. Os suplementos autodepositados servem apenas para prover o acesso
imediato e contnuo para aqueles que no tm como pagar o acesso verso final.
Eles no funcionam como mecanismo de preservao da verso oficial, mesmo que
nesse aspecto cheguem um dia a servir para ajudar tambm.
As iniciativas de Acesso Livre parecem beneficiar a preservao digital
dos peridicos cientficos, mas a motivao principal delas o acesso. Tanto para
Suber (2003) como para Harnad (2007), a preservao de longo prazo, assim como
o autodepsito em repositrios, apenas um dos vrios requisitos para o acesso
livre. Na viso do Movimento da OAI, esses requisitos no esto inerentemente
unidos, pois, ao coloc-los juntos, corre-se o risco de sobrecarregar o conceito
principal (acesso livre) e retardar sua implementao com condies que a Iniciativa
realizar.
A discusso continua sobre se a preservao parte essencial ou no do
acesso livre. Segundo Suber (2003), as grandes iniciativas de acesso livre diferem
na incluso ou no de medidas para garantir a preservao de longo prazo. Para
esse autor, a Declarao de Bethesda e a da BioMed Central (BMC) incluem a
preservao, enquanto as de Budapest Open Access Initiative (BOAI) e a da Public
Library of Science (PLoS) no o fazem. Suber tambm afirma que, o acesso livre,
apesar de estar enfocado na disseminao imediata, atua como catalisador da
necessidade de preservao de longo prazo, sem as restries dos direitos autorais.
Nas estatsticas do Movimento dos Arquivos Abertos, entre 10% e 20% de
todos os peridicos cientficos no mundo j possuem algum tipo de poltica de
autodepsito para as verses suplementares, e mesmo esses peridicos precisam
enfocar os objetivos reais da preservao para as suas verses proprietrias
originais. Com o crescimento do nmero de solues para a criao e
gerenciamento de peridicos de acesso livre, os editores cientficos no precisam se
preocupar com a necessidade de aumento da visibilidade, uso e impacto dos seus
contedos. A ateno desses editores com a preservao deve recair agora nas


113
potencialidades dessas solues com relao ao arquivamento das verses
originais.


2.3.2.1 Arquivamento de peridicos eletrnicos


No uso de programas proprietrios e que podem tornar-se obsoletos, os
editores enfrentam o problema de que a deciso de autorizar a migrao para um
novo formato no entre em conflito com os direitos autorais aceitos pelos autores
dos artigos. Algumas grandes bases de revistas, como a Elsevier, j manifestaram a
promessa de manter os arquivos originais preservados.
O arquivamento do peridico eletrnico uma das tarefas editoriais que
precisa de uma poltica clara para a criao de cpias arquivveis. As cpias em
papel esto diminuindo como opo de back-up e o fator da redundncia no
considerado por muitos editores. As editoras de universidades americanas, sob
auspcios de instituies de fomento, como a Mellon Foundation, tm trabalhado em
projetos com editores individuais e por rea de conhecimento, para estudar as
principais caractersticas das mudanas que as verses eletrnicas envolvem e as
ferramentas de software mais apropriadas para o arquivamento dos seus originais.
Algumas dessas iniciativas tm optado por metodologias para garantir a
permanncia dos formatos dos arquivos, como a do servio Electronic Journal
Platform da American Institute of Physics (AIP, 2003), que permite que vrios
documentos sejam criados a partir da marcao em SGML ou de uma DTD,
colocando uma verso em formato ASCII para ser disponibilizada em processos de
preservao no futuro. Outras iniciativas de preservao digital de peridicos
cientficos tm optado pela metodologia da migrao cclica. Como a American
Geophysical Union, que em 1996 criou um fundo para a manuteno e atualizao
das verses eletrnicas dos peridicos da rea. Tambm a American Astronomical
Society usa parte dos recursos financeiros arrecadados com as assinaturas para
apoiar os processos de migrao da verso eletrnica da sua publicao, a cada
cinco anos.
Vrias instituies em pases desenvolvidos tm financiado projetos para
a criao de repositrios digitais de peridicos eletrnicos. Em 2001, um projeto da


114
Harvard University Library foi financiado pela Andrew W. Mellon Foundation, com o
objetivo de analisar os mecanismos por meio dos quais os peridicos eletrnicos
devero ser selecionados para serem preservados, assim como outros assuntos
relacionados com o acesso de longo prazo. A proposta desse projeto mostrar a
importncia da integrao das iniciativas em programas de preservao que operem
em conjunto (HARVARD, 2000). Dentro desse mesmo projeto foi realizado um
estudo que indicava o desenvolvimento de uma DTD comum para todos os
peridicos eletrnicos, mas percebeu-se que ela teria limitaes devido s
especificaes de cada rea de conhecimento (INERA, 2001).
Em 2003, um estudo da Association of Learned and Professional Society
Publishers mostrou que 52% dos editores comerciais e 45% dos editores no
comerciais entrevistados j usavam algum tipo de soluo para cumprir com a sua
responsabilidade de preservao de longo prazo. Mesmo assim, para as editoras
comerciais, os direitos autorais continuam nas mos dos editores, e por serem eles
os beneficirios comerciais, tornam-se os responsveis pelo seu controle e
preservao. Alguns sistemas como o Journal Storage: The Schorarly Journal
Archive (JSTOR) e o Lots of Copies Keeps Staff Save (LOCKSS) foram citados.
Segundo a pesquisa, os editores comeam a perceber os benefcios econmicos
que traz o reuso dos contedos das suas publicaes (COX; COX, 2003).
Internacionalmente reconhecida, a base de dados JSTOR o resultado de
um consrcio entre instituies de ensino superior (IES) e institutos de pesquisa,
promovido por uma organizao independente, sem fins lucrativos, estabelecida nos
Estados Unidos, desde 1995. A proposta do JSTOR armazenar e tornar disponvel
o texto integral de colees eletrnicas retrospectivas (backfiles) de peridicos, a
partir do primeiro nmero. O servio pago e o perodo de abrangncia de cada
revista varivel.


2.3.2.2 LOCKSS


Um dos projetos direcionados a esse objetivo o Lots of Copies Keep
Stuff Safe da Stanford University (LOCKSS, 2003). O mtodo de arquivamento
desse projeto est direcionado para conservar a integridade das publicaes


115
eletrnicas mantendo cpias em vrios endereos eletrnicos (sites), conferindo
periodicamente todas as cpias para verificar a congruncia da informao
armazenada. A soluo LOCKSS procura minimizar o grau de impacto que um
desastre possa causar em um nico arquivo digital.
Depois de cinco anos de testes, em 2004 a Stanford University lanou o
LOCKSS com o apoio financeiro da National Science Foundation (NSF), da Sun
Microsystems e da Mellon Foundation. Desde ento, uma corporao LOCKSS
prov suporte tecnolgico e para o gerenciamento das colees digitais (REICH,
2003).
O funcionamento do software livre LOCKSS precisa de uma infra-estrutura
de hardware de custo reduzido e uma administrao tcnica mnima. Considerando
o alto custo do armazenamento em repositrios, uma metodologia como a do
LOCKSS muito importante para os pases em desenvolvimento, onde a maioria
das instituies carece de financiamento para as atividades relacionadas com a
preservao digital de publicaes cientficas. A soluo permite que os leitores
autorizados tenham acesso s edies eletrnicas dos peridicos, respeita os
direitos das editoras e no aumenta o oramento das bibliotecas (REICH;
ROSENTHAL, 2001). Ela compreende:
1) a preservao atravs da replicao distribuda;
2) a aplicao de uma tecnologia de apurao de dados pelos pares;
3) o uso do repositrio como ncleo das atividades;
4) a incluso de quatro das seis entidades funcionais do modelo OAIS:
Recepo, Administrao, Armazenamento e Acesso.
26

O modelo LOCKSS foi desenhado para criar um sistema descentralizado
de publicao e acesso permanente na web, apoiado na redundncia de sistemas
distribudos para preservar os contedos, seu acesso e a habilidade de entender
seus bits.
A preservao digital que o LOCKSS permite no se reduz
disponibilizao perptua dos materiais armazenados, mas se estende s funes
que garantem a preservao da propriedade intelectual dos documentos em
qualquer formato digital. Os responsveis pelo seu desenvolvimento adquirem e
disponibilizam cpias das publicaes de uma forma anloga da biblioteca, com

26
Declarao de Conformidade com o a norma OAIS/ISO 14721:2003 Disponvel em:
http://www.lockss.org/lockss/OAIS Acesso em: 15/set/2008


116
uma diferena: os registros no so descartados e seu acesso salvaguardado
(LOCKSS, 2007).
Com o LOCKSS, as instituies que assinam peridicos cientficos podem
escolher a preservao dessas publicaes, criando verses (caches) persistentes e
autorizadas de baixo custo dos contedos que elas assinam. O servidor LOCKSS
guarda permanentemente as verses que ele coleta das novas edies,
comparando-as de forma lenta com os contedos de outras verses mantidas em
diferentes bibliotecas, corrigindo e detectando possveis erros nos arquivos de
qualquer um dos repositrios que formem uma rede cooperativa de rplicas
LOCKSS (Figura 12).



Figura 12 Exemplo de monitoramento de caixas LOCKSS
Fonte: Projeto LOCKSS
27


recomendado que o uso dos repositrios ou caixas LOCKSS
(LOCKSS, 2007) esteja sob a responsabilidade de bibliotecas que garantam o
acesso a peridicos cientficos na Internet. O sistema permite que as bibliotecas

27
Disponvel em: http://171.66.236.21:8081/DaemonStatus?table=crawl_status_table.
Acesso em: 10/set/2007



117
voltem a tomar a custdia das revistas para fins de preservao, mesmo que os
editores deixem de public-las tanto na verso impressa quanto na eletrnica.
Um compromisso se estabelece entre as editoras e as bibliotecas para
que as instituies possam coletar, armazenar, arquivar e preservar contedo
autorizado e salvaguardar o acesso das suas comunidades. Dessa maneira, o
modelo LOCKSS refora o controle de acesso por parte dos editores, sem mudar os
seus modelos de negcios, sejam eles restritos ou abertos. Os editores permitem
que as caixas do LOCKSS funcionem, publicando um termo que registra a sua
aprovao para que o processo ocorra. Nos novos sistemas de gerenciamento
eletrnico de editorao, como o Open Journal Systems (OJS/SEER) o termo j est
incorporado, deixando ao editor a deciso de permitir que as caixas LOCKSS
consigam identificar o endereo de IP e os contedos autorizados.


2.3.2.3 Gerenciamento editorial e preservao digital


A preservao digital comea a ser considerada uma extenso da misso
das publicaes cientficas com vistas a preservar o conhecimento de uma rea e
justificar os recursos conseguidos para suas atividades. O trabalho de coletar e
preservar materiais para o acesso futuro normalmente no de responsabilidade
direta do cientista ou do criador do material. Esse um problema do editor e das
bibliotecas que tm de preservar materiais por muitos anos. Raramente profissionais
que no so bibliotecrios ou arquivistas sabem dessa tarefa, at o momento que os
documentos comeam a sofrer danos ou so perdidos.
Na ltima dcada tem crescido o nmero de solues para criao e
gerenciamento de peridicos; com isso, os editores cientficos no precisam se
preocupar com a necessidade de aumento da visibilidade, uso e impacto dos seus
contedos. A preocupao desses editores com a preservao recai agora nas
potencialidades dessas solues com relao ao arquivamento das verses
originais.
Tanto na oferta de solues comerciais como na de software livre para a
editorao eletrnica de revistas, a variedade oferecida aumenta a cada dia. O
objetivo de todas elas est orientado a ajudar no cumprimento das tarefas editoriais


118
e na visibilidade das etapas da edio. As caractersticas que esses softwares
possuem em comum so as seguintes:
1. cadastro de todos os usurios do sistema;
2. produo de relatrios e estatsticas de uso;
3. adaptabilidade ao processo editorial de cada publicao;
4. suporte tcnico profissional;
5. produo e envio automtico de mensagens;
6. submisso de trabalhos on-line;
7. variedade de formatos de publicao;
8. aplicativos opcionais.
Entre as ferramentas que surgiram na ltima dcada e que favorecem a
edio completa de artigos cientficos na web, esto as relacionadas no Quadro 4.

Nome
Ano
Inicial
Software
Livre
Software
Proprietrio
Instituio/Empresa
Open Journal Systems
(OJS/SEER)
1998 X British Columbia University,
Fraser University
OpenACS 1998 X ArsDigita
SciX Open Publishing
Services (SOPS)
2001 X University of Ljubljana (Slovenia)
Article System 2002 X Sourceforge.net
TOPAZ 2003 X Edgewall Software
Digital Publishing System
(DPubS)
2004 X Cornell University Library
GAPworks 2005 X German Academic Publishers
Hyperjournal

2005

X



HyperJournal Association

EdiKit 1999 X Berkeley electronic Press
EJPress 1999 X eJournalPress
Electronic Submission and
Peer Review (ESPERE)
2000 X Electronic Libraires Programme (eLib) of the
Higher Education Founding Council for
England (HFCE)
Rapid Review 2000 X Cadmus Journal Services
Bench>Press 2001 X HighWire Press, Stanford University
Libraries
Manuscript Central 2001 X ScholarOne da Thompson Business
Xpress Track 2001 X XpressTrack
Editorial Manager 2001 X Aries Systems Corp.
Allen Track 2002 X eJournalPress.com
Quadro 4 Ferramentas para editorao eletrnica de revistas

O Open Journal Systems (OJS), software livre, de fonte aberta,
desenvolvido pelo Public Knowledge Project originrio da British Columbia University
(Canad) foi personalizado e traduzido pelo Instituto Brasileiro de Informao em


119
Cincia e Tecnologia (Ibict), com o nome de SEER (Sistema Eletrnico de
Editorao de Revistas). O instituto presta assistncia aos editores em cada uma
das etapas do processo de editorao e pode ser adaptado de acordo com as
prprias polticas de publicao (MRDERO ARELLANO, 2004). o primeiro
software em portugus de editorao eletrnica que possui o protocolo OAI para
intercmbio de dados essenciais (metadados) e que contem mecanismos para a
preservao de seu contedo em conjunto com o projeto LOCKSS (Figura 13).


Figura 13 - Pgina do OJS/SEER opo Arquivamento da Revista no LOCKSS
Fonte: Portal do SEER
28


Outro passo importante tem sido o que as associaes de editores de
peridicos cientficos e de pesquisa, como a International Union of Pure and Applied
Physics (IUPAP), tm recomendado aos pesquisadores, editores e bibliotecrios da
rea que desenvolvam formas de registro dos documentos que incluam informaes
sobre hardware e software para que isso sirva como uma ajuda em casos de
possveis migraes ou risco de perda dos dados e o uso de XML e outros formatos
padro apropriados rea (SMITH, 2001).

28
Disponvel em: http://seer.ibict.br. Acesso em: 10/out/2008.



120
Os sistemas de gerenciamento editorial tm encorajado os editores a usar
linguagens de marcao e esquemas XML para permitir que o material seja extrado,
integrado a outros servios, provendo aos aplicativos da web 2.0 os contedos que
os usurios obtm sob demanda (MORGAN, 2000). Os editores que optam por
sistemas baseados em SGML/XML esto disponibilizando formatos prprios para a
preservao como parte de seu processo normal de editorao.


2.3.3 Preservao digital em repositrios digitais


As bibliotecas, atravs do tempo, tm cumprido a misso de permitir a
descoberta e a entrega de material acadmico, mas elas no podem oferecer aquilo
que no coletam ou mantm. As bibliotecas na iternet so importantes para os
pesquisadores porque viabilizam a descoberta do que foi catalogado e publicado on-
line. Para organizar os documentos com informaes cientficas em uma biblioteca
digital, os profissionais da informao preparam metadados (descritivos, estruturais
e de preservao), arquivos para preservao, arquivos para acesso, diretrios,
projetos de documentao e repositrios de objetos digitais, seguindo prticas
adequadas de descrio.
As bibliotecas digitais, os repositrios digitais e os peridicos de acesso
livre esto requerendo mudanas em seus usurios, no que se refere s prticas de
trabalho e participao no esforo global, para definir e classificar seus documentos
segundo novos modelos de comunicao cientfica.
O estudo da preservao digital nas subreas da cincia da informao
tem passado do reconhecimento de sua necessidade e da sua definio, para
abordagens mais tcnicas e propostas de aes mais claras. Para alguns
especialistas, as bibliotecas digitais so consideradas o caminho mais adequado
para a preservao dos recursos de informao (HILDRETH, 1995). Lesk (1997)
resume essa afirmao destacando que as bibliotecas digitais so meios mais
dinmicos para as atividades de preservao digital do que as bibliotecas
tradicionais, considerando a sua adaptao s freqentes mudanas tecnolgicas.
Em contrapartida, pesquisadores de vrios projetos que envolvem
softwares para repositrios digitais asseguram que os repositrios institucionais so


121
os lugares adequados para testar e formular as metodologias e polticas a serem
adotadas pelos provedores de informao cientfica. O argumento no qual eles se
baseiam que os repositrios para preservao de objetos digitais devem estar
localizados em instituies confiveis e capazes de armazenar, migrar e dar acesso
a colees digitais (OCLC/RLG, 2002).
Os responsveis pelos acervos digitais confiam nos repositrios
institucionais poder preservar e dar acesso a material no apenas publicado em
peridicos avaliados pelos pares, mas tambm literatura cinzenta, como teses,
relatrios, documentos governamentais e, ainda, materiais suplementares, conjuntos
de dados, imagens, visualizaes e simulaes, comunicao informal como e-
mails, blogs, podcasts, websites, wikis e apresentaes.
Atualmente, os repositrios digitais podem integrar ferramentas de
preservao digital, ou aquelas que sejam equivalentes nessa funcionalidade. Uma
instituio pode tambm optar por definir um tipo de workflow que integre
ferramentas em determinados momentos do processo. Entre as ferramentas
atualmente disponveis esto as seguintes:
a) as que geram e capturam metadados: NLNZ metadata extractor;
29

b) as que identificam e avaliam os formatos de arquivo: JHOVE
30
e
DROID
31
;
c) as que padronizam arquivos para formatos preservveis ou formatos
abertos para a preservao: XENA
32
da National Archives of Australia,
entre outros.
Esses so alguns exemplos de sistemas e solues tecnolgicas que
esto sendo testados e que so considerados padres de preservao digital pela
comunidade cientfica, mas os pesquisadores esto muito distantes de uma
automao completa em sistemas de preservao digital.





29
Disponvel em: http://www.natlib.govt.nz/about-us/current-initiatives/metadata-extraction-tool
Acesso em: 13/out/2008
30
Disponvel em: http://hul.harvard.edu/jhove/ Acesso em: 13/out/2008
31
Disponvel em: http://droid.sourceforge.net/wiki/index.php/Introduction Acesso em: 13/out/2008
32
Disponvel em: http://xena.sourceforge.net/ Acesso em: 13/out/2008


122
2.3.3.1 Bibliotecas digitais


Segundo Webb (2000), as bibliotecas tradicionalmente so responsveis
por manter colees para uso permanente, protegendo-as de ameaas, ou
salvando-as e reparando-as para compensar seus impactos. No mundo das
bibliotecas digitais, um desafio importante a ser enfrentado a capacidade de poder
acolher diferentes tipos de formatos inovadores, assim como o planejamento de
suas adaptaes no futuro.
Uma biblioteca digital pode incluir inmeros programas e aplicativos
usados para criar e estruturar uma coleo digital. So softwares e sistemas que
servem para gerenciar e administrar esses recursos digitais, antes de serem
depositados e publicados. Essas ferramentas influenciam a maneira como os
documentos sero preservados e os respectivos custos envolvidos no processo.
Os sistemas informatizados para bibliotecas digitais atuais requerem
acentuado esforo de gerenciamento de colees digitais, que vai alm das tarefas
tradicionais das bibliotecas (ex.: aquisio, seleo, classificao, arquivamento), na
construo da interoperabilidade de acervos digitais (arquiteturas, metadados,
formatos padro), a qual possvel por meio de sistemas relacionados e
desenvolvidos para propsitos e comunidades especficas (ARMS, 2000).
Para Borbinha e Correia (2001), a biblioteca digital apresenta um dos
primeiros agrupamentos dos requisitos associados com as atividades tradicionais de
preservao como possvel acompanhar no Quadro 5.












123
Aquisio Entrega pelo produtor
Captura pela biblioteca
Coletado pela biblioteca
Verificao Integridade fsica (meio)
Integridade do contedo Integridade lgica
Autenticao
Registro Metadados Descrio bibliogrfica
Instalao e manipulao
Acesso
Preservao
Preservao Preservao fsica Refrescamento do meio
Migrao de suporte
Preservao lgica Converso de formatos
Emulao
Preservao intelectual
Acesso Condies de uso Acesso local
Acesso remoto
Quadro 5 - Estratgias de preservao no fluxo dos objetos digitais na biblioteca digital Fonte:
Borbinha e Correia (2001)

Esses autores mencionaram que, entre as responsabilidades de
preservao de uma biblioteca digital, esto as relacionadas com os seguintes
aspectos:
a) converso de formatos digitais;
b) tratamento dos metadados;
c) usabilidade dos dados disponibilizados;
d) infra-estrutura para manuteno dos sistemas;
e) desenvolvimento de software;
f) estruturao dos mecanismos de pesquisa;
g) consultoria sobre recursos digitais.
Entretanto, a preservao digital em mos das bibliotecas nacionais
evidencia outros subconjuntos de responsabilidades:
a) publicar: depsito externo, edio digital local, digitalizao e
metadados estruturais;
b) registrar e preservar: armazenamento, gesto de identificadores e
catalogao;


124
c) acessar: local e remotamente;
d) disseminar e pesquisar: catlogos on-line, ndices temticos (Web
Services, OAI-PMH, Z39.50).
Seja qual for o tamanho ou a importncia da biblioteca, verifica-se uma
diferena entre os repositrios e as bibliotecas digitais. Os repositrios de
informao digital so responsveis coletivamente por garantir, por meio de alguma
estratgia de preservao, a integridade e o acesso de longo prazo da herana
social, econmico-cultural e intelectual de um pas na forma digital. Uma biblioteca
digital um repositrio que coleta e prov acesso informao digital, mas pode
tambm no garantir o armazenamento de longo prazo e o acesso informao.
Muitas bibliotecas digitais podem ou no ser repositrios digitais, mas os
repositrios digitais realizam algumas funes de biblioteca digital pelo fato de elas
tambm selecionarem, obterem, armazenarem e proverem acesso informao
digital. Especificamente na rea de preservao digital, os repositrios digitais so
considerados parte da infra-estrutura de servios de uma biblioteca digital.


2.3.3.2 Repositrios Digitais


Um repositrio digital um servio de armazenamento de objetos digitais
que tem a capacidade de manter e gerenciar materiais por longos perodos de
tempo e prover o seu acesso apropriado. Os repositrios digitais dividem-se em
temticos, institucionais e centrais. Os repositrios temticos cobrem determinada
rea do conhecimento. J os repositrios institucionais (RI) so sistemas de
informao que armazenam, preservam, divulgam e do acesso produo
intelectual de instituies e comunidades cientficas, em formato digital, enquanto os
repositrios centrais so provedores de servios nacionais e internacionais que
permitem a reunio de dados coletados tanto de bibliotecas digitais, quanto de
repositrios temticos e repositrios institucionais.
O propsito dos repositrios estaria dirigido a dois aspectos: o acesso e o
armazenamento. As universidades de vrios pases esto adotando esta forma de
publicao para apoiar a divulgao dos resultados de pesquisas cientficas, criando


125
polticas institucionais para legitimar os repositrios de acesso livre como detentores
de produo cientfica reconhecida por rgos de fomento (LYNCH, 2003).
Os repositrios digitais compreendem um conjunto de ferramentas
necessrias para os produtores, disseminadores e usurios de documentos digitais.
Os projetos de preservao digital devem atender a pr-requisitos e serem parte de
um processo transparente de disponibilizao a longo prazo dos objetos digitais. Os
desenvolvedores desses projetos so responsveis pela aplicao dos padres
reconhecidos internacionalmente de preservao digital.
J em 1996, a Task Force on Archiving of Digital Information da
Commission on Preservation & Access (CPA) e a RLG analisou as possibilidades
dos repositrios digitais, chegando s seguintes concluses:
a) com a finalidade de preservar a longo prazo a informao digital, em
uma escala adequada demanda da pesquisa cientfica no futuro, as
instituies requerero uma infra-estrutura apropriada capaz de
suportar um sistema de distribuio de arquivos digitais;
b) um componente crtico da infra-estrutura de arquivamento digital a
existncia de um nmero suficiente de organizaes confiveis
capazes de armazenar, migrar e prover acesso s colees digitais
(WATERS & GARRETT, 1996 p. 46).
A gnese dos sistemas para repositrios digitais ocorreu no final do ano
2000, quando a University of Southampton na Inglaterra, lanou o pacote de
software chamado EPrints. Desde ento, o movimento para a construo de
repositrios digitais tem crescido consideravelmente, motivado pela convergncia
entre a reduo dos custos no armazenamento on-line, a proliferao da banda
larga e das tecnologias de redes de gigabits e o desenvolvimento de padres de
metadados para descrever o contedo dos repositrios.
As caractersticas principais dos repositrios para objetos digitais foram
mencionadas por Stewart Granger (2002) como aquilo que formaria a infra-estrutura
profunda, relacionada com toda a parte organizacional, aspectos legais e culturais,
assim como toda a parte tecnolgica. Para ele, o problema principal est em que
essa infra-estrutura realmente responda s necessidades da instituio e de seus
usurios, e no apenas as das empresas que comercializam essas tecnologias.
Para que isso seja possvel, ele menciona a necessidade de que existam


126
repositrios certificados, assim como mecanismos de colaborao que facilitem o
intercmbio entre a comunidade envolvida no tratamento de materiais digitais.
Esses repositrios incentivam o autodepsito e publicao na rede
gerenciada pelo pesquisador (self-archiving), utilizam novas tecnologias abertas
(open source), tornando disponveis as informaes para serem acessadas
permanentemente por diversos provedores de servios em nvel nacional e
internacional.
33
Tal mudana na publicao cientfica iniciou-se com a constituio
dos chamados repositrios digitais temticos. A idia evoluiu para o agrupamento
desses repositrios sob a responsabilidade de instituies centradas na divulgao
da produo cientfica local (CAF et al., 2003).
O crescimento do nmero de repositrios digitais no mundo est sendo
acompanhado pela Iniciativa dos Arquivos Abertos, como mostra a Figura 14.

Figura 14 - Crescimento dos arquivos/repositrios
34


33
Ainda na sua fase inicial, poucos repositrios tm alcanado tamanho e importncia considerveis.
Entre os principais esto Fedora (Flexible Extensible Digital Object and Repository Architecture),
CDSWare, Eprints, Archimene, ARNO, iTor, MyCoRe. Alguns provedores de servio baseados no
Protocolo OAI, que permitem a busca em mais de 250 arquivos abertos, so Arc, Citabase, MyOAI,
Perseus, Scirus, OAIIECSP, Callima, CYCLADES, OAIster, SAIL-eprints, TORII e PKP. Um dos
primeiros projetos de repositrios temticos foi o JSTOR (The Scholarly Journal Archive URL:
http://www.jstor.org/), criado para servir, apenas, como repositrio de preservao digital de
peridicos cientficos de algumas reas.

34
Fonte: ROAR. Disponvel em: http://roar.eprints.org/index.php?action=generate_chart Acesso em:
2/nov/2008.


127

Como demonstra a Figura 14, o aumento do nmero de repositrios
digitais comeou a ser expressivo a partir de 2002, o que se deve ao aparecimento
de sistemas para repositrios institucionais e seu impacto na infra-estrutura das
bibliotecas digitais existentes.


2.3.3.3 Repositrios Institucionais


Desde suas primeiras implementaes, os repositrios institucionais tm
sido voltados para a informao cientfica, contendo os trabalhos de pesquisa e
ensino de comunidades acadmicas, assim como a documentao de ampla
variedade de atividades das prprias universidades. Os repositrios institucionais
podem ser pensados como parte de uma ao dentro da gesto documental, que
inclui sua criao, tratamento, transmisso e acesso. Crowe (2002, p. 4) define os
repositrios institucionais como [...] um arquivo digital de produtos intelectuais
criados por uma comunidade de pesquisadores, estudantes e professores de uma
instituio [...]. Para Lynch (2003), eles representam servios e um compromisso:
Segundo meu ponto de vista, um repositrio institucional acadmico um
conjunto de servios que a universidade oferece para os membros da sua
comunidade, para o gerenciamento e disseminao do material digital criado
pela instituio e pelos seus membros. essencialmente o compromisso de
uma instituio de cuidar do material digital, incluindo a preservao a longo
prazo, quando apropriada, a organizao, acesso e distribuio. (LYNCH,
2003 s/p.).

O primeiro impacto que os repositrios institucionais causaram foi a
criao de bibliotecas digitais de teses e dissertaes, que permitiu que outros
documentos pouco divulgados por essas instituies fossem includos nos
repositrios. Regularmente so materiais importantes para as equipes e
empregados dessas organizaes. A misso dos repositrios institucionais ficou
centralizada na produo, manuteno, distribuio e preservao de grande
variedade de recursos de informao em rede para pesquisadores, professores e
estudantes de dentro e fora de uma instituio.
A primeira abordagem oficial a respeito dos repositrios institucionais foi
da Association of Research Libraries, na qual so mencionados alguns exemplos


128
(CROWE, 2002). Nos Estados Unidos, o governo tem usado repositrios
institucionais h muito tempo (Defense Technical Information Center, Department of
Energys Office of Scientific and Technical Information, NASA Center for AeroSpace
Information, National Technical Information Service e a Government Printing Office).
Na Europa, um dos primeiros pases a adotar os repositrios institucionais foi a
Frana, no seu Institut de lInformation Scientifique et Technique (INIST-CNRS).
Na dcada de 1990, diferentes tipos de organizaes comearam a
armazenar eletronicamente ampla variedade de materiais, resultando em grandes
repositrios que precisam ser agora preservados. A responsabilidade de se ter
optado por usar repositrios digitais vem crescendo, junto com a necessidade de
preservar por longo prazo os materiais neles contidos, sua organizao, acesso
constante e distribuio (LYNCH, 2003). Dependendo das circunstncias, a
responsabilidade de alimentar os repositrios, de organizar o contedo e de
preserv-lo ter prioridade na construo de repositrios digitais abertos (PINFIELD;
JAMES, 2003).
A implementao de repositrios institucionais levanta uma srie de
questes complexas sobre os recursos e estratgias organizacionais, assim como
questes sobre os papis e responsabilidades. Muitos projetos de repositrios
institucionais so motivados pelo desejo de mudar a comunicao cientfica. Essa
mudana, se necessria, poder questionar a responsabilidade das instituies de
ensino de publicar sua produo, retirando esse papel das grandes editoras
comerciais.
Na rea de inovao tecnolgica para o gerenciamento de contedos
digitais, os repositrios institucionais (RI) esto sendo considerados uma forma
eficaz de preservao da produo intelectual dos especialistas de uma ou vrias
instituies. Construdos no contexto das universidades e instituies
governamentais, eles garantem a visibilidade das colees digitais pela
potencializao do acesso informao e pela criao de indicadores da qualidade
da produo cientfica nas organizaes, mostrando a relevncia de suas atividades
e o valor da instituio.
Segundo Crowe (2002), os repositrios digitais so uma resposta a dois
assuntos estratgicos das IES: a) prover um sistema que expanda o acesso a
resultados de pesquisa, garantir o controle da produo acadmica, aumentar a
competio e reduzir o monoplio dos peridicos, diminuir os custos e destacar a


129
relevncia da prpria instituio e das bibliotecas; e b) servir como indicadores
potenciais da qualidade da universidade e demonstrar a relevncia cientfica, social
e econmica das atividades de pesquisa, para aumentar sua visibilidade, status e
valor pblico.
Porm, Pinfield (2002) afirma que os verdadeiros desafios na
implementao de repositrios institucionais so as questes culturais e
organizacionais. Uma das dificuldades existentes conseguir levar os autores ao
autodepsito sistemtico de sua produo intelectual. Uma alternativa que os
responsveis pelo repositrio ou os bibliotecrios depositem os itens em nome dos
autores, pelo menos no incio do desenvolvimento do servio. Tambm pode haver a
necessidade de formatao ou de converso de arquivos de modo a poder transferi-
los para o servidor do repositrio. A mesma alternativa sugerida como soluo. Em
ambos os casos, as bibliotecas podem facilitar o trabalho dos autores de
contriburem com suas pesquisas para os repositrios institucionais, porque esto
mais bem preparadas para prover a normalizao na preparao dos documentos
digitais.
Para Pinfield, Gardner e Macoll (2002), a principal meta dos repositrios
institucionais envolver os pesquisadores e usurios. A participao destes agentes
fundamental para a manuteno do repositrio. Eles precisam tanto contribuir com
contedo para o RI, como tambm us-lo para consultas e acesso literatura
tcnico-cientfica de outras instituies. Para que um repositrio seja valorizado
pelos pesquisadores, necessrio que ele seja confivel, que os contedos no
desapaream aleatoriamente.
Um repositrio institucional nunca uma iniciativa isolada; ele permite que
as bibliotecas possam trabalhar de um modo interdisciplinar, enquanto os canais
formais e informais de comunicao continuam a evoluir. Assim, ele muda tambm o
papel passivo das bibliotecas, de receptoras de material publicado para agentes
ativos na determinao do gerenciamento do contedo relevante prprio (NIXON,
2002).
A capacidade de contar com um espao onde possa ser depositada a
produo cientfica de uma instituio propicia o ambiente necessrio para a
discusso entre os pares, o intercmbio de idias dentro de uma comunidade de
pesquisadores e a reviso constante das verses de um documento. O debate
crtico alimentado de forma aberta pelos participantes dos repositrios de acesso


130
livre, e no se tem limite para o tamanho dos documentos ou extenso temporal da
discusso de qualquer tema. So resolvidos os problemas de distribuio dos canais
formais e o acesso pode ser gratuito.
Por serem um veculo de autopublicao por natureza, os repositrios
abertos solicitam, apenas, uma promoo institucional para seu uso. As instituies
reconhecem os materiais arquivados e os valorizam, estabelecendo as ligaes
entre a informao que precisam e aquela que desejam disponibilizar abertamente.
Um repositrio digital pode ser operado em qualquer organizao do setor
pblico. Atualmente existem instituies encarregadas de armazenar e gerenciar
material digital, mas so poucas as que asseguram ter a capacidade de
armazenamento de longo prazo. Muitas empresas privadas afirmam que provem
acesso e armazenamento, mas o acesso pblico restringido, e o proprietrio
original que gerencia o contedo em uma pgina comercial da internet passa o
controle direto do material para terceiros. Nesses casos, segundo Simpson (2004),
para manter os direitos e o controle sobre o material digital, deve-se consultar a
legislao, assim como especificar se as pesquisas foram financiadas, estipulando
que o material continuar sob o controle e propriedade da instituio que o gerou.
Um dos objetivos da publicao cientfica salvaguardar a propriedade
intelectual (OKUBO, 1997). Os repositrios institucionais lidam com essas tarefas e
com o problema da cpia apropriada. Existem, tambm, alguns tipos de licena
sobre a utilizao de material intelectual (Common License/Creative License), que
seguem as normas de direitos autorais. O nico obstculo atual para o acesso livre
mediante o uso de repositrios institucionais a ausncia de polticas institucionais
que requeiram o autodepsito da sua prpria produo cientfica.
A opo pelo autodepsito temtico e/ou institucional certamente mais
confivel. Alm disso, medida que o repositrio institucional se consolida, a coleta
automtica aos repositrios temticos e centrais poder auxiliar na segurana dos
dados, fornecendo backups, redundncias e espelho dos metadados e
documentos contidos nos repositrios temticos.
As diferenas sutis entre esses objetivos so complicadas devido
variedade de materiais publicveis. Por exemplo, nos repositrios, muitos dados so
considerados literatura cinzenta: relatrios, folhetos, guias, informativos, dados
oramentrios, memorandos e resultados de pesquisa que no foram publicados
(muitos deles de organizaes que no tm perfil de editoras). Acrescentem-se


131
lista trabalhos artsticos, pedidos de oramento, mapas, entrevistas de TV e rdio,
filmes, registros musicais, fotografias, relatrios de consultoria, desenhos tcnicos,
psteres.
Por causa da preservao digital desse tipo de materiais, os repositrios
institucionais se converteram em assunto muito relevante. Com eles, so colocados
em funcionamento servios para os membros das comunidades internas que visam
ao gerenciamento e disseminao de todo o material criado dentro de uma
instituio e fora dela. A vantagem dos softwares de repositrios est em prover
mecanismos para identificar consistentemente materiais que simplifiquem as
atividades relacionadas com futuras migraes. O objetivo possuir um software de
repositrio que possa garantir o gerenciamento das mudanas tecnolgicas e a
migrao do contedo digital para novas verses de mdia eletrnica. Sem uma
estrutura de repositrio, a migrao de materiais digitais pode chegar a ser um fator
complicador.


2.3.3.4 Repositrios institucionais nas bibliotecas


Os repositrios institucionais comearam a ter importncia para a
comunidade cientfica a partir de 2002. A comunidade de pesquisadores da rea de
preservao digital percebeu os benefcios que esses sistemas poderiam trazer para
as instituies acadmicas. Para Lynch (2003), com os repositrios digitais as
instituies acadmicas podem realmente apoiar a pesquisa da qual elas se
beneficiam, deixando seu papel passivo de editoras e participando do
desenvolvimento da arquitetura de novas funes dos sistemas de informao. No
incio de 2003, o movimento dos repositrios institucionais j expressava clara
misso: proporcionar s instituies acadmicas a possibilidade de investir no
desenvolvimento de sistemas de repositrios digitais.
Foi nesse momento que responsveis pelas bibliotecas, pelos arquivos e
pelos museus perceberam as possibilidades de integrao de acervos criada pela
homogeneidade dos documentos digitais com que lidam. Todos os objetos digitais
podem ser abordados da mesma forma por qualquer dessas instituies, sem que
uma perspectiva exclua as outras.


132
Na rea da cincia da informao, os repositrios institucionais esto
sendo considerados como uma das formas de mudar rapidamente a comunicao
cientfica e tambm como um dos incentivos para que as bibliotecas entrem em um
territrio inexplorado. A prioridade atual o desenvolvimento de repositrios
institucionais, softwares e servios que gerenciam e disseminam materiais digitais de
toda instituio. Os bibliotecrios lideram esse trabalho de forma inovadora, como
participantes de equipes colaborativas que podem incluir tecnologistas de
informao, arquivistas, professores e administradores de universidades, assim
como funcionrios pblicos e comunidades de usurios.
Como produtoras de pesquisas cientficas, as instituies acadmicas
esto interessadas na captura, disseminao e preservao da produo intelectual
de seus prprios membros. Tradicionalmente, as editoras e bibliotecas tm tido o
papel complementar de facilitar a publicao e preservao da produo cientfica.
Nas ltimas dcadas, as mudanas tecnolgicas e de mercado tm-se acelerado,
motivadas em parte pelo volume crescente da publicao de resultados de
pesquisas.
Essa mudana de papis est afetando a relao simbitica entre editoras
e bibliotecas. A combinao de uma rede quase ubqua com o aumento crescente
dos preos nos modelos tradicionais de publicao prepara o cenrio para novas
expectativas. Entre elas est o uso de repositrios institucionais para prover aos
professores novas formas de criar e preservar objetos de aprendizagem, tais como
ilustraes, visualizaes, modelos e vdeos.
Para Peters (2002), o papel das instituies de ensino superior e de
pesquisa envolvidas em projetos de preservao digital ser de detentoras de
repositrios digitais, que permitam controle da autoria e a cobertura de elevado
nmero de reas de conhecimento. Peters cita o exemplo do consrcio de
universidades pblicas de Ohio, nos Estados Unidos (OhioLINK), que est se
desenvolvendo para ser um servio de repositrio digital por meio do [...] auto
depsito da informao de bases de dados de artigos de peridicos e bancos de
teses e dissertaes de bibliotecas participantes [...] (PETERS, 2002, p. 415).
Outros autores, como Messerschmitt (2003) e Hitchcock (2003), tambm
asseguram que os repositrios institucionais poderiam ser viabilizados mais
facilmente atravs de sistemas distribudos de preservao digital. Neles, os
repositrios centralizados e mais bem organizados compartilhariam suas


133
metodologias com os outros repositrios temticos e institucionais. Para
Messerschmitt, o papel das bibliotecas como curadoras da informao digital
fundamental, uma funo que elas tm realizado por sculos.
Como a maioria dos repositrios est em instituies acadmicas, as
bibliotecas universitrias comearam tambm a desenvolv-los. As bibliotecas esto
se unindo s agncias de governo, sociedades histricas, museus e outras
instituies culturais para estabelecer repositrios comunitrios ou temticos. Nesse
intuito, vrios repositrios esto sendo desenvolvidos em consrcio, uma vez que
nem todas as instituies acadmicas precisam ou desejam t-los.
Os repositrios institucionais estendem significativamente o papel das
bibliotecas, representando um compromisso srio e de longa durao, com muitos
benefcios. Professores e cientistas que comeam a usar repositrios institucionais
para publicar e preservar seus trabalhos confiam na integridade, conhecimento e
competncia daqueles que gerenciam esses repositrios.
A experincia acumulada de adoo de padres e protocolos de
comunicao por parte dos profissionais da informao fundamental na construo
de repositrios institucionais confiveis. Eles podem definir um conjunto mnimo de
critrios para o arquivamento de informaes cientficas produzidas em uma
instituio. Esse conjunto de critrios para o desenvolvimento de um repositrio de
preservao deve estar influenciado pelo modelo OAIS e pelo princpio arquivstico
de custdia responsvel.


2.3.3.5 Softwares para repositrios institucionais


Com o surgimento da Iniciativa dos Arquivos Abertos
35
, inicialmente
conhecida como UPS (Universal Preprint Service), na ltima dcada do sculo XX,
diminuram as dificuldades que os autores enfrentavam para disponibilizar o
resultado das suas pesquisas internacionalmente, aumentando a sua visibilidade e a
estimativa de impacto na comunidade, o qual medido pelo grau de usabilidade
alcanado (HARNAD, 1999).

35
Disponvel em: www.openarchives.org Acesso em: 23/out/2008


134
Atravs dos padres de interoperabilidade do modelo OAI (metadados
Dublin Core, protocolo de coleta de metadados OAI-PMH, dentre outros), os autores
e os editores interessados em disponibilizar suas publicaes abertamente podem
ter seus trabalhos compartilhados com outras instituies. Esta uma das formas
utilizadas pelas universidades para apoiar a divulgao dos resultados de pesquisas
cientficas, criando mecanismos para legitimar e estimular a publicao dos
trabalhos produzidos (LYNCH, 2003).
Para Harnad (2003), os repositrios institucionais tm cinco objetivos:
a) realizar o autodepsito da produo cientfica institucional em forma
de pr-prints, ps-prints, teses, dissertaes, colees digitais,
matriais digitais preservveis, materiais para o ensino e as verses
eletrnicas de peridicos e livros;
b) providenciar o gerenciamento da coleo digital institucional;
c) prover material para o ensino distncia;
d) viabilizar a publicao eletrnica;
e) preservar o contedo digital institucional.
Na perspectiva da Iniciativa dos Arquivos Abertos, nem todos os
repositrios institucionais possuem as mesmas metas, mas eles compartilham
objetivos similares. O contexto dos repositrios pode ser caracterizado pelos
seguintes atributos:
a) repositrios que armazenam arquivos que nasceram digitais, sem
anlogos em papel;
b) repositrios que possuem atributos de confiabilidade e
disponibilidade relevantes para a comunidade cientfica;
c) repositrios de acesso contnuo, atributo digital que garante a
possibilidade de citar, descobrir, entregar e usar o recurso depois de
sua criao e depsito no repositrio.
Esses atributos devem ser garantidos permanentemente para prevenir as
falhas dos formatos e controlar os efeitos das mudanas tecnolgicas. Tambm, os
processos de preservao digital devem estar apoiados em polticas bem definidas,
na sua organizao e nas estratgias adotadas.
Como mencionado anteriormente, o modelo OAIS fornece as
especificaes de um repositrio e estabelece responsabilidades que uma
organizao deve distribuir para operar como um arquivo de acesso livre. O modelo


135
de referncia define um sistema de informao para arquivamento aberto como
aquele composto por uma organizao de pessoas e sistemas que aceitam a
responsabilidade de preservar informao e sua disponibilizao para uma
comunidade especfica. A aplicao dos princpios do modelo OAIS, e
particularmente, a implementao de um arquivo de acesso livre em concordncia
com os modelos de funcionalidade e estrutura da informao do OAIS o pr-
requisito chave para estabelecer repositrios confiveis e garantir a preservao de
longo prazo dos seus atributos digitais.
Para garantir a confiana nos repositrios digitais de acesso livre por parte
dos autores e dos usurios, eles devem manter algumas propriedades de
preservao digital mnimas:
a) autenticidade: a certeza de que um componente digital foi criado
pela pessoa que afirma t-lo feito; a autenticidade permite ter a certeza
de que o criador do objeto digital no pode negar que foi ele quem o
criou. As assinaturas digitais e as marcas dgua digitais so tcnicas
que garantem a autenticidade dos objetos digitais;
b) integridade: a habilidade de manter os dados completos e corretos,
prevenindo mudanas acidentais ou maliciosas (corrupo dos dados).
Entregando e salvando um bit/byte checksum, como o MD5 faz,
constitui uma tcnica bsica para detectar se qualquer modificao
produziu algum efeito nos objetos digitais depois de ter sido inserido no
repositrio;
c) confiana e disponibilidade: a confiabilidade est relacionada
habilidade dos componentes de hardware e software funcionarem de
acordo com suas especificaes sem erros ou defeitos. Disponibilidade
a porcentagem do tempo que o sistema est regularmente em
funcionamento, em relao com o tempo total que ele deve operar.
Algumas tcnicas usadas para garantir altas porcentagens de
confiabilidade e disponibilidade so backups, softwares de antivrus,
firewalls, operating system patches, atualizaes de aplicaes de
software, componentes de hardware de redundncia e tolerncia de
falhas;
d) capacidade de reuso: habilidade de acessar um recurso digital pelo
tempo que a instituio decida manter o repositrio. Os objetos digitais


136
cientficos e acadmicos que possuem valor por longo perodo de
tempo devem ser recuperados apropriadamente e reusados ao menos
por um perodo longo de tempo (uso de identificadores permanentes e
mantendo formatos e mdias). A preservao digital deve incluir todos
os componentes de dados da infra-estrutura dos repositrios digitais de
acesso livre, no apenas os objetos digitais, mas tambm seus
metadados e identificadores.
Com toda essa variedade de materiais e metas, possvel entender o
porqu do aparecimento de sistemas de software to diversificados. Mas no todas
essas diferenas surgem por causa, apenas, do tipo de contedos que cada
repositrio coleta. Os sistemas existentes aplicam-se ampla maioria dos contextos
institucionais, permitindo uma variedade de funcionalidades e recursos para gesto
de documentos eletrnicos.
A implementao dos RI pode ser realizada de forma simples: uma
estrutura hierarquizada, acesso via Web e metadados coletados por meio do
protocolo OAI-PMH, permitindo assim que os usurios, ao optar por qualquer
mecanismo de busca da Iniciativa dos Arquivos Abertos, possam encontrar e
recuperar o contedo do repositrio.
A maior diferena entre os programas para repositrios institucionais est
na origem do software, se ele gratuito ou comercial. Os softwares comerciais no
esto abertos para modificaes locais na maioria dos casos. Nos softwares
abertos, os cdigos de programao esto disponveis para que os usurios possam
conhec-los e modifica-los. Na maioria dos casos, os softwares no vm com uma
licena. O sistema operacional Linux o exemplo mais conhecido.
Os espaos para o depsito e submisso de documentos digitais com
informaes cientficas esto sendo desenvolvidos em alguns programas com
caractersticas parecidas. Alguns pacotes de software livre para repositrios
institucionais tm ganhado destaque, entre eles:
EPrints, o mais antigo, possui a base de instalao mas variada.
Disponibilizado pelo Joint Information Systems Committee na Inglaterra
e pela National Science Foundation dos Estados Unidos, este sistema
focaliza a produo cientfica tradicional em forma de pr-prints e ps-
prints. A publicao no EPrints segue o modelo tradicional da
publicao impressa. Mesmo sendo um software que prov


137
longevidade e acompanha o desenvolvimento na rea da preservao
digital, a primeira motivao do EPrints no a preservao de longo
prazo.
Greenstone um software que permite a construo e distribuio de
colees digitais de bibliotecas. Desenvolvido pelo New Zealand Digital
Library Project, o Greenstone est sendo distribudo em colaborao
com a Unesco e a Human Info NGO.
i-Tor do Netherlands Institute for Scientific Information Services
implementa um tipo de repositrio de dados independente. O contedo
e a interface de usurio funcionam como partes autnomas porque o i-
Tor publica os dados de grande variedade de sistemas de bases de
dados relacionais, tipos de arquivos de sistemas, e de sites na web.
CDS Invenio (antigo CDSWare) cobre todos os aspectos de uma
biblioteca digital e usado entre outros repositrios no mundo pelo
repositrio da CERN, o maior entre todos os registrados no ROAR e o
terceiro entre os repositrios institucionais (no centrais que coletam
de outros repositrios institucionais). O repositrio da CERN tambm,
pelo seu elevado ndice de textos completos o que conta com mais
aceitao institucional. Segundo Harnad (2003), o repositrio da CERN
tem a melhor poltica de repositrios institucionais no mundo, com o
mandato de auto-arquivamento institucional mais compreensivo,
sistemtico e com sucesso
36
. Mas o CERN no promove a adoo de
sua poltica institucional de auto-arquivamento, quando repassa o
software CDS Invenio.
Fedora (Flexible Extensible Digital Object Repository Architecture)
Desenvolvido pela University of Virginia Library e o Cornell University
Digital Library Group, o Fedora um software livre que focaliza a
implementao e gerenciamento de bibliotecas digitais (STAPLES;
WAYLAND; PAYETTE, 2003). Ele pode incluir servios de
preservao, pois segue o modelo OAIS nas suas principais funes
de entrada e sada de dados. A empresa VTLS usa o Fedora como

36
Disponvel em: http://www.eprints.org/signup/fulllist.php Acesso em 12/0ut/2008


138
base em alguns dos seus produtos comerciais para sistemas de
bibliotecas.
DIAS (Digital Information Archive System) foi desenvolvido
originalmente por uma empresa para a Biblioteca Nacional da Holanda,
com o objetivo de lidar com o depsito de documentos digitais e
informao multimdia. A Koninklijke Bibliotheek usou como base os
resultados obtidos em vrios projetos nos ltimos anos, como no
sistema Deposit of Netherlands Electronic Publications (DNEP)
(STEENBAKKERS, 2000); o seu design observa os requisitos de um
sistema de depsito, suporta a insero automatizada e manual de
materiais, que podem ser acessados via web, e um sistema baseado
no gerenciador de contedo da IBM (IBM, 2003).
OCLC Digital Archive est baseado no modelo OAIS e proporciona
acesso de longo prazo, armazenamento e preservao de objetos
digitais; usa a estrutura de metadados do METS (Metadata Encoding
and Transmission Standard) para permitir a interoperabilidade com
outros arquivos e est conectado com o sistema de catalogao
OCLCs Conexion.

A vantagem desses softwares de repositrios est em disponibilizar
mecanismos para identificar consistentemente materiais que simplifiquem as
atividades relacionadas com futuras migraes. O objetivo das instituies
responsveis pela guarda de informaes digitais possuir um software de
repositrio que realize as migraes de forma estvel, apesar das mudanas
tecnolgicas.


2.3.3.6 Repositrios DSpace


Dentre os softwares citados, a ferramenta que tem sido implementada pelo
maior nmero de instituies e que desde sua criao deu prioridade preservao
digital o DSpace. Orientado para ser um programa usado em repositrio que
captura a produo intelectual das instituies de pesquisa, diferentemente dos


139
outros softwares, o DSpace estende-se para uma variedade maior de tipos de
materiais e possui mais opes de preservao de objetos digitais.
O DSpace um software livre desenvolvido pelo Massachusetts Institute
of Technology (MIT) Libraries e pelos Laboratrios Hewlett-Packard para criao de
repositrios institucionais e multidisciplinares para bibliotecas, arquivos e centros de
pesquisa. Sua estrutura prov um modelo de informao organizacional baseado em
comunidades e colees, o qual pode ser configurado de modo a refletir todo o
conjunto de unidades administrativas de uma instituio. Permite a configurao do
processo editorial nos moldes dos peridicos tradicionais, incluindo a possibilidade
de reviso pelos pares. Suporta os mais variados tipos de formatos de arquivos
digitais, incluindo textos, som e imagem (Figura 15).


Figura 15 - Primeira interface do DSpace da Cornell University

O surgimento do DSpace em 2003 est relacionado iniciativa da Open
Courseware (OCW) da MIT, com o objetivo prover acesso livre, recupervel e
coerente aos materiais de ensino do MIT (DSPACE, 2002). Eles so parte da infra-
estrutura que o Council on Educational Technology (MITCET) formou em 2000.
Tambm, o projeto estabelece conexo com outras iniciativas, como a que est
sendo realizada na Harvard University, chamada Digital Repository Service (DRS). O
DSpace representou a entrada do MIT na comunidade de desenvolvimento de
software livre, com um sistema completo e disponvel gratuitamente. O interesse foi


140
expressivo desde as etapas pr-operacionais do projeto, sendo considerado pelos
pesquisadores como um modelo na criao da estrutura de outros sistemas.
O DSpace possui uma natureza operacional especfica de preservar os
objetos digitais que so de interesse da comunidade cientfica. Criado inicialmente
para a implementao de arquivos institucionais, tem sido usado para o
compartilhamento da produo cientfica nas universidades. O software resultado
da implementao de padres j aceitos internacionalmente, como o Open Archive
Initiative, o Open Archival Information System Reference Model e o Dublin Core.
Atualmente est sendo utilizado para promover uma aliana entre repositrios
federativos e instituies.
A misso do DSpace oferecer um armazenamento estvel a longo prazo
para todos os materiais produzidos pelos professores e pesquisadores do MIT. A
preservao de longo prazo seria em ampla variedade de formatos, incluindo texto,
udio, vdeo, imagens, bases de dados, entre outros; assim como possibilitar o
acesso remoto a todos os materiais atravs de uma interface coerente. As
funcionalidades de preservao estiveram presentes desde as primeiras etapas do
design da arquitetura do repositrio, envolvendo aspectos sociais (CHUDNOV,
2001).
Para os desenvolvedores do DSpace, alm do seu uso como repositrio, o
software foi implementado para ajudar na pesquisa dos sistemas de gerenciamento
de contedo que contemplam a preservao, o arquivamento e a distribuio de
materiais digitais. A plataforma utiliza o modelo OAIS, seu vocabulrio para
descrever sistemas de arquivamento de mdias e a verificao dos planos
operacionais e funcionais para determinado repositrio. A influncia do OAIS no
design da arquitetura do DSpace faz dele um exemplo de repositrio com
funcionalidades de arquivamento digital.
Os repositrios digitais podem abordar uma preservao a curto ou longo
prazo (CROW, 2002), promovendo o ambiente necessrio para a disseminao e
processos de reproduo, assim como criar o compromisso institucional com a
preservao. No DSpace, a preservao ocorre no nvel dos bytes onde a ordem de
cada item armazenada, assim como sua habilidade de preservao em alto grau
de representao, que pode facilitar na identificao e servir como evidncia das
partes de um registro. Muitos repositrios enfrentam dificuldades para chegar a esse


141
grau de representao. Ainda so poucos os repositrios adequadamente equipados
para lidar com metadados de preservao.
Os nveis de preservao no DSpace so fundamentais devido,
principalmente, ao uso de metadados na sua concepo. No DSpace encontrou-se
trs tipos bsicos de metadados descritivos, administrativos e estruturais. A
estrutura dos metadados segue o modelo de metadados METS. Os metadados
descritivos esto baseados no Library Application Profile for Elements and Qualifiers,
mas qualquer instituio que faa opo pelo DSpace pode mudar o conjunto de
metadados usado.
No nvel das comunidades e das colees, usam-se metadados
descritivos simples derivados de um subconjunto do Dublin Core. Os metadados
estruturais contm informaes sobre como apresentar um item ou bitstream, assim
como informaes sobre as relaes entre os itens. Nos metadados administrativos
esto includos os metadados de preservao, de origem e a informao sobre a
poltica de autorizaes. Muitos deles so organizados segundo o esquema de
relacionamento DBMS. As informaes sobre Origem (Provenance) so mantidas
em Dublin Core, mas em uma descrio simplificada. Nesta rea de metadados
administrativos espera-se que o dicionrio de metadados da OCLC/RLG PREMIS
possa ser utilizado na identificao dos elementos para metadados de preservao.
O DSpace faz uso da terminologia de comunidades para definir os
espaos dos contedos onde os usurios podem localizar a informao. Em cada
comunidade os usurios encontram colees, e nelas esto os itens ou [...]
agrupamentos de contedos e metadados que permitem seu arquivamento em
pequenas unidades [...] (DSpace, 2002).
Os itens no DSpace so os registros ou arquivos, organizados em bundles
ou agrupamento de bitstreams, como aqueles contidos num arquivo html e suas
imagens associadas, tendo no seu nvel mais elementar a organizao dos itens por
bitstream, identificados pelo seu formato de bitstream.
Os itens constituem conjuntos de informaes que descrevem o
conhecimento sobre o formato e a codificao do bitstream, incluindo uma verso
MIME e o nome do tipo de formato (ex. Adobe PDF). As informaes tambm
contm especificaes do formato e cdigo fonte para manipulao do formato. A
diviso hierrquica dos bitstreams e seus agrupamentos na forma de metadados
adicionados correspondem aproximadamente ao modelo de informao do OAIS.


142
A preservao desse tipo de contedo gerenciado na arquitetura do
DSpace pelo Bitstream Storage Manager. O administrador do armazenamento dos
bitstream uma das mais importantes funcionalidades de preservao na
arquitetura do DSpace, pois nela so armazenadas as informaes sobre os
arquivos submetidos ao nvel de bitstream, permitindo uma capacidade limitada de
transao para os bitstreams.
A complexidade inicia no momento em que o gerenciador do
armazenamento e seus administradores comeam a identificar o nvel do servio de
preservao para cada um dos itens e, dessa forma, determinar o grau de suporte
para cada tipo de bitstream.
Os administradores do DSpace dividem os formatos de bitstream em duas
categorias: conhecido e desconhecido. Os tipos de bitstream conhecidos so
divididos tambm em formatos suportados e os que o sistema no suporta
(TANSLEY et al., 2003). Os conhecidos so aqueles aos quais os administradores
do DSpace nomearam o formato do arquivo, sua verso, mimetype e outras
informaes relevantes (ex.: sua relao com outros formatos) dentro do registro dos
formatos do bitstream do sistema. Alm disso, um processo foi ativado para
identificar automaticamente as futuras submisses, usando o formato j nomeado.
Ser suportado significa que os administradores procuraram e
armazenaram especificaes documentais do formato suficientes no DSpace ou em
formato anlogo numa biblioteca confivel.
O conhecimento dos administradores dos diferentes formatos de bitstream
e seu suporte possibilita novo nvel de servios de preservao. O mais alto nvel
denominado Suportado Nvel 2. Esse servio estabelecido quando o bitsream
mantido e recuperado sob pedido no futuro. Acrescente-se a isso que a instituio
confia na sua habilidade de usar e entender que o material depositado poder ser
razoavelmente preservado e existe um comprometimento com essa finalidade, da
forma mais apropriada, segundo o contexto que envolve cada material. As tcnicas
de preservao a serem aplicadas incluem estratgias como emulao, migrao,
servios de transformao de formatos.
Todas as funcionalidades do Gerenciador de armazenamento de bitstream
(Bitstream Storage Manager) podem ser contextualizadas dentro da concepo de
planejamento da preservao (Preservation Planning) no modelo OAIS. Da mesma
forma, alguns componentes tambm podem participar da Administrao e


143
Armazenamento de Arquivamento (Administration and Archival Storage). Isso mostra
como o modelo OAIS pode ser aplicado em todas as funes de um repositrio. Os
desenvolvedores do DSpace tomaram como exemplo o desenho do repositrio
Harvard DRS na arquitetura do DSpace, especialmente os componentes
relacionados com a identificao e gerenciamento dos nveis de preservao da
informao digital que ele suporta.
Uma peculiaridade que faz do DSpace um repositrio orientado para a
preservao digital o fato de que, alm de utilizar tecnologias como as
mencionadas, ele opera em um ambiente computacional de ferramentas de cdigo
aberto (software livre). Isso permite assegurar a viabilidade da estrutura de longo
prazo, apoiada na comunidade de usurios e desenvolvedores que mantm as
informaes sobre o DSpace sob uma licena BSD.
O DSpace o exemplo de um repositrio confivel que garante a
manuteno de formatos de arquivos gerenciando-os, identificando-os e aplicando
processos de preservao que o sistema capaz de suportar. As instituies que
adotam o DSpace conseguem, alm de identificar quais so os arquivos ou colees
que precisam de maior proteo, realizar um planejamento sobre a manuteno de
cpias de software e hardware e sua documentao necessria para identificar os
tipos de arquivo indispensveis para o uso dos objetos digitais no futuro. Essas
aes servem para que os usurios do sistema possam ter maior grau de confiana
de que seus documentos recebero os cuidados necessrios sua preservao.


2.3.3.7 Repositrios e identificadores persistentes


Outra rea relacionada com a preservao digital a tcnica de
nomeao persistente dos objetos digitais ou incorporao na arquitetura de um
sistema de URN (Uniform Resource Name). Identificar e localizar consistentemente
contedo so cruciais para os softwares de repositrios. Existem vrios URN, tais
como o Handle System, o DOI (Digital Object Identifier) da CrossRef e o PURL
(Persistent Uniform Resource Locators) da OCLC. Para facilitar o acesso


144
permanente, cada objeto deve ter um identificador que transcende o prprio
software.
37

Os identificadores permanentes esto relacionados diretamente com os
padres de preservao digital, sendo um componente importante da infra-estrutura
dos repositrios digitais, para ajudar a garantir que os objetos digitais possam ser
gerenciados e localizados no futuro. Os identificadores permanentes devem
permanecer vlidos, mesmo se o contedo for migrado para um novo sistema ou se
a administrao responsvel pelo repositrio institucional mudar.
O PURL foi desenvolvido pela OCLC baseado no padro URL (Uniform
Resource Locator) do protocolo HTTP. O funcionamento do PURL est estruturado
na conexo de URL que apontam para um servio de resoluo (service resolver)
mantido para redirecionar um endereo ou link de pginas web que no esteja
funcionando para o endereo ativo. Trs exemplos de instituies que usam PURL
para a preservao do acesso s informaes nas suas pginas web so: o Digital
Archive da OCLC, a US. Government Printing Office e o US Department of Energys
Office of Scientific and Technical Information.
O Handle System, criado pela Corporation for National Research
Initiatives (CNRI), como um software de URN permite que qualquer item possa ser
encontrado no decorrer do tempo, apesar de haver mudado de local fsico. Os
protocolos do sistema possibilitam que de forma distribuda um servidor remoto
guarde os handles ou identificadores permanentes dos recursos de informao e
reconhea a informao necessria para localizar e acessar tais recursos. Essa
informao pode mudar quando necessrio, para ser capaz de descrever o estado
atual do objeto digital, sem mudar o prefixo ou handle. O sistema Handle tambm
usa um servio de resoluo de identificao, mas no Handle, o servio permite que
um nico prefixo resolva uma ou mais URL com verses, formatos e locais
diferentes para o mesmo documento.
No caso do DSpace, cada repositrio obtm um handle ou prefixo do do
CNRI que permite a identificao persistente do Handle System para todos os
documentos depositados, como um componente do repositrio institucional e

37
PURL: Online Computer Library Center Inc. http://purl.oclc.org
URN: Internet Engineering Task Force. http://www.ietf.org/html.charters/urn-charte.html
DOI: International DOI Foundation. http://www.doi.org
Handle System: Corporation for National Research Initiatives. http://www.handle.net/index.html



145
convertendo-o globalmente em nico. Um handle pode ser designado a
comunidades, colees ou itens, menos aos bitstreams, porque ele pode mudar para
dar suporte a novas atividades de preservao. Instituies como a Koninklijke
Bibliotheek na Holanda e a Defense Technical Information Center nos Estados
Unidos tm includo os identificadores persistentes do Handle System
(STEENBAKKERS, 2002).
Algumas organizaes internacionais j trabalham no sentido de criar seus
prprios sistemas de identificadores permanentes. Um dos mais reconhecidos o
DOI da International DOI Foundation, que em 1998 implementou o Handle
System especificamente para a gesto da propriedade intelectual, gerenciando
identificadores permanentes de links referenciados entre publicaes, com seu
prprio registro de nomes de autoridades. Em 2003, a DOI Foundation comeou a
designar seus identificadores persistentes a documentos com dados cientficos, e
tem sido usado para referenciar e citar documentos originais, aumentando com isso
a possibilidade de que os documentos sejam encontrados e reusados.
Entre os Handles e PURLS alternativos que vm surgindo, podem ser
mencionados os seguintes:
Archival Resource Key (ARK) criado pela Califrnia Digital Library
usado em todos seus objetos digitais e servios (KUNZE, 2003);
permite o acesso a longo prazo a informaes contidas em qualquer
tipo de suporte, pois contm partes que so flexveis para suportar
redirecionamento de URL, associando permanentemente um nome a
um objeto especfico.
38

URN baseados no ISSN e no ISBN, como no projeto DiVA da Uppsala
University na Sucia (MUELLER et al., 2003) e nos projetos EPICUR e
CARMEN da Alemanha.
Local Identifier Scheme da National Library of Australia para todas as
publicaes no projeto PANDORA Archive, permitindo a criao
automtica de identificadores permanentes incorporada no software
PANDAS, fazendo com que o esquema local possa ser convertido em
um sistema global.

38
Disponvel em: http://www.cdlib.org/inside/diglib/ark/ Acesso em: 16/out/2008


146
N2T (Name-to-Thing) um servio de resoluo de identificadores
persistentes e um consrcio de organizaes que lidam com a
memria cultural (http://n2t.info/).


2.3.3.8 Repositrio uniforme do INPE


No Brasil, a biblioteca do Instituto de Pesquisas Espaciais (INPE) comeou
a desenvolver em 1995 o Uniform Repository for a Library (URLib)
39
para resolver o
problema da integrao de documentos produzidos por pessoas utilizando sistemas
de arquivos independentes (BANON; BANON, 2005). Para gerenciar os repositrios
uniformes que alimentam o acervo da biblioteca, foi desenvolvido o URLibService. A
biblioteca contm documentos eletrnicos formados por colees de arquivos e
diretrios depositados em vrios repositrios uniformes ou acervos locais utilizando
o Apache como servidor web.



Figura 16 Interface da Biblioteca Digital Memria do INPE
40


39
Repositrio Uniforme para uma Biblioteca
40
Fonte: INPE. Disponvel em: http://bibdigital.sid.inpe.br Acesso em: 15/dez/2008



147

Assim como o ARK, no sistema de Identificao URLibService a gerao
dos identificadores pode ser feita pelos prprios provedores de dados, se precisar de
cadastramento junto ao resolvedor de identificao, como no caso do Handle
System, estabelecendo-se um vnculo automtico entre documentos depositados
em dois provedores distintos. Tambm a vantagem do URLibService de que a
diferencia do DOI, pois consegue resolver [...] a distino entre um documento e
suas cpias, oferecendo para o usurio final a garantia que o documento acessado
sempre o mesmo, seja ele uma cpia ou no [...]. (BANON, 2006).
Com o URLibService, o Inpe desenvolveu o primeiro servio de
identificao global de nome no Brasil, sendo a primeira soluo nacional para os
problemas de links e citaes permanentes. Assim como, tambm, o primeiro
sistema de autodepsito nacional que respeita os direitos autorais e que certifica a
originalidade dos trabalhos. O programa livre para instituies pblicas e
associaes sem fins lucrativos (BANON, 2006).
Em 2007, as instituies brasileiras como o CNPq, a Bireme e o Ibict
comearam a usar em alguns de seus sistema de informao o redirecionamento
que o identificador DOI estabelece, para citar artigos ou partes de artigos dos
pesquisadores (Sistema LATTES) e no endereo dos artigos nas revistas na base
de dados SciELO e no sistema OJS/SEER verso 2.1.


2.4 GERENCIAMENTO DA PRESERVAO DIGITAL


Como parte da construo cultural da realidade, a informao reflete as
vises do mundo de uma sociedade em determinado tempo. No sculo XX, a
informao tcnico-cientfica tornou-se relevante para o progresso econmico das
naes. O desenvolvimento cientfico e tecnolgico trouxe consigo maior oferta de
recursos de informao para a populao mundial. As novas tecnologias de
informao colocaram em evidncia o papel dos meios e tcnicas digitais de
gerenciamento da informao digital. O material digital, seja aquele criado em
computador ou digitalizado, est presente na maioria dos servios de informao
(WEBB, 2000).


148
Em vrios pases, h urgncia na definio das polticas, obrigaes e
metodologias mais apropriadas para a administrao dos recursos digitais.
Internacionalmente, iniciativas dos setores pblico e privado se multiplicam, tentando
estabelecer metodologias e estratgias que incluem tcnicas de preservao que
possam responder s necessidades de garantir a longevidade dessas informaes
(Apndice C).
A compreenso da preservao digital por parte das instituies
responsveis por acervos culturais e histricos tem focalizado os obstculos
tcnicos e a habilidade de provar a validade das solues tecnolgicas adotadas. Os
modelos de sistemas da preservao digital dentro do contexto das instituies
produtoras de conhecimento em C&T e das bibliotecas universitrias tm sido
analisados por vrios autores. Alguns temas conexos, como a produo cientfica e
aspectos especficos sobre preservao, como hardware e software envolvidos, a
seleo do que ser preservado, o custo da preservao tm sido tratados, assim
como existe uma nfase na necessidade de planejamento do que ser selecionado
para se preservar.
Desde a primeira proposta de um esquema conceitual que abordou o
gerenciamento da preservao digital, feita por Daniel Greenstein em 1998,
detectou-se que os requisitos da preservao digital influenciam a maneira como os
recursos digitais esto sendo estruturados, documentados, armazenados, validados
e as condies como eles podem ser acessados. Greenstein (1998) descreveu o
gerenciamento do material digital em sete mdulos interligados, nos quais as boas
prticas dependem das decises dos desenvolvedores das colees sobre aspectos
como tipo de contedo e formato (Quadro 6).











149
Mdulo Submdulo Sub-submdulo
Dados de Seleo e
Avaliao

Dados de Criao
Dados de Gerenciamento Dados Estruturais
Dados de Documentao
Dados de Armazenamento
Dados de Validao Dados de Valorizao
Dados de Cpia
Restaurao da Mdia
Dados de Divulgao
Dados de Uso
Dados de Preservao
Gerenciamento de Direitos
Quadro 6 Gerenciamento dos dados preservao digital
Fonte: verso traduzida e adaptada de Greenstein, (1998)

O modelo de Greenstein trata dos tipos de decises que devem ser
tomadas no gerenciamento de recursos digitais. Algumas delas independem do
controle dos responsveis pelas colees. So informaes gerenciais sobre a
estrutura do dado (como e quantas vezes ele foi formatado e codificado),
informaes sobre a sua origem, suporte e locais de armazenamento,
procedimentos adotados para garantir a integridade do dado (completude,
funcionalidade e consistncia), permisses de uso e direitos autorais. Divididas em
mdulos desde o momento da sua criao do recurso digital, passam pela avaliao
da usabilidade e relevncia do contedo.
O modelo de Greenstein apontou a necessidade de implementar uma
estrutura para o gerenciamento de objetos digitais que possa ser usada para
descrever as necessidades dos responsveis por esses registros. Sua proposta foi
uma das primeiras a ressaltar a rea da preservao digital como aquela que requer
maior ateno, quando se levar em considerao os custos com a manuteno dos
recursos e a adoo prtica por parte dos administradores (HENDLEY, 1998).
Tanto para Greenstein como para Hendley, um sistema de preservao
digital podia ser visto como uma combinao de:
a) capacidade de armazenamento;
b) funes de insero;


150
c) colees de metadados e gerenciamento;
d) estratgias de preservao e disseminao de contedos arquivados
em sistemas administrados de forma centralizada;
e) outro tipo de estrutura organizacional na qual os componentes do
processo de preservao esto separados em servios distribudos
entre as vrias instituies participantes, cada uma delas
especializada em um segmento do processo.
Em 2004, Lavoie e Dempsey resumiram a quatro nveis a concepo de
um sistema de preservao digital. No primeiro, estariam o hardware, software e a
infra-estrutura que d apoio ao armazenamento e distribuio do contedo digital.
No segundo nvel, estariam includos os servios mais especializados para o
gerenciamento do contedo arquivado no sistema, incluindo a criao de
metadados, validao da autenticao e integridade dos materiais.
A criao de indicadores, por sua vez, implementada no terceiro nvel,
incluindo o monitoramento do ambiente da preservao, para acompanhar o impacto
das mudanas na habilidade de acessar e usar esses contedos, assim como
facilitar os processos de migrao e emulao. O ltimo nvel abrangeria os servios
relacionados com a busca, navegao, solicitaes de aceso, permisses e
disseminao seletiva.
Essa concepo j estava influenciada pela percepo do funcionamento
de um sistema de preservao baseado em repositrios digitais segundo o modelo
OAIS. Com ele ficaram evidentes os aspectos mais importantes do workflow da
informao a ser preservada: a entrada, o acesso, a administrao, gerenciamento
de dados, o planejamento da preservao e o armazenamento com fins
arquivsticos, incluindo o armazenamento da mdia e o gerenciamento de software.
Os estudos sobre os sistemas de preservao digital foram surgindo na
ltima dcada focando no desenvolvimento e propriedade dos softwares para
repositrios digitais e no fluxo interno da gesto da informao dos objetos digitais.
Um estudo que pode servir como exemplo dos trabalhos sobre a
identificao das etapas de gerenciamento da preservao digital foi o realizado por
Anderson e Pinfield (2004), no qual foram identificadas sete etapas no
gerenciamento do ciclo de vida dos objetos digitais (Figura 17).




151














Figura 17 Ciclo de vida dos objetos digitais
Fonte: Anderson e Pinfield (2004)

A primeira a da criao do documento, quando se escolhe o formato do
arquivo e se determina o tipo de contedo; na segunda etapa so realizados os
processos de submisso; na terceira so feitas as revises e na quarta a reteno
para reviso. Nessas trs etapas (submisso, reviso e reteno) so inseridos os
metadados de descoberta, tcnicos e de direitos autorais, assim como tambm o
tipo de formato para converso, o identificador nico persistente e a verso para
controle. No passo quatro podem ser recebidos diretamente os trabalhos criados j
no passo um que marca a atribuio de qualidade para sua publicao. O passo
cinco pode significar a deciso para a retirada do documento, nas mesmas
circunstncias dos passos trs e sete. J no passo seis, decide-se a ao a ser
realizada com o documento que enfrenta um processo de obsolescncia tcnica
(migrao, emulao e outras estratgias).
Mas existe ainda na comunidade da preservao digital a necessidade de
ferramentas acessveis, tecnologia e treinamento no uso dos sistemas que
gerenciem os objetos digitais. (LUPOVICI; MASANS, 2000; McGOVERN, 2007;
ROTHENBERG, 2000). tambm aceito o pressuposto de que no existe uma
2
Submission
3 4
Revision(s)
Quality Assessment
and Publication
6
Technical
Obsolescence
Resource Discovery Metadata
Technical Metadata
Rights Metadata
File Format Conversion
Unique, Persistent Identif ier
Version Control
Migration, Emulation
Other Preservation
Action
Creation
1
File Format & Content
Types Determined
5
Review
Retention
4
7
Withdraw


152
nica mdia de armazenamento permanente e que necessrio o desenho de
sistemas que gerenciem as mudanas inevitveis de um sistema para outro.
Para a Unesco (2007), mais conveniente que se invista na construo de
sistemas sustentveis do que em suportes supostamente permanentes. No seu
relatrio de 2007 sobre softwares livres para sistemas de arquivamento, a
organizao conclui que necessrio um sistema simples e sustentvel que
proporcione estratgias para gerenciar e identificar as funes de preservao.
Especificamente sobre a integrao de ferramentas ao workflow das
instituies, esto surgindo estudos sobre como o workflow da preservao digital,
que modular, capaz de integrar de forma fcil e personalizada as novas
ferramentas de preservao digital. H avanos na rea de extrao automtica de
metadados no momento da submisso, mas existe a necessidade de investigar as
ferramentas e os tipos de workflow que podem ser compartilhados entre
organizaes.
Uma das mais recentes iniciativas que tentam acabar com a barreira entre
as infra-estruturas organizacional e tecnolgica o projeto europeu PLANETS
41
,
coordenado pela British Library, que promete um tipo de planejamento tecnolgico e
ferramentas que refletem as polticas organizacionais. O foco do projeto o
processo chamado de planejamento da preservao, definido no modelo OAIS, no
qual a preservao digital est centrada nas decises certas no tempo certo para
garantir que a informao de valor no seja perdida. Com a mesma finalidade surgiu
o projeto PLEDGE, coordenado pelo Massachusetts Institute of Technology, que
promete um prottipo de mecanismo automatizado de polticas de preservao
digital
42
.
Aguarda-se que, com mais instituies desenvolvendo repositrios digitais
confiveis, seja possvel o compartilhamento dos workflows e a diminuio dos
custos. Existe um esforo em desenvolvimento do padro ISO, que vai integrar
vrias iniciativas e requisitos relevantes das reas de tecnologias da informao e
segurana.




41
Disponvel em: http://www.planets-project.eu/ Acessado em: 13/out/2008
42
Disponvel em: http://pledge.mit.edu/index.php/Main_Page Acessado em: 13/out/2008


153
2.4.1 Infra-estrutura tecnolgica


A infra-estrutura tecnolgica necessria refere-se combinao de
estratgias (procedimentos, protocolos, documentao, redes, medidas de
segurana, workflow), o pessoal (habilidades tcnicas e arquivsticas), os
equipamentos (hardware e software, mdia de armazenamento) e outros meios para
alcanar o objetivo de preservar os objetos digitais.
Para Kenneth Thibodeu (2002), diretor da Electronic Records Archives
Program da National Archives and Records Administration as abordagens
tecnolgicas da preservao de objetos digitais esto direcionadas ao acesso
permanente. Ele afirma que, em contraste com tecnologias como a migrao ou
arqueologia digital, surgiro cada vez mais tecnologias que focalizam a
documentao necessria dos arquivos digitais para possibilitar sua reproduo no
futuro.
Foi na dcada de 1990 que comearam os estudos sobre a permanncia
dos objetos digitais, RLG DigiNews foi o primeiro peridico cientfico a publicar
artigos dedicados ao tema preservao digital, chegando a ser um dos veculos de
comunicao mais consultados pela comunidade de pesquisadores da rea. Para a
comunidade preocupada com a preservao digital, considerado um momento
significativo a publicao em 1996 do relatrio da RLG e a CPA (McGOVERN,
2007).
Nos anos que se seguiram publicao do Preserving Digital Information
feita pelo CLIR e o Research Libraries Group em 1996, o crescimento considervel
dos recursos de informao digital em contedo web, livros eletrnicos, peridicos
on-line, mdia digital e material didtico tem dificultado a antecipao dos desafios
inerentes sua preservao (SMITH, 2005).
Os progressos alcanados desde o relatrio publicado pelo Task Force on
Digital Archiving multiplicaram-se:
a) consolidou-se o modelo de referncia para sistemas de preservao
digital (OAIS) tambm chamado em portugus de Sistema Aberto de
Arquivamento de Informao (SAAI),


154
b) estabeleceu-se o conjunto de atributos para repositrios digitais
confiveis (TDR), que delimita o contexto organizacional da
preservao digital,
c) publicaram-se dicionrios de dados para metadados de preservao
(PREMIS) e,
d) surgiram os repositrios institucionais facilitados pelo aparecimento de
novos softwares, como o Dspace.
Eles tm favorecido o desenvolvimento de estratgias de preservao
mais especficas, como o PRONOM para tipos de contedo digital. Juntou-se a eles
a norma ISO 19005-1, publicada no dia 13 de setembro de 2005, que especifica o
formato Portable Document Format - PDF16 ou PDF/A como padro universal para
arquivamento de documentos eletrnicos em longo prazo.
Com relao aos softwares para repositrios digitais de software livre,
alguns j tm se consolidado na comunidade cientfica e suas diferenas so claras.
Os mais usados (EPrints e DSpace) explicam sua orientao da seguinte maneira:
a) EPrints: enfatiza particularmente o contedo de acesso livre a artigos
de peridicos e teses; o workflow do EPrints est baseado numa
interface web que lida com o processo de submisso; os documentos
so transferidos para um armazenamento temporrio que ser
moderado pela equipe do repositrio. As etapas subseqentes sero
realizadas no documento e no registro dos metadados, o que inclui
migrao do formato do arquivo, ajustes nos metadados ou eliminao
do documento (http://www.eprints.org).
b) DSpace: concentra-se no aspecto de curadoria digital em geral; o
workflow organizado para simplificar o processo de submisso e
reunir informao relevante no repositrio; ele inclui ferramentas para
importar e exportar documentos e uma estrutura de diretrio simples,
na qual os metadados Dublin Core so armazenados em arquivos XML
(http://www.dspace.org).
As pesquisas na rea continuam a surgir e os objetivos so cada vez mais
variados. No RLG DigiNews volume 9 nmero 4 de 2005, foram mencionados 10
programas promissores de pesquisa em preservao digital. O que caracterizam
esses projetos a necessidade de que a tecnologia possibilite mais procedimentos


155
automatizados de preservao digital e que existam mecanismos que integrem
requisitos de auditoria no gerenciamento da preservao de objetos digitais.
Tambm existem recomendaes publicadas pela National Science
Foundation (NSF) nos Estados Unidos e pela Community Research & Development
Information Service (CORDIS) na Inglaterra, sobre tipos de infra-estrutura que sejam
proporcionais ao crescimento do tamanho dos repositrios de contedo digital.
Os padres de converso digital e as melhores prticas tm evoludo,
assim como as iniciativas mais importantes de metadados e protocolos de
intercmbio, alm das tecnologias para mover informao digital de um hardware e
software para outro. Contudo, o desenvolvimento das infra-estruturas da
preservao da informao digital tem sido lento.
43
Mas um sinal de maturidade da
rea , segundo Lavoie e Dempsey (2004), o entendimento de que a preservao
digital no apenas uma parte tcnica que acontece como um processo isolado
mas, sim como parte de um ambiente maior que compreende toda a informao
digital.


2.4.2 Infra-estrutura organizacional


Existem algumas reas da infra-estrutura organizacional que precisam de
definies mais claras, tais como a necessidade de integrar as polticas
organizacionais para a preservao digital com as implementaes tecnolgicas e a
necessidade de desenvolver e envolver pessoas com conhecimentos sobre
preservao digital.
Segundo Nancy Y. McGovern (2007), o pilar organizacional da
preservao digital determina o tipo de procedimentos que esto sendo
empregados, se ela resultado de um mandato ou uma norma institucional, seu
escopo, seus objetivos e o pessoal comprometido. Na dcada de 1990, a infra-
estrutura organizacional era o item menos observado pelas iniciativas de
preservao digital, mostrando a ausncia de comprometimento na prpria misso

43
Na pgina Digital Curation Tools do Digital Curation Centre encontra-se uma lista completa de
ferramentas e tecnologias em software livre para os processos de preservao digital:
http://www.dcc.ac.uk/tools/digital-curation-tools/ Acesso em: 12/out/2008.


156
das instituies de alguma declarao relacionada com a permanncia das
informaes e a falta de programas de preservao digital sustentveis. Naquele
perodo, esperava-se por uma soluo nica que fosse o suficientemente forte e que
servisse para inibir o desenvolvimento da responsabilidade organizacional pela
preservao digital.
J em 2002, com a publicao do relatrio da RLG/OCLC sobre os
atributos e responsabilidades dos repositrios digitais confiveis e o
desenvolvimento dos softwares abertos para repositrios e o Modelo de Referncia
OAIS (SAAI), a infra-estrutura organizacional da preservao digital se fortaleceu,
facilitando o desenvolvimento de polticas de preservao digital nas organizaes e
o reconhecimento do papel central que tem a certificao.
Como mencionado no subseo 2.2.5, o modelo de referncia OAIS/SAAI
representa a expresso mais formal e compreensiva do processo de arquivamento
disponvel comunidade que trabalha com preservao de objetos digitais; identifica
documentos que so necessrios, tais como um acordo de submisso, formatos
padro, controle de acesso fsico, administrao de bases de dados, gerenciamento
de armazenamento, recuperao de desastres, evoluo do sistema, padres de
migrao e outros procedimentos.
O modelo proporciona uma linguagem comum e um conjunto de funes
para serem discutidas e para poder mapear o desenvolvimento organizacional na
questo da preservao digital. Por ser considerado um padro para arquitetura dos
repositrios e arquivos digitais, o OAIS/SAAI proporciona a estrutura onde os
metadados de preservao e outros padres podem ser desenvolvidos. Ele tambm
possibilita que um software de repositrio possa exportar de forma padronizada seus
metadados arquivados em formato XML para facilitar a migrao para outro sistema.
Considerado, desde 2003, por vrios pesquisadores como a base
conceitual dos repositrios de informao cientfica, o modelo OAIS/SAAI um
padro ISO e a maioria dos sistemas de preservao digital est sendo
reestruturada para ficar em conformidade com ele. Essas iniciativas esto tentando
inserir Pacotes de Submisso de Informao (PSI) e produzindo Pacotes de
Disseminao de Informao (PDI), com a finalidade de se adequar ao modelo.
Como uma entidade que opera na administrao do OAIS, o planejamento
da preservao tem como objetivo monitorar as mudanas tecnolgicas que podem
afetar tanto os consumidores como os produtores de um repositrio digital. Nesta


157
parte do processo so realizadas anlises peridicas das ferramentas que vm
surgindo, para desenvolver padres abertos de formatos e sistemas.
Uma das funes de preservao do OAIS suportar a migrao e
transformao dos dados com algum grau de automao (WALKER; THOMA, 2004).
O desenvolvimento de futuros conversores de formatos poder ser facilitado, se
mais repositrios digitais programarem seus metadados seguindo o modelo OAIS,
instalando aplicativos j em funcionamento no seu repositrio (ex.: a ferramenta de
converso de documentos MyMorph da National Library of Medicine e a ferramenta
de validao e extrao de formato de objetos digitais JHOVE da Harvard Unversity
Library), ou pelo o uso de servios de migrao de formato como o TOM (Typed
Object Model) da Carnegie-Mellon University.
Apesar da importncia das tecnologias a serem usadas para combater a
obsolescncia dos suportes e mdias, as mudanas organizacionais continuam a ser
uma das ameaas para a estabilidade da informao de longo prazo (LAVOIE;
DEMPSEY, 2004). O planejamento da preservao dever considerar o uso de
software livre, estruturado em linguagem de banco de dados SQL, para prover uma
fcil interoperabilidade entre diversos sistemas.


2.4.3 Consolidao das iniciativas de preservao digital


Os sistemas de preservao digital se estendem para fora das instituies,
usando ferramentas agregadoras, organizando comunidades de usurios de
recursos digitais, incentivando o aumento do material disponibilizado nas bibliotecas
digitais. Ainda assim, a preservao digital continua sendo um territrio
desconhecido para muitas instituies pblicas e privadas. Organismos de pesquisa
de vrios pases tm manifestado suas reservas em relao s implicaes
econmicas da preservao a longo prazo, assunto que no tem sido tratado
diretamente com as agncias financiadoras.
Para Thibodeau (2002), entre os mais importantes desenvolvimentos na
preservao digital desde 1996, est o alerta que a National Archives e a Library of
Congress dos Estados Unidos (LC), tm levantado sobre a possvel perda
catastrfica da informao atual. Conseqentemente, as duas agncias tm


158
conseguido obter mandatos e financiamento do Congresso daquele pas para
abordar o problema da preservao digital.
As instituies tradicionalmente comprometidas com a preservao da
herana cultural e da histria tm empreendido alguns esforos com financiamento
de governos locais. Os arquivos e bibliotecas nacionais tm manifestado o interesse
oficial dos estados de documentar aspectos culturais relevantes de determinado
perodo ou evento. Nos Estados Unidos, a Library of Congress tm realizado alguns
dos maiores esforos (American Memory) que atraem o financiamento da iniciativa
privada, mas o interesse da LC pelo crescente nmero de objetos nascidos digitais
s comeou em 2000, com a iniciativa chamada National Digital Information
Infrastructure Program (NDIIP) (FRIEDLANDER, 2002).
Partindo da idia de que exista a necessidade latente de garantir o acesso
informao de longo prazo, algumas aes tm sido propostas aos gerentes das
colees digitais tanto em instituies detentoras de acervos culturais, quanto nas
dos acervos cientficos. So elas: colaborao e intercmbio de experincias,
adoo estratgia estruturada de preservao digital e criao de uma infra-
estrutura de repositrios de preservao digital.
Duas instituies que tm acompanhado o desenvolvimento das prticas
da preservao digital so o International Council for Scientific and Technical
Information (ICSTI) e o Grupo e Trabalho de Preservao Digital CENDI (U.S.
Federal Information Managers Group). Os relatrios produzidos por essas duas
instituies tm servido para acompanhar os projetos implementados por instituies
das reas de C&T (HODGE; FRANGAKIS, 2004). Os dados coletados so aqueles
relacionados com prticas - divididas por tipo de documento, formato, workflow
estabelecido pelo sistema operacional escolhido, atividades padro - e a
disponibilizao dos pacotes de software. No levantamento de 2004, foram
coletados dados de mais de 50 sistemas ou projetos de preservao digital de vrios
pases e instituies. As principais concluses alcanadas foram:
a) um panorama do estado atual das prticas nas reas de C&T;
b) a identificao dos mais importantes temas abordados;
c) um conjunto de lies aprendidas e futuras aes.
No Quadro 7, podem ser visualizadas as estratgias de preservao
adotadas em vrios projetos ou sistemas operacionais selecionados na pesquisa do
CENDI/ICSTI (HODGE; FRANGAKIS, 2004).


159
ESTRATGIAS

Poltica de
Arquivamento

Migrao

Padres
Abertos

Metadados de
Preservao

Colaborao

Repositrio
Institucional
AIA X X X X
AIP X X X
ALEXA X X X
DIAS X X X
DiVA X X X X
Dspace X X X X X X
ESD X
EROS X X X
FEDORA
TM

X X X X X
GPO X X X
IUCR X X X
JSTOR X X X X
LSDA X X
LOCKSS X X
NASA X X X
NLM X X X
NMM X X
OCLC
PANDORA X X X X X
PUbMed X X X






S
I
S
T
E
M
A
S
VERS X X X X
TOTAL 12 17 5 15 10 7
Quadro 7 Estratgias de preservao adotadas pelos 21 sistemas operacionais
Fonte: CENDI/ICSTI Hodge e Frangakis (2004)

Os 21 projetos selecionados por Hodge e Frangakis gerenciam ampla
gama de recursos de informao cientfica. No Quadro 7, so mostradas as
estratgias detectadas nos diferentes projetos de sistemas de preservao digital de
informao cientfica. A maioria dos projetos possua polticas de arquivamento e
normas relacionadas para a criao de metadados. A estratgia de migrao foi a
mais usada nos sistemas levantados. A estratgia de emulao no foi mencionada
como uma das mais importantes para essas organizaes. A colaborao foi
assinalada como significativa junto comunidade de desenvolvedores de sistemas
de preservao digital.
A Unio Europia criou o projeto Erpanet, estabelecido em novembro de
2001, tendo como finalidade unir as diversas iniciativas na rea de preservao
digital. O projeto europeu publicou o Erpanet Digital Preservation Charter, uma
declarao dos pases europeus que serve como fundo para a cooperao entre as
diversas iniciativas, envolvendo cada um dos participantes do ciclo de vida dos


160
objetos digitais. O Erpanet apontou os motivos da importncia de participar de
projetos cooperativos de preservao digital:
1) alcanar melhor administrao dos riscos;
2) participar de um marco comum de trabalho para benchmarking do
acesso digital e das melhores prticas de preservao;
3) construir parcerias;
4) chamar a ateno os principais atores envolvidos com objetos
digitais;
5) evitar redundncia;
6) maximizar os esforos de preservao.
Nos pases do Primeiro Mundo, esto sendo criadas redes de
comunicao entre especialistas de uma ou mais naes, com o objetivo de discutir
temas especficos da preservao de objetos digitais de longo prazo com
caractersticas locais, como o idioma. Blake (2004) narra que na Alemanha foi criada
uma rede bilnge para intercmbio de experincias fora e dentro daquele pas. A
experincia tem favorecido a discusso sobre estratgias e polticas de
arquivamento digital.
O tema da colaborao tem sido discutido tambm no contexto da
interoperabilidade. nessa estrutura que esto apoiados todos os aspectos dos
repositrios digitais de acesso livre. Estrategicamente, essa abertura e cooperao
geram uma multiplicao de benefcios para todos os participantes, incluindo novas
habilidades e experincias, modelos de negcios sustentveis, estratgias de
preservao mais estruturadas etc. O uso de padres abertos e de protocolos para a
interoperabilidade dos arquivos permite a incorporao de colaboradores
internacionais, formalizando redes de informao que minimizam a redundncia dos
recursos e custos na sua manuteno.
As idias bsicas do modelo OAIS podem ser detectadas na maioria dos
projetos de pesquisa de preservao digital (LeFURGY, 2002). So casos como o
da Library of Congress, baseado na digitalizao usando a padronizao dos
formatos e o uso de metadados de preservao; outro exemplo j mencionado o
VERS da Australia National Library, que usa metodologias detalhadas para a criao
de documentos digitais no gerenciamento arquivstico; cita-se tambm o CURL
Exemplars for Digital Archives (CEDAR) na Inglaterra, que desenvolve metodologias
baseadas no modelo de representao das propriedades dos objetos digitais; e o


161
projeto do Electronic Record Archives (ERA) dos Estados Unidos, que est
utilizando o modelo OAIS nas suas propostas de gerenciamento de materiais digitais
persistentes, definindo as estruturas e metadados necessrios para seu acesso e
recuperao.
As iniciativas nacionais de preservao digital tm surgido a partir de
grandes instituies depositrias e de centros de pesquisa que vm optando pela
proposta dos Arquivos Abertos e o Acesso Livre. Algumas delas j foram destacadas
por Muir e por Studwell e Ghetu, em 2003. Tambm uma lista mais abrangente
encontra-se no Apndice D. Entre as mais citadas na literatura esto as seguintes:
1. DIAS, projeto para software de arquivamento;
2. Digital Archive, o arquivo de documentos governamentais da National
Archives;
3. HD-ROM e HD- Rosetta produto de preservao;
4. Internet Archive, projeto para software de arquivamento;
5. InterPares, projeto internacional;
6. JISC e SHERPA, plano e projeto de instituies da Inglaterra;
7. LOCKSS, projeto da Stanford University;
8. NDIIPP, plano de preservao digital da Library of Congress;
9. PADI e PANDORA, plano e arquivo web da National Library of
Australia;
10. Preservation Metadata Extraction Tool, componente do programa de
preservao digital da National Library of New Zealand;
11. UVC estratgia de cpia centralizada.

Os projetos mencionados tm como origem os grupos de pesquisa que,
mesmo separadamente, possuem o mesmo objetivo. Alguns tm como centro de
suas atividades a produo acadmica e a construo de consrcios. Com o
crescimento de repositrios institucionais, espera-se que essas instituies adotem
mais os sistemas distribudos e surjam mais iniciativas colaborativas.
Alguns esforos esto apontando nessa direo, como o caso do projeto
SHERPA (Securing a Hybrid Environment for Research Preservation and Access) na
Inglaterra, que estuda implementao prtica das recomendaes para uma infra-
estrutura tcnica de preservao desagregada. As funes de preservao
desagregada, segundo Beagrie (2002), so servios de preservao institucionais


162
que podem dar suporte e beneficiar o planejamento de mecanismo de
armazenamento distncia. As razes para o surgimento dessa proposta esto na
natureza dos repositrios institucionais que, segundo James et al. (2003),
apresentam as seguintes caractersticas:
a) a maioria no tem como inerente os processos de preservao digital;
b) no contam com pessoal suficiente com conhecimentos sobre
preservao digital e,
c) replicam servios e custos.
Os trabalhos nas iniciativas e projetos de preservao digital continuam
reproduzindo-se de forma rpida, com desenvolvimentos significativos de sistemas,
pacotes de softwares, legislaes de depsito, parcerias e propostas de novos
padres. Mesmo com isso, ainda existem algumas reas a serem abordadas. Na
seo a seguir, trataremos dos fatores que levam sustentabilidade dos sistemas
de preservao digital emergentes.


2.5 SUSTENTABILIDADE DA PRESERVAO DIGITAL


As pesquisas internacionais com os responsveis por colees digitais
mostram que as organizaes ainda no podem garantir recursos para a
preservao digital. Essa deficincia de recursos uma das grandes ameaas
preservao digital identificadas por especialistas da rea (BEAGRIE, 2003;
BRADLEY, 2004; WHEATLEY, 2003), alm de projetos e polticas insuficientes,
suporte inadequado por parte das equipes, a obsolescncia tecnolgica e a falta de
experincia dos responsveis.
Diferentemente da infra-estrutura organizacional que fica incorporada no
documento do TDR, e da infra-estrutura tecnolgica definida dentro do modelo de
referncia OAIS, a parte dos recursos necessrios para a preservao digital no
tem nenhum documento produzido pela comunidade que expresse qual seu
escopo e seus requisitos. O que a literatura reporta que poucas instituies tm
alocado recursos dos seus oramentos para os cuidados com os materiais digitais
de longo prazo. A necessidade de realizar aes imediatas para preservar colees


163
digitais fica atrs do desejo de criar e disseminar novas formas de contedo digital
(LAVOIE; DEMPSEY, 2004).
A sustentabilidade econmica a habilidade de conduzir recursos
suficientes e de forma constante para alcanar os objetivos da preservao digital. O
fato de haver includo o atributo sustentabilidade financeira no documento TDR
(RLG/OCLC, 2002) simboliza a primeira vez que os custos da preservao digital
foram expressos explicitamente. Um avano nesse aspecto foi o fato de que, pelo
menos no exterior, algumas instituies do ensino superior destinam fundos para a
preservao digital (ex.: o MIT para o DSpace, University of Cornell para projetos de
colees digitais). Tambm considerado um avano o fato de existirem programas
de preservao digital que tm um tempo de vida maior do que os projetos de
preservao digital (ex.: JISC, NEH, NSF, NHPRC). Esses programas
desenvolveram polticas e receberam fundos destinados pesquisa.
Alm desses avanos, a comunidade da rea tem produzido ampla
literatura sobre os custos que a preservao digital envolve. Alguns desses
trabalhos tratam sobre modelos econmicos (LAVOIE, 2003; SANNETT, 2002;
2003) e ferramentas para comparar custos entre a migrao e a emulao ao longo
do tempo (OLTMANS; KOL, 2005) entre outros. Esses documentos tm ajudado a
entender os custos, mas no tm sido suficientes para a criao de um documento
produzido pela comunidade capaz de sustentar o impacto que os custos
representados pelo desenvolvimento e as implementaes das estratgias de
preservao podem causar em cada caso, particularmente.
Para os tericos da preservao digital, a distribuio dos custos est
determinada pelo contexto organizacional e est amarrada implementao
tecnolgica no programa de preservao digital de uma organizao. Em resumo,
seria o o que e o como da preservao digital determinando o quanto. A
designao de fundos por parte das organizaes para a preservao digital e um
documento por parte da comunidade que expresse os custos gerenciais de
estratgias de preservao digital compem os dois aspectos que ainda se
encontram em construo (LAVOIE, 2008).
Cada estratgia tcnica de preservao e de acesso implica diferentes
custos e cronogramas. A preservao digital requer recursos disponveis
permanentemente que comeam a se delinear no momento da criao do recurso.


164
Muitos materiais so produzidos fora dos centros de informao e das bibliotecas.
Nesses casos, so os editores e outros criadores de contedos que devem adotar
os padres apropriados e as tecnologias que daro subsdios preservao.
Segundo Feeney (1999), [...] diferentemente da situao que se aplica aos livros, o
arquivamento digital requer investimentos relativamente freqentes para superar a
obsolescncia rpida produzida pelas mudanas tecnolgicas.
Os provedores de material digital, no correr do tempo, precisam investir
para criar documentao e metadados, gerando novas formas de material para
manter o acesso. Esse investimento deve ser levado em considerao no momento
de discutir os direitos de uso e reuso dos objetos digitais. Do mesmo modo, entre os
aspectos que devem ser identificados em qualquer estratgia de preservao, est a
necessidade de contratao e de capacitao de pessoal. Se no houver nenhum
plano administrativo que cubra esses itens, nenhuma manuteno de acervos de
longo prazo ser bem-sucedida.
Quanto preservao digital, Chilvers (2000) deixa claro que sua
viabilizao est relacionada aos aspectos financeiros, gerenciais e tcnicos da
instituio onde ocorrer, e tem como objetivo prolongar a vida til do dado. Existe
uma lacuna entre estabelecer uma estratgia de preservao e a sua
implementao. Uma vez que uma das grandes vantagens do documento digital a
sua interoperabilidade com vrios outros mecanismos ao mesmo tempo, se a
questo da informtica (hardware, software e obsolescncia tecnolgica, entre
outros) no estiver resolvida, sofrendo constantes anlises e avanos, o documento
perder uma de suas caractersticas vitais e que o distingue de outras formas de
documentos.
O problema maior aparece no quesito financiamento, j que a maioria dos
projetos consegue recursos apenas por curto perodo de tempo, quando qualquer
projeto de preservao digital requer um investimento a longo prazo. A natureza dos
registros proporciona a dimenso do valor que eles podem chegar a ter no decorrer
do tempo (SANTANNA, 2001).
O Digital Archiving Working Group, da JISC/NPO, analisando o
gerenciamento dos custos da preservao digital, sugere que os materiais digitais
sejam arquivados em formatos padro, em mdia padro, e gerenciados dentro de
alguns dos poucos modelos de sistema de preservao operacionais existentes.


165
Para Hendley (1998), existem algumas dificuldades no desenvolvimento
de modelos para custos com a preservao digital. Segundo ele, as organizaes
precisam levar em considerao a quantidade e o nvel de acesso que pretendem
oferecer, pois isso influencia os custos. Tambm, o treinamento de especialistas e
tcnicos deve ser contemplado nos custos das atividades da estratgia de centros
de preservao digital (CHAPMAN, 2003).
O custo de estruturar o que envolve esta tecnologia, para garantir o
trabalho cultural e intelectual da era digital, ser ainda mais notvel se desenvolvido
ainda no comeo do planejamento dos custos, para que estes sejam minimizados e
efetivamente aplicados. Pontos-chave como este devem ser pensados para
identificar e selecionar prticas apropriadas de custo-benefcio para cada estgio no
ciclo de vida dos recursos digitais.
A preservao digital pode ser considerada uma atividade
economicamente sustentvel, apesar de serem insuficientes os oramentos
atribudos a vrias iniciativas at hoje. A deciso de como devem ser atribudos os
recursos financeiros continua influenciada pela vontade dos administradores de criar
e disseminar novas formas de contedo digital e pela atribuio de fundos para
projetos de curta durao. Uma perspectiva colaborativa propiciaria a distribuio
dos custos entre vrias instituies, mitigando gastos com infra-estrutura e pessoal
especializado.
Em geral, os custos com a preservao digital, se no forem
compartilhados entre instituies parceiras, podem chegar a ser significativos e at
ultrapassar os requeridos para sua contrapartida em papel. Economicamente, a
sustentabilidade da preservao digital depende dos seguintes fatores:
a) reconhecimento dos benefcios de preservar materiais digitais seguindo
critrios especficos de seleo;
b) incentivos apropriados para provocar s autoridades para atuar a favor
do interesse pblico;
c) mecanismos que garantam a destinao de recursos para as
atividades de preservao digital nas organizaes, local e
coletivamente;
d) uso eficiente dos escassos recursos financeiros, e
e) planejamento organizado e com autoridade das atividades definidas
nas polticas de preservao digital.


166
No exterior, o financiamento estatal tem sido imprescindvel para o
desenvolvimento de projetos de preservao digital. Um exemplo o da Library of
Congress, que em 2000, desenvolveu o National Digital Information Infrastructure
and Preservation Program (NDIIP), como uma arquitetura nacional para a
preservao de material digital, por meio de uma rede de parceiros formada por
bibliotecas, editoras, agncias federais e do setor privado. O plano estratgico inicial
aprovado com oramento de US$ 25 milhes contou com parcerias entre empresas
e comunidades nacionais e internacionais nas reas de editorao, tecnologias e
direitos autorais. Para 2007, o financiamento federal e as contribuies particulares
chegaram a US$ 75 milhes.
Agncias de fomento esto comeando a participar; fundaes como a
Andrew W. Mellon Foundation tm financiado projetos de arquivamento de
publicaes eletrnicas, um deles sobre os arquivos digitais disponibilizados na rede
e outro que focaliza aqueles que so armazenados pelas editoras. Com as
pesquisas desenvolvidas nesses projetos pode-se extrair informaes para os
bibliotecrios e editores sobre a necessidade de confiar em seus parceiros no
campo digital. A confiana um dos elementos fundamentais da infra-estrutura da
preservao digital a ser criada em qualquer pas.


2.5.1 Sustentabilidade comercial


importante reconhecer que cada estratgia tcnica de preservao e de
acesso implica diferentes custos e cronogramas. Os grandes projetos de repositrios
digitais precisam de uma sustentabilidade financeira comprovada para serem
considerados confiveis. O documento da RLG/OCLC (2002) recomenda que os
repositrios digitais devam estar aderidos a corretas prticas de negcios e
possurem planos economicamente sustentveis.
O grau de sustentabilidade financeira pode estar influenciado pelo tipo de
organizao que financia e pelas caractersticas dos servios de informao. As
iniciativas mantidas pelos governos e com obrigatoriedade no depsito legal e
guarda de informaes oficiais podem ser mais facilmente beneficiados, enquanto
aquelas instituies que tenham como propsito o acesso informao (ex.: as IES)


167
podem se respaldar nas necessidades dos usurios e no desenvolvimento dos seus
acervos.
As empresas privadas tm estado envolvidas na preservao digital,
desde que foram introduzidas as primeiras verses dos hardware e software. O
interesse na preservao de dados armazenados nas primeiras verses se faz
presente na oferta das novas solues. Seus efeitos nos projetos de preservao
digital podem ser percebidos na estimativa dos custos na implementao desses
projetos. Eis alguns dos servios comerciais de preservao digital usados no
exterior so:
a) Archivas, Permabits, Bamboo
b) Chronopolis grid storage (SDSC, USA)
c) IBM Digital Library system
d) Iron Mountain, Akamai
e) JSTOR
f) OCLC digital archive
g) Portico (Ithaka Harbors, Inc.).
Em vrios pases as companhias que oferecem seus servios e aplicaes
de preservao digital tm trabalhado colaborativamente com instituies de
pesquisa e agncias governamentais. Por outro lado, o setor privado tem criado
solues para a preservao da informao digital de arquivos de e-mail, texto
completo e bases de dados, aplicveis em diferentes momentos do ciclo de vida do
documento digital. Entre as dificuldades que apresenta o trabalho com as
companhias privadas no campo da preservao. Dois aspectos se ressaltam:
1) ausncia do registro da guarda dos dados e dos dados estatsticos das
falhas; esses dados so considerados como rotinas ou proprietrios;
2) os dados tcnicos dos registros so guardados como sendo
departamentais ou pessoais e no corporativos, ficando distribudos
em ferramentas e verses operadas sem controle das atualizaes.
Para Gladney (2001) o problema da preservao digital na rea comercial
est centrado no fato de que os beneficiados no vislumbram a utilidade dessas
atividades seno at depois de muitos anos de o material haver sido salvo. Hodge e
Caroll (1999) afirmam que os atores principais no percebem o problema da mesma
forma: para os criadores dos documentos digitais, o envolvimento com a
permanncia dos dados est reduzido apenas ao processo de arquivamento


168
(comeando a perceber a importncia dos metadados) e para os editores o mnimo
de ao (procedimentos de backup) j suficiente. Alguns editores comerciais
responsveis pela guarda permanente de dados individuais apiam a cobrana do
acesso e armazenamento dos registros digitais.
Uma tendncia das organizaes ao tratar de obter recursos para a
construo de seus acervos digitais est sendo a oferta de servios com valor
agregado relacionados com a preservao dos materiais armazenados. Um exemplo
o OCLC, que oferece um servio para o gerenciamento de colees de bibliotecas
digitais chamado ContentDM, disponvel para ser usado de forma gratuita no
servidor do OCLC apenas para os associados ao consrcio Digital Co-op, que
ganham descontos em outros servios, como cursos e suporte tcnico.
O OCLC disponibiliza servios terceirizados de arquivamento digital no
seu OCLC Digital Archive, consistindo numa inscrio anual e cobrando pelos custos
de armazenamento mensalmente. A cobrana est determinada pelo nmero de
gigabytes do contedo armazenado. Os participantes do Digital & Preservation
Coperative tambm recebem descontos.
Um caso de modelo econmico para financiamento de projetos de
preservao baseados em plataforma de acesso livre o do MIT, que tem como
plano (ex. DSpace) oferecer servios pagos de suporte para a criao de metadados
especficos para servios de apoio a instituies que adotam o DSpace.
A oferta de servios padronizados de preservao digital depender do
crescimento da demanda das organizaes por formas economicamente
sustentveis de atividades eficientes de preservao, dentro de sistemas
distribudos. Segundo Lavoie (2004), a chave para um mercado sustentvel de
servios de preservao cultivar a confiana entre aqueles que oferecem os
servios e os que so potencialmente responsveis pelo uso desses servios.
Finalmente, a sustentabilidade econmica da preservao digital precisa
de mais dados sobre os custos reais das infra-estruturas tecnolgicas e
organizacionais, e fica constatada a impossibilidade de manter um projeto de
preservao digital desenvolvido localmente se no houver parcerias e distribuio
dos custos com maior nmero de instituies. Esse estgio ser alcanado quando
os projetos de preservao digital passarem da fase de inicial de avaliao da
reformatao dos suportes fsicos, do estabelecimento de repositrios digitais e da
insero padronizada de registros digitais.


169

2.6 POLTICAS DE PRESERVAO DIGITAL


Muitos criadores de material digital com informao cientfica e tecnolgica
precisam ter o controle do acesso a sua produo. Por no possurem
conhecimentos de estratgias de preservao, esto preocupados com o fato de os
materiais eletrnicos serem fceis de copiar e redistribuir. Em contrapartida, os
provedores do material no correr do tempo precisam investir para gerar
documentao revisada, metadados e criar novas formas de material para manter o
acesso (LAVOIE; GARTNER, 2005). A soluo ideal a aliana entre a organizao
habilitada no gerenciamento dos dados digitais e os criadores, de tal forma que
possam criar conhecimento do material mantendo o controle das decises sobre o
contedo a ser preservado e os intervalos para essa atividade.
Os sistemas de gerenciamento de contedos digitais, tais como
repositrios institucionais e bibliotecas digitais de teses e dissertaes, propem-se a
preservar os contedos digitais dos quais as instituies possuem os direitos
autorais. Algumas delas assumem esse direito e outras obtm a confirmao dessa
permisso com a assinatura dos autores desses trabalhos (ex.: a Biblioteca Digital de
Teses e Dissertaes no Brasil).
Em pases como os Estados Unidos (Digital Millennium Copyright Act,
1998), as legislaes nacionais requerem que seja solicitada permisso dos
detentores dos direitos autorais para preservar cpias de contedos protegidos com
alguma forma de direito autoral. Tanto os materiais de acesso livre como os de
acesso restrito podem exigir algum tipo de permisso.
No que diz respeito aos repositrios de acesso livre, todos os trabalhos
depositados continuam sendo propriedade intelectual dos seus respectivos autores.
Cabe a estes a responsabilidade de decidir o que deve ou no ser depositado e que
documentos podem ou no ser consultados na ntegra.
Nas instituies em geral, a maior parte dos documentos e publicaes
tcnico-cientficas resultado das atividades de seus recursos humanos e, por isto,
pode ser autodepositada e disponibilizada no repositrio. O acesso livre sem
restries de copyright vivel pelos seguintes motivos: a) os autores so os que
detm os direitos intelectuais das suas teses e dissertaes, da maioria dos trabalhos


170
apresentados em eventos (a menos que tenham transferido todos os direitos
explicitamente), dos relatrios tcnicos, working papers etc.; b) a maioria significativa
dos peridicos cientficos (aproximadamente 92%) permite algum tipo de
autodepsito dos pr-prints (verses de trabalhos anteriores avaliao pelos pares
e aceite para publicao) e/ou de ps-prints (verso final, depois de ter sido avaliada
pelos pares aprovada para publicao) dos artigos que eles publicam (HARNAD,
2007); e c) mesmo quando autores assinaram alguma forma de transferncia de
copyrights restrito, a consulta queles que detm os direitos pode resultar na
autorizao (ou no mnimo na no proibio) do autodepsito no RI.
A disponibilizao de documentos em acesso livre pode constituir uma
infrao apenas nos casos de licena concedida a terceiros (editores, por exemplo)
pelo autor/instituio, ou por conter assuntos confidenciais ou que sejam destinados
comercializao (livros). Neste caso, apenas a sua referncia (e seus respectivos
metadados) pode ser disponibilizada no repositrio.
Um exemplo de sistema que especifica que unicamente sero depositados
materiais com permisso de acesso o LOCKSS. Ele replica contedos de materiais
em bibliotecas e estabelece que seja acrescentada uma declarao por parte da
organizao detentora dos direitos autorais das publicaes preservadas, na qual
garantida a permisso do acesso aos materiais para os leitores da instituio que
hospeda o LOCKSS. Tambm, com a adoo de licenas Creative Commons os
sistemas esto providenciando as permisses necessrias para a preservao
digital.
Para as instituies de depsito legal, como as bibliotecas nacionais, a
legislao para a preservao dos documentos j est estabelecida e isso incentiva
os detentores de direitos autorais a cooperar e colocar seus materiais disposio.
Em janeiro de 2000 a Inglaterra foi o primeiro pas a introduzir a recomendao para
o depsito legal de publicaes eletrnicas, sendo plausveis de negociao caso
por caso.
O projeto Internet Archive toma uma abordagem alternativa ao coletar e
preservar contedos protegidos com direitos autorais sem ter solicitado permisso. A
estratgia no favorece uma poltica de preservao digital porque ela fora os
gerentes dos sistemas a retirar imediatamente qualquer material que seja identificado
como protegido por leis de direitos autorais. A forma a ser adotada por gestores de


171
sistemas de informao seria obter e guardar a declarao expressa da permisso
para preservar cada documento.


2.6.1 Permisses para preservar


A elaborao de polticas e o estabelecimento de iniciativas pioneiras de
preservao digital esto colaborando para que os padres e normas que esto
surgindo possam afirmar-se como estratgias confiveis e solues a serem
seguidas pelas instituies responsveis pela informao cientfica em formato
digital.
Um dos princpios estabelecidos em convnios internacionais e em vrias
legislaes nacionais a obrigatoriedade do depsito em arquivos ou bibliotecas de
uma ou mais cpias dos trabalhos produzidos por instituies pblicas e privadas.
Mas na maioria dos pases o depsito legal ainda no obrigatrio para os
documentos digitais, apesar de, como mencionado anteriormente, esse tipo de
material requerer um gerenciamento capaz de garantir que o material produzido em
um pas esteja disponvel permanentemente.
A meta do depsito legal garantir o acesso. Ao se estabelecer uma
legislao para o depsito legal de objetos digitais, levantam-se questes ligadas ao
acesso, tais como os custos e a proteo dos direitos do autor/editor (PADI, 2003).
Pases como a Nova Zelndia j estenderam suas polticas aplicadas s verses
impressas para os materiais eletrnicos e verses on-line. Na Noruega, a mesma
legislao est voltada em primeira instncia para a preservao cultural e a
proteo dos direitos autorais de qualquer [...] trabalho que possa ser lido, ouvido,
transmitido e que possa ser escrito e reproduzido em formatos eletrnicos no futuro
[...] (VAN NUYS, 2003, p. 16).
As bibliotecas nacionais de vrios pases esto comeando a aplicar
algumas normas e leis que combinam diferentes formas de desenvolvimento de
colees e proteo dos direitos autorais. Elas mencionam a importncia de
desenvolver rotinas para a seleo, descrio, identificao e armazenamento de
todo tipo de documento digital. Uma negociao entre as bibliotecas nacionais e as


172
editoras comea a criar esquemas que permitam o depsito voluntrio, seguindo
acordos bilaterais (HODGE; FRANGAKIS, 2004).
Em vrios pases, com o crescimento no nmero de projetos de
preservao digital, comeam a aparecer documentos e decises que representam o
fortalecimento do aspecto organizacional da preservao digital. Os responsveis por
esses projetos detectaram os elementos essenciais para programas de preservao
digital fortes, tais como: seguir e adotar os projetos j testados, implementar as
melhores prticas, trabalhar colaborativamente e documentar as polticas,
procedimentos e padres adotados (PADI, 2003).
Desde 1996 vem surgindo polticas de preservao digital em diferentes
tipos de organizaes, universidades, arquivos nacionais, bibliotecas nacionais, etc.
Algumas das mais conhecidas citadas por McGovern (2007) so as seguintes:
Arts and Humanities Data Service (2004)
British Library (2002)
Columbia University Library (2000)
Cornell University Library (2004)
Inter-University Consortium for Political and Social Research (2007)
Library and Archives Canada (2002)
National Archives UK (2000)
National Library Australia (2001)
National Library of New Zealand (2003)
National Library of Wales (2003)
Nestor Policy Project da Alemanha (2004)
North Caroline Department of Cultural Resources (2000)
UK data archives (2005)
Os argumentos relacionados com uma poltica de preservao digital
observados nos exemplos citados e publicados no exterior podem ser
exemplificados por duas das primeiras instituies a divulgar os pontos focais das
legislaes propostas.
O primeiro exemplo o modelo de poltica de preservao digital da NLA,
promulgado em 24 de fevereiro de 2002, que se destaca pela sua natureza poltica e
enfoque institucional, declarando a inteno de [...] preservar e manter documentos
(digitais ou no) [...], contando com a colaborao de instituies parceiras.


173
Depois de mencionar o escopo da poltica, adota-se uma definio de
preservao digital e reafirma-se que as aes sero aplicadas a qualquer tipo de
material digital segundo a natureza dos documentos. O modelo a ser seguido o
OAIS e ele fica explcito na declarao dos seus princpios operacionais:
1) necessidade de desenvolver prticas adequadas e coerentes para o
tratamento mais apropriado dos materiais digitais;
2) uso do modelo de referncia OAIS como um exemplo para a
construo e gerenciamento do seu arquivo;
3) comprometimento no uso de normas e padres internacionais no
desenvolvimento de dos sistemas e da infra-estrutura para a
preservao digital;
4) reconhecimento da importncia da experimentao e desenvolvimento
de processos que compreendam modelos de negcios e cumprimento
da norma OAIS;
5) definio do Pacote de Arquivamento de Informao a ser usada
seguindo o OAIS.
Alm de se comprometer a incentivar a pesquisa na rea e a dar apoio ao
desenvolvimento de padres e normas, a poltica da NLA expressa o
comprometimento da instituio com relao s colees digitais nesse pas. Ela
abre espao para a especificao do uso de estratgias de preservao digital e do
trabalho com rgos oficiais para fundamentar a sustentabilidade econmica.
O segundo exemplo de poltica de preservao digital da British Library,
formalizado no dia 14 de novembro de 2002. Centrada na sua misso de preservar
materiais digitais, a British Library adota uma abordagem estratgica na
implementao das aes de preservao de objetos digitais, entre as quais
estariam as de colaborao, estudo e pesquisa das caractersticas, desafios e
especificaes desses materiais.
O comprometimento institucional da British Library vai at o
estabelecimento de requisitos com relao a estratgias a serem implementadas,
controle de formatos, projetos de digitalizao e disposio para a implementao
de solues novas.
As duas polticas citadas so exemplos da formalizao das intenes de
programas e projetos de instituies amparadas nas leis de depsito legal que esto
comeando a formular critrios para o estabelecimento do elemento preservao


174
nas solues a serem adotadas para o armazenamento de objetos digitais (FOOT,
2001).


2.6.2 Gerenciamento dos direitos de propriedade


Dentro do contexto estratgico de criao e preservao de recursos
digitais, o relatrio da Arts and Humanities Data Service (AHDS) da Inglaterra
ressalta o contexto das polticas aplicveis para os trs estgios dentro do ciclo de
vida de um recurso digital: criao, administrao/preservao e uso (BEAGRIE;
GREENSTEIN, 1998). Uma das principais concluses foi a de que as decises que
podem afetar a disponibilizao dos materiais digitais precisam ser tomadas no
incio do ciclo de vida do objeto digital.
Para os materiais digitais, a ligao entre sua criao e a preservao
muito mais importante devido a que decises sobre a forma como os objetos digitais
so criados influenciam a maneira como eles podem ser preservados. Do mesmo
modo, as decises tomadas no momento da preservao podem influenciar como
esse material ser acessado no futuro.
O gerenciamento dos direitos de propriedade intelectual de materiais
digitais tem um significado mais argvel do que na mdia tradicional, pois deve
considerar no apenas o contedo, mas tambm qualquer assunto relacionado ao
software. Qualquer ao (cpias, encapsular contedo, emulao de software,
migrao de contedo) envolve atividades que podem infringir permisses
especficas dos que mantm os direitos.
Esse tipo de gerenciamento cobre todos os processos que envolvem a
definio e a propriedade dos direitos dos depositantes e os direitos dos usurios
dos centros de informao. Greenstein (1997) define direitos autorais como aqueles
que incluem direitos de propriedade intelectuais e assuntos legais relacionados com
a proteo dos dados e confidecialidade. Ele assegura que os direitos inseridos em
um recurso podem no apenas determinar como ele pode ser acessado e usado,
mas tambm determinar o como e se eles podem legalmente ser preservados por
terceiros.


175
No que se refere ao direito autoral, dois grandes acordos regulam a
questo: a Conveno de Roma, que o principal tratado internacional em direito
conexo, e a Conveno de Berna, que o tratado autoral do direito internacional
principal. Esta ltima no faz uma iseno especfica para copiar todos os tipos de
trabalho para finalidades da preservao (BERNE, 1986). Fornece, sim, uma regra
geral sobre o direito de reproduo:
1. as isenes relativas ao direito de reproduo no devem ser
demasiadamente amplas, devem ser incorporadas na lei para um alvo
especfico e devem servir ao interesse pblico. Se uma iseno
estatutria fosse adotada especificamente para finalidades da
preservao, tais circunstncias seriam satisfeitas;
2. uma iseno no deve se opor explorao normal do trabalho
(WIPO, 1996).
No Brasil, a lei que trata desta questo a de n 9.610, sancionada em 19
de fevereiro de 1998 pelo ento presidente Fernando Henrique Cardoso. Para as
unidades de informao, a definio de publicao, constante do art. 5, primordial:
I - publicao - o oferecimento de obra literria, artstica ou cientfica ao
conhecimento do pblico, com o consentimento do autor, ou de qualquer outro titular
de direito de autor, por qualquer forma ou processo.
Preservar significa copiar de alguma maneira, e o artigo 5 desta lei define
reproduo como:
VI - a cpia de um ou vrios exemplares de uma obra literria, artstica ou
cientfica ou de um fonograma, de qualquer forma tangvel, incluindo
qualquer armazenamento permanente ou temporrio por meios eletrnicos
ou qualquer outro meio de fixao que venha a ser desenvolvido.
J o art. 29 afirma que depende de autorizao prvia e expressa do autor
a utilizao da obra, por quaisquer modalidades, tais como I - a reproduo parcial
ou integral [...], e o art. 33 completa mostrando que ningum pode reproduzir obra
que no pertena ao domnio pblico, a pretexto de anot-la, coment-la ou
melhor-la, sem permisso do autor.
No caso do armazenamento de documentos digitais em bases de dados, a
lei 9.610 confirma a determinao existente de que depende da autorizao prvia
do autor, pelo fato de, ao serem includos, transformar-se em uma forma de
disseminao e reprografia (GANDELMAN, 1997).


176
Na Koninklijke Bibliotheek (KB) em Haia, a comisso do Institute for
Information Law da Universidade de Amsterd examina os problemas relacionados
ao direito autoral que poderiam impedir esforos para preservar e manter a
acessibilidade de dados eletrnicos, uma vez que a preservao implica a
reproduo em grande parte dos casos.
De acordo com as diretrizes da KB, h dois mtodos para garantir a
preservao de longo prazo de publicaes eletrnicas:
1) assegurar sua acessibilidade: a publicao pode ser retida em seu
formulrio original junto com o hardware e a tecnologia necessrios
para acessar, isto construindo uma "passagem" entre a velha e a
nova tecnologia;
2) transferir a publicao s geraes mais novas de configuraes do
hardware e software do computador, assim que a mais velha ameaar
se tornar obsoleta. Isso envolve um nmero das tcnicas e
procedimentos (incluindo converso e transferncia de dados)
geralmente conhecidos pelo termo geral "migrao".
Se a primeira opo for escolhida, a publicao eletrnica ainda assim
precisar, eventualmente, ser copiada para ser preservada, j que, como todas as
mdias existentes, as publicaes eletrnicas esto suscetveis deteriorao. A
concluso final do Preservation of New Technology, um estudo compilado a pedido
da American Commission on Preservation and Access of the Council on Library and
Information Resources, que preservao significa copiar (BOERES; MRDERO,
2005).
Em 2003 a NARA (U.S. National Archives and Records Administration)
adotou a norma ISO 15489 para o gerenciamento dos registros eletrnicos em todo
o ciclo de vida dos documentos digitais de carter oficial do governo americano.
Essa norma surgiu na Austrlia (AS 4390) e est sendo usada como base para
polticas de preservao de documentos digitais de vrias instituies daquele pas.
A norma considera a gesto dos registros como uma seqncia integrada de
processos, que vai desde quem usa para criao at seu acesso contnuo,
ampliando as responsabilidades dos criadores e gerentes desses registros para
todos os empregados da instituio mantenedora.
O pr-requisito de preservabilidade pode ser alcanado unicamente
mediante uma estratgia organizacional. Para a maioria das instituies de ensino


177
superior, a carncia de tempo, recursos e conhecimentos necessrios para garantir
a preservao de sua produo intelectual de longo prazo, bem como a adoo de
uma poltica de preservao poderiam facilitar o entendimento dos gestores sobre as
principais concluses a que chegam os estudos atuais sobre o tema (BORES,
2004; ERPANET, 2003; FEATHER, 2004; FOOT, 2001):
1. a preservao de informao digital requer colaborao entre
organizaes e pessoas envolvidas na criao e no gerenciamento;
2. a preservao comea no design de sistemas que daro suporte
criao de objetos digitais;
3. deve ter-se claro o papel de cada um dos envolvidos no processo para
identificar e apontar responsabilidades;
4. a preservao deve ser parte integrante de qualquer estratgia que
inclua o uso de tecnologia de informao;
5. as estratgias de preservao e seus mtodos devero estar
integrados em todas as atividades ou sistemas que criam ou usam
informao digital.
Uma poltica aceitvel de preservao digital implica observar e aplicar
procedimentos que podem ser inclusive aceitos como estratgias de preservao.
Entre eles esto os relativos tecnologia da informao, mais especificamente no
tocante compatibilidade de hardware, software e migrao dos dados (converso
para outro formato fsico ou digital, emulao tecnolgica e espelhamento dos
dados), observao da integridade do contedo intelectual a ser preservado;
anlise dos custos envolvidos no processo; ao desenvolvimento de uma criteriosa
poltica de seleo do que ser preservado e, intimamente atrelada a isso, a
observao das questes mencionadas sobre direito autoral.


2.7 MAPEAMENTO DOS CRITRIOS DE PRESERVAO DIGITAL


Entre as possibilidades de abordagem ao tema da preservao digital,
est tentar identificar os critrios que sirvam como padro para comparar e julgar as
melhores prticas nas organizaes. Numa rea relativamente nova e com uma
variedade ainda no completamente definida de aplicaes, torna-se necessria a


178
formulao de indicadores que possam auxiliar na fundamentao de uma estratgia
a ser escolhida.
Devido ao escopo do tema desta tese, o estudo dos critrios de
preservao digital focalizou-se nos projetos e iniciativas relacionadas com a
informao tcnico-cientfica; so exemplos predominantemente resultantes de
instituies de ensino e pesquisa que esto sendo consideradas como boas prticas
e experincias de aprendizagem no campo dos repositrios digitais.
A avaliao de qualquer prtica relacionada com os recursos digitais
envolve estim-los segundo critrios prticos e tcnicos. Greenstein foi o primeiro a
enfocar os critrios prticos de preservao relacionados a um conjunto de
atividades que determinam a manuteno de colees digitais de informaes
cientficas e culturais. Essas condies bsicas (BULLOCK, 1999) foram
identificadas e aplicadas por vrios especialistas (bibliotecrios, arquivistas,
gerentes de bibliotecas digitais) em diferentes iniciativas das quais partiram as
primeiras polticas de preservao digital.
O desenvolvimento dos programas e projetos de preservao tem
apontado a necessidade de chegar a um acordo, no que seria o conjunto mnimo de
critrios para o funcionamento de um repositrio de preservao da produo
cientfica em formato digital. A maioria das propostas de critrios que vem surgindo
menciona a influncia do modelo de referncia OAIS/SAAI, assim como, tambm,
elas apresentam um conjunto de critrios para o planejamento de repositrios
digitais.
Alguns esboos de critrios encontravam-se presentes em propostas de
preservao digital que focalizavam:
o controle fsico e intelectual dos materiais para garantir sua
preservao a longo prazo, com credenciamento de formatos de
arquivos requeridos;
a padronizao de estratgias de migrao, validao de dados e
especificaes normativas para mdia fsica;
a padronizao no uso de metadados de preservao.
No centro dessas propostas, a maioria proveniente da rea arquivstica, j
estava contido o conceito de arquivos ou repositrios digitais confiveis. A
confiabilidade vem diretamente do principio arquivstico de custdia responsvel.


179
Como observa Thomaz (2007), a confiana nos repositrios digitais se desenvolve
em no mnimo trs nveis:
1. a confiana de que os produtores esto enviando as informaes
corretas;
2. a confiana de que os consumidores esto recebendo as informaes
corretas; e
3. a confiana de que os fornecedores esto prestando servios
adequados.
A primeira lista de atributos e responsabilidades de repositrios digitais
confiveis foi estabelecida pela Research Libraries Group (RLG) e o Online
Computer Library Center (OCLC) no seu relatrio publicado em 2002. Esse conjunto
de atributos est influenciado pelo modelo OAIS/SAAI e estabelece que essa
obedincia ao modelo deva ser considerada o primeiro critrio a ser observado por
um repositrio confivel.
Para esse grupo, os repositrios confiveis devem incluir tambm,
atributos que possam dar suporte a sistemas de segurana e aos procedimentos
adequados e significativos. Eles apontam que todo repositrio confivel deve incluir
atributos que sustentem os seguintes aspectos:
a) responsabilidade administrativa;
b) viabilidade organizacional;
c) sustentabilidade financeira;
d) adequabilidade tecnolgica e procedimental;
e) sistema de segurana;
f) responsabilidade de procedimentos (certificao).
O relatrio da RLG e da OCLC codifica esses atributos no conjunto de
responsabilidades baseado no modelo OAIS/SAAI, manifestado suas
responsabilidades de custdia e definindo, assim, o que pode ser considerado como
uma lista de requisitos funcionais (Figura 18).


180

Figura 18 - Modelo de Trusted Digital Repository (TDR) da RLG e OCLC

O modelo Trusted Digital Repository representa a primeira forma de
expressar a infra-estrutura organizacional da preservao digital. Os atributos do
TDR converteram-se em padres para a comunidade da preservao digital, pois
antes deles no existia uma expresso formal do contexto organizacional da
preservao digital.
Uma nova verso do modelo TDR surgiu do projeto de preservao digital
da Cornell University, sugerindo que o modelo a ser seguido deve sair do
entendimento de dois documentos-chave: o que prope os atributos de um
repositrio digital confivel (TDR) da RLG/OCLC na implementao tecnolgica, e
da proposta do modelo de referncia OAIS/SAAI para a estrutura do contexto
organizacional. A representao dessa integrao de propostas est no diagrama
elaborado por Nancy Y. McGovern (2007) como mostra a Figura 19.
Usando o diagrama desenvolvido pela University of Cornell, McGovern
aborda a questo da fronteira chamada de Digital Archives Border entre os primeiros
dois atributos e o restante, para esclarecer sua importncia naqueles casos em que


181
uma instituio mantm mais de um repositrio. Os primeiros dois atributos se
aplicariam a todos os repositrios na instituio, j que mais de uma organizao
pode chegar a gerenciar apenas um repositrio (como no caso de um consrcio).


Figura 19 - Diagrama da integrao dos dois pilares da preservao digital baseado no modelo
TDR da RLG/OCLC
Fonte: McGovern (2007)


Desde 2003 a Cornell University vem criando parcerias e repassando para
a comunidade sua experincia com a aplicao desses princpios, colocando
tutoriais on-line e cursos para gestores de projetos de preservao digital. A Cornell
University foi uma das primeiras instituies de ensino que utilizaram as duas
grandes propostas para repositrios confiveis; com elas foi estabelecida sua
poltica de preservao digital e iniciados alguns dos seus projetos (CORNELL


182
UNIVERSITY LIBRARY, 2004). Tambm nessa universidade o trabalho seguiu
alguns princpios norteadores:
a) focalizar as aes na reduo de riscos;
b) proteger as verses arquivveis;
c) entender os componentes dos objetos digitais;
d) reconhecer algum tipo de perda como inevitvel;
e) estabelecer um ciclo de planejamento e manuteno.
Aps a definio desses princpios, foi detectada a necessidade do
trabalho colaborativo, ou seja, uma nica instituio no conseguiria atender todas
suas necessidade de preservao. Todos os projetos e iniciativas mapeados
buscam a realizao da sua inteno original que comum para todos eles:
preservar a produo intelectual e cultural das instituies e garantir o acesso
permanente informao (Apndice C).
A possibilidade de se criar um modelo genrico de servios de
preservao digital para repositrios institucionais usando o modelo de referncia
OAIS uma das necessidades nas iniciativas pblicas de projetos e programas
colaborativos. Alguns dos projetos comeam a elaborar guias e manuais para
auxiliar no processo de insero de dados (ingest process), a estimular o depsito
de arquivos em formatos-padro para diminuir custos operacionais de longo prazo e
a recomendar melhores prticas a serem implementadas.
No estgio inicial do projeto Securing a Hybrid Environment for Research
Preservation and Access (SHERPA) foi realizada uma reviso crtica do modelo de
referncia OAIS. Usando o modelo para identificar os direitos e as responsabilidades
executadas pelo repositrio institucional, foram delineados os requisitos mandatrios
e as entidades funcionais dentro do projeto de servio de preservao distribuda do
SHERPA (Figura 20).



183


Figura 20 Modelo funcional OAIS no projeto SHERPA


Projetando j um possvel processo de auditoria para atribuir/certificar a
concordncia com o modelo OAIS, as primeiras aes desenvolvidas pelos
responsveis pelo projeto foram:
a) mapear as seis entidades de um repositrio que esteja em
concordncia com o OAIS (insero, armazenamento arquivstico,
administrao, gerenciamento de dados e acesso) dentro de uma
estrutura existente;
b) garantir que a terminologia de um domnio especfico pode ser
mapeada por um equivalente OAIS.
O projeto SHERPA mostrou que a auditoria pode comear no processo de
insero dos dados, j que os sistemas de repositrios digitais podem ser divididos
em dois grupos, aqueles em que o autor ou editor deposita diretamente o contedo
(ex.: DSpace), e os que usam algum tipo de coleta desde as pginas a repositrios
na web (ex. LOCKSS). Os dois processos no so imunes a algum tipo de ameaa e
a auditoria pode confirmar a autenticidade do contedo inserido (ROSENTHAL et al.,
2005).


184


2.7.1 Atributos de repositrios digitais


Os atributos e responsabilidade dos repositrios digitais em uso
atualmente no exterior esto sendo definidos dentro do contexto dos desafios
relacionados com a habilidade das instituies de integrar o gerenciamento de
materiais digitais na sua estrutura organizacional. Outra caracterstica desses
centros ter entre seus objetivos a pesquisa e o desenvolvimento das melhores
prticas para maximizar os benefcios das novas tecnologias.
O reconhecimento da importncia dos atributos de preservao digital e as
polticas e procedimentos para sua aplicao constituem a primeira linha de ao no
estabelecimento de sistemas de gerenciamento de informao digital.
Apesar do pouco tempo de implementados, os atributos de preservao
digital podem ser acompanhados j no processo de escolha das ferramentas e
formao dos repositrios digitais (CatalysIT, 2006; WHEATLEY, 2003) Com base
na aplicao dos atributos TDR e do modelo OAIS/SAAI, os gestores desses
sistemas de gerenciamento de informao digital podem propor algumas aes
tcnicas e organizacionais;
1) avaliar o funcionamento das primeiras migraes para novos
formatos;
2) analisar os indicadores de desempenho dos repositrios e
ferramentas adotadas;
3) definir polticas de seleo e depsito e reteno de documentos;
4) definir os perfis dos responsveis e tipo de aperfeioamento para
cumprir eficientemente as tarefas designadas.
Para efetivar as duas primeiras aes, alguns atributos tcnicos de
preservao digital tm sido usados, tais como:
1) segurana;
2) interoperabilidade;
3) qualidade e capacidade de configurao das ferramentas no
workflow;
4) internacionalizao interfaces multilnges;


185
5) licena para software livre.
Para as duas ltimas aes, duas responsabilidades orientadas para os
aspectos organizacionais so as mais indicadas: facilitar a configurao segundo o
tipo de usurio e ter o suporte da comunidade.


2.7.2 Certificao de repositrios digitais


Em pases como os Estados Unidos, Inglaterra e Alemanha j esto em
funcionamento iniciativas de auditoria de arquivos digitais. Instituies nos Estados
Unidos como o Research Library Group (RLG) e o National Archives and Records
Administration (NARA) que criaram um grupo de trabalho sobre certificao de
repositrios digitais e na Inglaterra como o Center for Research Libraries (CRL) com
seu projeto de auditoria e certificao de arquivos digitais, esto interessadas em
produzir um conjunto de princpios de auditoria em comum. So iniciativas que esto
focalizando os benefcios e as ferramentas necessrias para a autovalorizao e
auditorias terceirizadas.
Sobre a capacidade de auditoria e certificao, existem iniciativas em
funcionamento que vm proporcionando ferramentas para auto-avaliao, mas as
organizaes precisam de meios para participar de auditorias externas. Processos
de certificao podem criar maior padronizao e credibilidade dos arquivos digitais
que vo ao encontro das necessidades das bibliotecas e seus usurios. Os
exemplos locais e as lies aprendidas esto contribuindo nesse sentido.
Com o reconhecimento da importncia das polticas de preservao, ficou
implcito o papel que elas tm dentro dos requisitos de evidncia necessrios para
criar mecanismos de auditoria e certificao dos documentos e dos repositrios
digitais. Em 2006 a RLG/NARA publicou o documento Audit Checklist for Certifying
Digital Repositories, e no ano seguinte o Center for Research Libraries CRL lanou o
Trustworthy Repositories Audit & Certification: Criteria and Checklist (TRAC),
demostrando que as auditorias identificam realmente os pontos fortes e fracos nos
programas de preservao digital, e como elas podem ajudar a definir planos de
desenvolvimento que gradativamente cumpram com o conjunto de critrios definidos
para os repositrios digitais confiveis (McGOVERN, 2007).


186
A checklist da RLG/NARA define o conjunto de polticas gerenciais que
so organizadas como critrios de preservao digital pela instituio, as funes do
repositrio, os processos e procedimentos, a comunidade alvo a usabilidade da
informao e as tecnologias e a infra-estrutura tcnica (RLG/ NARA, 2006).
A adoo de ferramentas de preservao digital que podem ser
personalizadas, intercambiveis e adaptadas aos workflows nos repositrios digitais
est levando as instituies a abrir espaos para integrar requisitos de auditoria e de
medio, dos pontos fracos e fortes dos programas de preservao digital.
Entre as concluses a que chegaram os pesquisadores do RLG-NARA, no
seu documento Criteria for Measuring Audit Checklist for Certifying Digital
Repositories, est a de que as ferramentas usadas para fazer auditoria dos
repositrios precisam ser desenvolvidas pelos prprios executores dos projetos de
preservao digital.
O estabelecimento de programas de certificao e de critrios para serem
usados em auditorias uma necessidade identificada na comunidade da cincia da
informao que lida com repositrios institucionais e que precisa de modelos de
certificao dessas ferramentas (LYNCH 2003).
Algumas iniciativas que usam ferramentas como JHOVE, DROID e XENA
esto apresentando, alm da funcionalidade de preservar os objetos digitais na sua
integrao dessas ferramentas aos softwares de repositrios digitais, elementos que
propiciam a comparao dos limites e capacidades das organizaes no
cumprimento dos requisitos de preservao apontados pelos modelos TDR e OAIS.
Projetos como o Network of Expertise in Long-Term Storage of Digital
Resources (Nestor) da University Library of Humboldt-University Berlin, que
desenvolveu seu Catlogo de Critrios para Repositrios Digitais so exemplos do
crescente movimento para o desenvolvimento de parmetros para medir a qualidade
o confiabilidade de um repositrio. O grupo de trabalho do Nestor tem entre seus
objetivos [...] formular critrios para repositrios digitais confiveis e recomendaes
para procedimentos de certificao de repositrios digitais [...] (DOBRATZ;
SCHOGER; STRATHMANN, 2007 s/p.).
A complexidade dos sistemas de preservao digital em repositrios
confiveis foi apontada pelo grupo de trabalho do projeto Nestor em 2004; ele
destacou a importncia de abordar todo o processo gerencial de informao digital
das organizaes onde se deseja que a confiabilidade seja confirmada (NESTOR,


187
2006). A partir da, todo o ambiente da preservao digital comeou a ser tomado
em considerao, assim como a recomendao de que os resultados da auditoria
fossem comunicados de forma transparente ao pblico para gerar mais confiana.
Propostas como a do catlogo do projeto Nestor esto sendo usadas
como instrumentos para auto-avaliao das etapas de desenvolvimento de projetos
de repositrios digitais confiveis. Sua aplicabilidade internacional tem suas
limitaes por razes geopolticas, mas levada em considerao
internacionalmente para o estabelecimento de um processo formal de certificao
ISO.
Em 2007 com o lanamento do checklist da CRL Criteria for Measuring
Trustworthiness of Digital Repositories and Archives: an Audit & Certification
Checklist, representantes de projetos de vrios pases esto construindo uma
colaborao formal para auditoria e certificao de repositrios de preservao
digital (CRL, 2007).
Tanto o Grupo de Trabalho do projeto NESTOR na Alemanha, quanto o
DCC na Inglaterra e o CRL nos Estados Unidos coincidem nos princpios bsicos
para a aplicao de critrios institucionais de preservao digital, como segue:
1) Documentao (evidncia): as metas, os conceitos, especificaes e
implementaes de preservao digital de um repositrio devero ser
documentadas adequadamente. A avaliao inicial do repositrio como
um todo baseada na documentao pode prevenir erros e
implementaes inapropriadas.
2) Transparncia: a publicao da documentao leva transparncia.
Segundo a CRL, [...] apenas o repositrio que expe seu design,
especificaes, prticas, polticas e procedimentos para anlise de
riscos pode ser considerado confivel [...] (CENTER OF RESEARCH
LIBRARY, 2007, s/p).
3) Proporcionalidade: nenhum padro ou norma deve ser tomado como
nico e absoluto para avaliao de todos os aspectos de um repositrio
digital, mas ela deve ser realizada baseada nos objetivos e tarefas
aplicadas preservao digital.
4) Mensurabilidade: apenas para alguns casos, devido aos aspectos de
temporalidade dos processos de preservao, algumas formas de
controle no so viveis, mas a instituio dever informar os


188
indicadores para medir o grau de confiabilidade, segundo seu nvel de
transparncia.
As concluses a que esses projetos chegaram so de que a certificao
dos repositrios envolve mais do que a aplicao de critrios resultantes desses
princpios bsicos. Ela deve prover ferramentas para o planejamento da auto-
avaliao e formas de auditorias internas e externas. O contexto de ambas
geopoltico, mas o processo no varia significativamente.
A comunidade de desenvolvedores desses repositrios vem confirmando
a importncia do processo de auditoria com mais freqncia do que o de
certificao, pois a auditoria permite que os desenvolvedores dos repositrios
analisem e respondam de forma sistemtica s carncias e acertos na criao dos
sistemas.
No final de 2008, discute-se a aplicao de procedimentos de auditoria
automatizados de contextos especficos da preservao digital, validando polticas
locais definidas na aplicao de softwares para repositrios (MOORE; SMITH,
2007). Assim, espera-se tambm, a participao mais efetiva dos repositrios com
informaes oficiais dos governos, a partir do momento em que o processo de
padronizao da auditoria e certificao dos repositrios digitais fique formalizado
numa norma ISO.
Para os especialistas em preservao digital, um apoio veio ao serem
formalizados os primeiros centros de curadoria digital em 2005. Duas instituies
que trabalham nesse sentido so a Digital Curation Centre (DCC) na Inglaterra e a
UNC Chapel Hill nos Estados Unidos. O DCC um centro que oferece servios e
produtos para a comunidade que trabalha com a curadoria de materiais digitais,
oferecendo apoio comunidade para trabalhar em rede e facilitar formas de
acrescentar valor aos contedos digitais. Outras instituies esto discutindo a
criao de programas de ps-graduao dentro das comunidades de cincia da
informao, biblioteconomia, arquivologia e museologia, para capacitar seus
estudantes nos trabalhos na rea da curadoria da informao digital.







189
2.8 CONCLUSES DA REVISO DE LITERATURA


A metodologia de organizao e descrio dos objetos digitais deve
observar a natureza da informao a ser preservada. Isso premissa bsica para
que os critrios de preservao digital sejam propostos. Porm, o conceito geral e a
urgncia esto presentes na cincia da informao, em suas disciplinas,
demandando a criao de sistemas nos quais os recursos humanos, tecnolgicos e
procedimentais estejam em alinhamento com o estado-da-arte acerca das polticas,
atributos e critrios de preservao digital.
Foi apresentado o estado atual das atividades de preservao digital da
informao cientfica em pases como os Estados Unidos, Austrlia, Nova Zelndia,
Holanda, Inglaterra, Alemanha e Canad. Trata-se de estratgias que pretendem
garantir a inalterabilidade dos registros digitais. Todos os mtodos mencionados
procuram evitar o risco de criar barreiras para um uso pleno dos recursos no futuro.
Para resolver esse problema, foram elaborados e testados nos ltimos anos
esquemas conceituais que permitem identificar as partes integrantes do processo de
preservao digital, assim como a sua padronizao em modelos de referncia para
iniciativas de repositrios digitais (CCSDS, 2002).
Uma percepo duradoura da preservao digital precisa abarcar vrias
geraes de sistemas e tecnologias e unir as mudanas organizacionais com as
necessidades de atualizao dos responsveis pelas colees digitais. As
perspectivas aqui citadas tm como respaldo especialistas e organizaes, alm de
tecnologias assimiladas por comunidades de usurios. No exterior, os gerentes dos
sistemas de preservao digital esto se adequando aos delineamentos dados pelos
modelos de repositrios confiveis e de referncia existentes.
A questo da preservao digital possui vrias frentes de
desenvolvimento. Das polticas s tcnicas, um grande conjunto de pontos crticos
encontrado e, por isso, os profissionais interessados na manuteno das
informaes sobre sua responsabilidade devem entender e se envolver com a
elaborao das respostas. O interesse comum dos gestores dos mais diversos tipos
de acervos em conhecer a preservao digital o motivo que leva pesquisa e o
conseqente desenvolvimento de solues de aplicao na realidade.


190
Algumas leis e padres relacionados com o ciclo de vida da informao
em formato digital comeam a surgir, permitindo a formulao de polticas de
preservao digital estruturadas a partir da natureza da informao a ser guardada
de longo prazo. Modelos conceituais esto sendo utilizados de forma a servir de
base para polticas adaptadas a diferentes acervos por profissionais de formao e
atividades diversificadas (arquivistas, bibliotecrios, editores, muselogos e
curadores). Os estudos sobre a preservao digital tm estabelecido que a imediata
implementao de polticas de preservao digital a forma mais efetiva de garantir
o armazenamento e uso de recursos de informao por longos perodos de tempo.
A proposta de criao de sistemas de preservao digital distribudos, que
sigam modelos econmicos sustentveis est partindo de projetos de preservao
de publicaes eletrnicas, que esto extraindo informaes para bibliotecrios e
editores sobre a necessidade de confiar nos parceiros no campo digital, aspecto j
mencionado, desde 1996, pelos primeiros especialistas a tratar do tema.
No caso especfico da informao cientfica e tecnolgica, os repositrios
digitais so semelhantes em algumas caractersticas bsicas no que se relaciona
preservao digital. Um exemplo o DSpace Institutional Digital Repository System
(projeto colaborativo da MIT Libraries e a Hewlett-Packard) orientado preservao
digital (JAMES et al., 2003). O DSpace como programa livre, ao ser adotado pelas
organizaes, transfere a estas a responsabilidade e os custos com as atividades de
preservao (NIXON, 2002). Isto promove uma nova postura na comunidade, que
garantir efetivamente o acesso permanente informao.
Vrias pesquisas vm centrando-se no modelo de preservao digital dos
repositrios digitais, enfocando a necessidade de atuais e futuros usurios de contar
com materiais autnticos e certificados por instituies reconhecidas. A descrio
em metadados, de todos os detalhes que expressem a histria de criao de um
objeto digital est sendo considerada, tanto na rea da arquivologia como na de
cincia da informao, uma metodologia que pode garantir a originalidade de um
registro eletrnico.
Os repositrios digitais esto comeando a definir os nveis de servios de
preservao que podem oferecer, dependendo do contedo e do tipo de objeto.
Para alguns contedos o repositrio pode comprometer-se a chegar no nvel da
preservao dos bits, garantindo retornar ao autor do depsito a seqncia de bits
sob demanda. Para outros registros, alguns sistemas de repositrios podem aplicar


191
estratgias de preservao como a migrao ou at trabalhar em parceria com
outros repositrios usurios das mesmas ferramentas.
Mas a falta de polticas de preservao na maioria dos projetos de
repositrios digitais sugere a carncia de conhecimentos tcnicos sobre a
importncia das estratgias de preservao de materiais digitais existentes. A
literatura da rea mostra que a maioria dos projetos est nos seus primeiros
estgios e apenas metade deles relata seguir alguma forma de modelo de negcios
e processos de auditoria planejados (SMITH, 2008).
Essa lacuna informacional por parte dos responsveis pelas polticas de
implementao de informao digital precisa ser destacada. A segunda lacuna que
deve ser mencionada diz respeito importncia da existncia de bibliotecas digitais
e de centros especializados no estabelecimento e monitorao de estratgias de
preservao digital bem-sucedidas.
A amplitude do problema tratado conduziu a pesquisa bibliogrfica ao
momento do questionamento sobre a transformao de atributos e responsabilidade
de preservao digital para critrios bsicos formulados nas maiores iniciativas de
pesquisa da rea.
Embora o contexto atual dos trabalhos sobre auditoria e certificao de
repositrios de preservao no proporcionem ainda elementos suficientes para
perceber os benefcios obtidos na aplicao dos critrios de preservao digital
adotados, espera-se que a definio de normas de auditoria e certificao seja
reconhecida internacionalmente e que sua assimilao geopoltica mantenha as
caractersticas interoperveis dos sistemas.
As propostas de critrios de gesto de preservao digital da informao
tcnico-cientfica partiram de um entendimento sobre a realidade, gerado nas
observaes e anlises dos aspectos fundamentais das prticas realizadas com
esse objetivo. Espera-se que a ampla gama de condies sob as quais esses
critrios sejam apropriados possua alta probabilidade de aplicao.
Com base na literatura analisada, pode-se afirmar que os critrios a serem
propostos neste trabalho expressaro e justificaro um mtodo de abordagem para
uma realidade concreta, neste caso, aquela das instituies de pesquisa no Brasil.
Padres, normas e prticas de preservao so adotados, quando existe
conscincia e interesse por parte dos responsveis pelos acervos em desenvolver
recursos que sejam permanentemente acessados. Em nvel nacional, a definio


192
das polticas, obrigaes e metodologias mais apropriadas para a preservao dos
documentos eletrnicos deve levar em considerao a implementao de pacotes
de software livres a fim de verificar se atendem s necessidades das instituies de
ensino e pesquisa e se esto em concordncia com os j testados padres
internacionais, que promovem o arquivamento digital da produo cientfica de longo
prazo (UNESCO, 2007).
O trabalho exposto motivou o estudo bibliomtrico sobre a produo
cientfica da rea (ver detalhes no item 3.3.1) e preparou a indagao sobre as
expectativas e necessidade dos responsveis pelos acervos de informao cientfica
no Brasil. A realidade a ser detectada levou a uma proposta dos critrios que devem
conduzir as implementaes de sistemas de preservao digital no pas.


193
3 METODOLOGIA


O mtodo cientfico pode ser definido como o estudo de um fenmeno
observvel para fins de conhecimento ou de predio, descrevendo sua estrutura e
funcionamento. As pesquisas que enfatizam os processos e os significados no
medidos rigorosamente so denominadas qualitativas; elas abordam a relao entre
o pesquisador e seu objeto de estudo e a natureza do contexto social.
A pesquisa qualitativa um processo de investigao que obtm dados do
contexto onde os eventos ocorrem, em uma tentativa para descobri-los,
como uma forma para determinar os processos nos quais os eventos esto
localizados e as perspectivas dos indivduos que deles participam,
utilizando a induo para derivar as possveis explicaes baseadas nos
fenmenos observados. (GORMAN; CLAYTON, 1997 p. 23).

Para Silverman (2000), as metodologias na pesquisa social precisam de
um planejamento cuidadoso e podem ser definidas de forma muito geral (qualitativa
ou quantitativa) ou muito particular (por ex. anlise de discurso, grounded theory).
Para Carlin (2003), desde seu incio, o campo da biblioteconomia
apropriou-se de instrumentos metodolgicos de investigao e tericos de outras
reas das cincias sociais, com exceo da bibliometria ou anlise de citaes.
Na cincia da informao, as aes relacionadas com a preservao
digital esto associadas ao contexto dos problemas de informao que uma
sociedade enfrenta no momento em que decide armazenar e dar acesso ao acervo
considerado importante para ser preservado. Preservar, no ambiente digital, significa
permitir a existncia de longo prazo de objetos que contm informao relevante.
Os levantamentos bibliogrficos e buscas em recursos de informao on-
line detectaram a ausncia de argumentos tericos ou abordagens metodolgicas no
estudo da preservao digital. Podemos afirmar que no existe uma interpretao
nica ou teorias que expliquem o tipo de fenmeno que est sendo produzido pelas
aes de preservao digital no mundo.
Considerando que a temtica da preservao digital encontra-se na fase
da construo de hipteses mais precisas e que os estudos atuais comeam a
elucidar questes complexas sobre sua natureza, esta pesquisa pretendeu prover
subsdios e elucidar conceitos associados preservao digital.


194
Na literatura da rea, os critrios de preservao digital esto sendo
apontados como elementos integrantes dos sistemas de gesto de preservao
digital, divididos em trs aspectos: o organizacional, o tecnolgico e o dos recursos
necessrios. O aspecto organizacional est representado pela observncia do
modelo de referncia OAIS na construo de sistema de gesto da preservao
digital. Para tratar do aspecto tecnolgico, est sendo seguido o modelo dos TDR na
estruturao de repositrios de preservao confiveis. E, para o terceiro aspecto,
esto os esforos relacionados identificao de alguns critrios que contemplem
os custos e a formao de recursos humanos (GRANGER, 2002; LAVOIE;
DEMPSEY, 2004; LYNCH, 2003; RLG, 2002).
A principal preocupao mencionada nesses estudos que os
profissionais da informao responsveis pelos documentos digitais estabeleam
seus prprios critrios na criao de sistemas de gesto de preservao digital em
suas instituies. Esta necessidade pode ser detectada nas pesquisas que tm sido
realizadas em instituies internacionais (FRIEDLANDER, 2002; HODGE;
FRANGAKIS, 2004; McGOVERN, 2007).
Na reviso da literatura foram citados os critrios apresentados nas
principais iniciativas de preservao digital na ltima dcada. Ao considerar os
tpicos tratados como reveladores dos critrios bsicos de um sistema de gesto de
preservao digital da informao tcnico-cientfica e de sua possvel adequao ou
no realidade brasileira, nossa pesquisa assumiu os seguintes pressupostos:
1) compreenso da gesto dos documentos digitais como um contnuo
integrado de processos que envolvem todo seu ciclo de vida
documental;
2) existncia de graus de completeza/completude dos sistemas
organizacionais de gesto da preservao digital;
3) possibilidades de adequao dos critrios para a preservao digital;
4) percepo da necessidade de preservao digital como determinante
nos critrios que definem o sistema de gesto de preservao digital a
ser adotado.
No caso especfico dos problemas relacionados com a contextualizao
da realidade da preservao digital no Brasil e a formulao de critrios ainda no
explorados, a pesquisa aponta para a unificao de abordagens qualitativas e
quantitativas. Seguindo a proposta de Silverman (2000) sobre a caracterizao dos


195
mtodos de pesquisa, as tcnicas utilizadas nos projetos com metodologias
quantitativas podem ter apoio dos mtodos qualitativos.
Neste trabalho foram utilizadas as duas abordagens, na tentativa de
explorar dados bibliogrficos e das percepes dos atores envolvidos com a
preservao digital de informao cientfica no Brasil. Esta deciso foi adotada por
se tratar de uma rea que no tem constitudo objeto de estudo no pas e por no
haver sido produzido conhecimento anterior. Como parte de primeiro
reconhecimento do objeto de estudo, partimos para o encontro das percepes dos
membros da comunidade investigada que detinham algum conhecimento sobre o
tema, para desse modo, instrumentalizar uma posterior abordagem alternativa.
A pesquisa elaborada adotou como tema norteador a identificao dos
critrios categorizados como indicadores de preservao digital da informao
cientfica e tecnolgica, representados na literatura cientfica especializada, e como
esses critrios so contemplados nas unidades de pesquisa do Ministrio da Cincia
e Tecnologia do Brasil.
Seguindo a tipologia da pesquisa cientfica de Abramo (1979), este
trabalho sustenta-se na caracterizao de uma pesquisa interdisciplinar, porque
envolve vrios setores do conhecimento, que usa como tcnicas a entrevista e a
observao direta (LAKATOS & MARCONI, 1991) e no nvel da interpretao dos
dados, como uma pesquisa exploratria e descritiva. A estratgia metodolgica
adotada compreendeu quatro etapas distintas:
1) levantamento e anlise bibliomtrica da produo cientfica sobre
preservao digital de informao cientfica e tecnolgica em artigos,
teses, dissertaes e livros no perodo de 1996 a 2007;
2) contextualizao da realidade da preservao digital nas unidades de
pesquisa do Ministrio da Cincia e Tecnologia, resultado de
levantamentos, observao de prticas e anlises de documentos
dessas instituies;
3) realizao de uma anlise etnogrfica de contedo publicado sobre a
preservao digital no Brasil. Coleta de documentos, palestras, cursos,
artigos e publicaes, observando os padres emergentes, os temas,
nfases e processos mais freqentemente citados;
4) estruturao de um conjunto de critrios de preservao digital da
informao tcnico-cientfica.


196

Foram consideradas como material relevante as informaes sobre
padres e prticas de preservao digital de projetos que no estavam relacionados
com a preservao de informao cientfica e tecnolgica, no intuito de identificar o
estado-da-arte da pesquisa sobre o tema. A investigao pretendeu levantar as
questes mais significativas para os envolvidos no processo de preservao digital
estudando-as como experincias reais e com significados construdos socialmente.
Os documentos tcnicos selecionados nos contextos pesquisados foram entendidos
como representaes das percepes sobre a preservao digital dentro do
processo analtico de contedo.


3.1 PROBLEMA INVESTIGADO


A pesquisa pretendeu responder seguinte indagao: quais critrios de
preservao digital, usados na construo sistemas de gesto da informao
cientfica e tecnolgica reconhecidos internacionalmente, podem ser adotados pelas
instituies de pesquisa do Ministrio da Cincia e Tecnologia do Brasil?
As respostas a essa questo oferecero um conjunto de critrios de
preservao digital apropriados para subsidiar futuras iniciativas relacionadas
manuteno e controle de acervos digitais relevantes para o desenvolvimento
cientfico e tecnolgico do pas, assim como conhecimento sobre a necessidade de
critrios de preservao digital no contexto do gerenciamento da informao
cientfica e tecnolgica.


3.2 Universo de pesquisa e amostra


No Brasil, a pesquisa cientfica apoiada pelo governo nasceu na dcada
de 1930, como produto de uma reforma administrativa realizada durante a ditadura
Vargas. J nos anos 1950 foi criado o Conselho Nacional de Pesquisa (CNPq
atualmente Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico) como


197
resposta s ameaas do uso da energia nuclear e necessidade da segurana
nacional do Estado. As demandas das universidades e centros de pesquisa por mais
recursos na dcada de 1960 promoveram a criao de instituies de fomento como
a Finep, para diminuir a burocracia no repasse dos recursos pblicos para o
desenvolvimento cientfico e tecnolgico (DIAS, 2002).
A partir dos anos 1970 se consolida a formao da infra-estrutura
governamental de pesquisa, com a criao de diversos centros de excelncia na
pesquisa cientfica, a atividade cientfica toma uma posio hegemnica na vida
intelectual do pas, e a criao do MCT conferia, sem dvida, um status poltico
atividade (BURGOS, 1999).
At o ano de 2000, as unidades de pesquisa do MCT encontravam-se
distribudas em trs grandes grupos: quatro subordinadas diretamente ao Ministrio;
dez, ao CNPq; e cinco Comisso Nacional de Energia Nuclear CNEN, do extinto
Ministrio Extraordinrio de Projetos Especiais.
Em julho de 2008, a estrutura organizacional do Ministrio da Cincia e
Tecnologia estava dividida em quatro categorias de instituies, unidades de
pesquisa, organizaes sociais, entidades vinculadas e empresas estatais, cada
uma com suas caractersticas organizacionais:
a) unidades de pesquisa do MCT: executam programas e projetos
visando ao fortalecimento da pesquisa cientfica e tecnolgica
brasileira. Essas atividades so acompanhadas pela Subsecretaria de
Coordenao das Unidades de Pesquisa;
b) organizaes sociais: representam instituies que abrangem
laboratrios ou institutos especiais, com os quais o MCT mantm
Contratos de Gesto. As atividades das organizaes sociais so
promovidas, supervisionadas e avaliadas pela Subsecretaria de
Coordenao das Unidades de Pesquisa, para cumprir a lei que
outorga essa funo ao MCT (Lei n 9.637 de 15 de maio de 1998);
c) entidades vinculadas: esto subdivididas em autarquias, fundaes e
empresas pblicas;
d) empresas estatais.
Cronologicamente, as unidades de pesquisa tm origem variada, mas a
integrao da maioria delas ao Ministrio aconteceu na ltima dcada do sculo XX.
Essa integrao foi realizada por decreto oficial, algumas como autarquias federais,


198
mas a caracterizao de todas elas dentro do Ministrio mudou em diferentes
pocas, at chegar ao estado atual (Quadro 8).

Categoria Instituio Localizao Fundao












UNIDADES DE
PESQUISA








Instituto Nacional de Pesquisas Espaciais
(Inpe)
Laboratrio Nacional de Astrofsica (LNA)
Observatrio Nacional (ON)
Centro Tecnolgico Mineral (Cetem)
Instituto Nacional de Tecnologia (INT)
Centro Brasileiro de Pesquisas Fsicas
(CBPF)
Museu de Astronomia e Cincias Afins
(MAST)
Laboratrio Nacional de Computao
Cientfica (LNCC)
Centro de Pesquisas Renato Archer
(CenPRA)
Instituto Brasileiro de Informao em
Cincia e Tecnologia (Ibict)
Instituto Nacional do Semi-rido (Insa)
Instituto Nacional de Pesquisas da
Amaznia (Inpa)
Museu Paraense Emlio Goeldi (MPEG)
So Jos dos
Campos/SP
Itajub/MG
Rio de Janeiro/RJ
Rio de Janeiro/RJ
Rio de Janeiro/RJ

Rio de Janeiro/RJ

Rio de Janeiro/RJ

Petrpolis/RJ

Campinas/SP

Braslia/DF
Joo Pessoa/PB

Manaus/AM
Belm/PA
1962

1985
1827
1978
1921

1949

1985

1980

1982

1954
2004

1954
1866





ORGANIZAES
SOCIAIS
(Lei n 9.637 de 15 de
maio de 1998)

Associao Brasileira de Tecnologia Luz
Sncroton (LNLS-ABTuS)
Instituto de Desenvolvimento Sustentvel
Mamirau (IDSM)
Associao Instituto Nacional de
Matemtica Pura e Aplicada (Impa)
Associao Rede Nacional de Ensino e
Pesquisa (RNP)
Centro de Gesto e Estudos Estratgicos
(Cgee)

Campinas/SP


Tef/AM

Rio de Janeiro/RJ
Braslia/DF
Rio de Janeiro/RJ

Braslia/DF

1987


1999

1953

1989

2001






ENTIDADES
VINCULADAS
AUTARQUIAS
Agncia Espacial Brasileira (AEB)
Comisso Nacional de Energia Nuclear
(Cnen)
FUNDAO
Conselho Nacional de
Desenvolvimento Cientfico e
Tecnolgico (CNPq)
EMPRESA PBLICA
Financiadora de Estudos e Projetos (Finep)

Braslia/DF

Rio de Janeiro/RJ


Braslia/DF


Rio de Janeiro/RJ

1994

1957


1951


1967
EMPRESAS
ESTATAIS
Indstrias Nucleares do Brasil (INB)
Nuclebrs Equipamentos Pesados (Nuclep)
Rio de Janeiro/RJ
Itagua/RJ
1988
1975
Quadro 8 Classificao das unidades de pesquisa do Ministrio da Cincia e Tecnologia

Cada uma das 24 instituies com as suas peculiaridades em relao ao
tipo de produo cientfica, caractersticas das comunidades cientficas, contexto
histrico e alocao de recursos materiais e humanos apresentada no Apndice E.


199
Para fins desta pesquisa, a populao investigada resumiu-se s unidades
de pesquisa do Ministrio da Cincia e Tecnologia. A amostra foi composta pelos
centros de informao e bibliotecas existentes nessas organizaes. Os
respondentes foram selecionados com base no seu grau de envolvimento com o
gerenciamento dos documentos digitais produzidos nessas instituies, e sua
seleo no foi determinada pelas suas categorias profissionais.
Os setores de informao estudados realizam atividades relacionadas
informao cientfica e tecnolgica em suportes digitais, especificamente, com a
produo cientfica do ministrio que foi transformada para formato digital e daquela
que j nasceu digital.
Segundo os dados coletados no primeiro levantamento sobre os centros
de informao e bibliotecas do MCT, mais tarde confirmados na pesquisa de campo,
h 19 unidades de pesquisa que contam com esse tipo de servio para seus
funcionrios e pblico externo. O Quadro 9 mostra a lista de unidades, o setor de
informao e o total de responsveis por esses servios.





















200
Unidade Setor de Informao Responsvel Total
CBPF Biblioteca Bibliotecria 01
CenPRA Biblioteca/DCOG Bibliotecria 01
Cetem Biblioteca
Bibliotecria e Cientista da
Informao
02
Cgee Ncleo Centro de informaes Cientista da Informao 01
Cnen Centro de Informaes Nucleares Bibliotecria 01
CNPq Biblioteca Lygia Portocarrero Velloso Bibliotecria 01
Finep Servio de Informao Bibliotecrias 02
Ibict Biblioteca Bibliotecria 01
Impa Biblioteca Bibliotecrias 02
Inpa Biblioteca Bibliotecria 01
Inpe Biblioteca Bibliotecrias 02
INT Biblioteca Bibliotecrias 02
LNA Biblioteca Bibliotecria 01
LNCC Biblioteca Bibliotecria 01
LNLS-
ABTLuS
Biblioteca Departamento Cientfico Bibliotecria 01
Mast Biblioteca Bibliotecrias 02
MPEG
Biblioteca Domingos Soares Ferreira
Penna
Bibliotecria 01
ON Biblioteca/DID Bibliotecria 01
RNP Biblioteca/DGI Cientista da Informao 01
Quadro 9 Local de preservao e acesso da informao cientfica em formato digital
produzida nas unidades de pesquisa do MCT

Entre 2004 e 2007, a pesquisa identificou 25 responsveis por acervos
digitais lotados nos centros de informao e bibliotecas. A localizao foi possvel
por intermdio de consultas, realizadas via internet, incluindo-se as pessoas que
tinham endereos eletrnicos disponibilizados nas pginas do MCT (amostragem
no probabilstica). Tambm a indicao das pessoas que teriam algum grau de
comprometimento com a preservao dos acervos em formato digital foi feita pelos
funcionrios, pesquisadores, bibliotecrios, arquivistas e profissionais de informtica
entrevistados durante a visita a esses centros.





201
3.3 INSTRUMENTOS DE COLETA DE DADOS


Vrios autores mencionam que a experincia e comportamentos humanos
no so explicveis por fatores externos, mas podem ser compreendidos por
meio da empatia comunicativa com a viso subjetiva e as razes internas do outro
(MAYRING, 2002). Esse entendimento precisa do emprego de um conjunto de
instrumentos que determinam a forma de abordar os fatos ao longo de um percurso
para alcanar um objetivo preestabelecido.
Para compreender qualitativamente as prticas reais e os mtodos mais
utilizados para preservar a informao tcnico-cientfica em documentos digitais,
aplicaram-se as seguintes tcnicas de pesquisa: estudo bibliomtrico, questionrio,
entrevista, observao de curta durao e anlise etnogrfica de contedo.
O esquema da pesquisa incluiu no primeiro estgio um levantamento
bibliogrfico que se prolongou durante todo o perodo da investigao. Em seguida,
utilozou-se um questionrio para mapeamento da realidade das unidades de
pesquisa do MCT.
Determinada qual seria a amostra do estudo e o local das visitas, partiu-se
para o levantamento de dados coletados diretamente com os responsveis pelos
acervos digitais dessas unidades. Na pesquisa de campo, alm da realizao de
entrevistas e da observao de curta durao, reuniram-se dados documentais
encontrados em arquivos, bancos de dados, relatrios e publicaes oferecidas
pelos prprios entrevistados. As experincias relatadas durante as entrevistas
funcionaram como parmetro para a informao, obtida pelo mtodo da observao.
As informaes foram organizadas cronologicamente e includas na anlise
etnogrfica de contedo.


3.3.1 Estudo bibliomtrico


Aps tratamento bibliomtrico realizado na bibliografia consultada,
identificaram-se os autores e os ttulos de peridicos mais citados, os temas e as
datas de publicao. Esse levantamento incluiu a organizao dos dados em dez
variveis, a saber:


202
- ano;
- rea;
- aspecto discutido;
- autor;
- pas.
- peridico;
- proposta;
- sub-tema;
- tipo de autoria;
- tipo de publicao;
Essas variveis foram submetidas a um tratamento estatstico descritivo
(anlise de freqncia). Pretendeu-se quantificar a produo individual dos principais
autores em diferentes perodos e seu impacto no desenvolvimento da rea.
A continuidade desse estudo fundamentalmente bibliomtrico tornou-se
possvel avaliando a produo cientfica sobre o tema da preservao digital no
Brasil e no exterior, considerando apenas os trabalhos citados reviso da literatura e
nas listas de documentos de projetos e iniciativas da rea publicadas at 2007 (ver
Apndice C)


3.3.2 Questionrios


A tcnica de coleta de dados por meio de questionrio utilizada quando
se pretende atingir um nmero considervel de pessoas. O conjunto de questes
formuladas deve refletir os objetivos do estudo. Para caracterizar as atividades de
preservao digital identificadas nas Unidades de Pesquisa do MCT, durante o
perodo de 2004 a 2007, tornou-se necessrio localizar as informaes oficiais sobre
os acervos digitais nessas instituies. O levantamento incluiu as informaes
oficiais nos sites do Ministrio e o envio por e-mail de um questionrio para os
responsveis pelas informaes disponibilizadas na internet.
Na primeira aproximao, remeteu-se via correio eletrnico, a todos os
responsveis pelas bibliotecas e centros de informao do Ministrio de Cincia e
Tecnologia, questionrio elaborado em colaborao com a Biblioteca de Poltica em


203
Cincia e Tecnologia (BPCT) da Coordenao-Geral de Gesto e Inovao (CGGI)
do prprio Ministrio. O propsito foi conseguir levantar, com questes abertas sobre
fatos (aes) e de opinio (atitudes), dados sobre as atividades relacionadas com a
preservao dos seus acervos em formato eletrnico bem como identificar os
responsveis e as principais atividades relacionadas com acervos digitais. (ver
Apndice A).


3.3.3 Pesquisa de campo


O estabelecimento de relaes constantes entre determinadas condies
pode ser obtido com a pesquisa de campo (RUIZ, 1979). Para Minayo (1992), o
trabalho de campo nas abordagens qualitativas compreende duas tcnicas
fundamentais: a entrevista e a observao. Elas se complementam, aumentando o
controle dos dados nos estudos exploratrios (SELLTIZ et al., 1975).
Na pesquisa de campo foram analisadas as aes do Ministrio da
Cincia e Tecnologia para implementar (desenvolver, efetivar, planejar e utilizar)
sistemas de preservao digital. Com isso, a investigao esteve centrada em
descobrir:
a) os objetivos e caractersticas das aes propostas no contexto do MCT
com fins de preservao digital;
b) as infra-estruturas e recursos adotados no MCT para a construo de
sistemas de preservao digital;
c) como essas infra-estruturas padronizam, armazenam e ajudam a
gerenciar a informao cientfica e tecnolgica a ser preservada
digitalmente.
Na fase aps o primeiro levantamento, procedeu-se a visitar as unidades
de pesquisa e a entrevistar os responsveis previamente identificados. Os registros
obtidos ajudaram a formar o conjunto de dados oficiais sobre as colees eletrnicas
institucionais.
Conforme a viabilidade de deslocamento do pesquisador para algumas
localidades (Belm, Petrpolis, Rio de Janeiro, Campinas, So Jos dos Campos e
Itajub), observaram-se as experincias de preservao digital em andamento,


204
registrando a natureza das necessidades de preservao digital expressas nas
restries situacionais de cada uma das unidades examinadas.
A realizao da pesquisa de campo compreendeu a observao direta de
curta durao (um a trs dias) para coleta de dados complementares acerca da
realidade das prticas e necessidades de preservao digital nas unidades de
pesquisa. Foram coletados dados das opinies dos atores identificados,
examinando-se as percepes dos envolvidos sobre as necessidades e as prticas
de preservao digital, descobrindo-se temas decorrentes, padres emergentes e
processos enfatizados e adotados.


3.3.4 Entrevistas


A apropriao de um mtodo qualitativo para a compreenso das
percepes dos envolvidos nas atividades de preservao digital contemplou a
necessidade de entrevistas, como verificao e registro das narrativas histricas das
memrias das fontes interessadas.
Descombe observa que a entrevista representa uma espcie de
conversao elaborada de maneira sistmica:
As entrevistas so uma proposta atrativa para os pesquisadores que
realizam algum projeto. Aparentemente, no envolvem muita parafernlia
tcnica na coleta da informao talvez um caderno e um gravador porttil
e a tcnica bsica depende da habilidade que os pesquisadores j tm
para conduzir uma conversa. No necessrio contar com ferramentas
complexas ou passar tempo aprendendo novas habilidades: esta uma
receita particularmente tentadora. (DESCOMBE, 2003, p. 163).

Na fase exploratria, estabeleceram-se conversas orientadas com alguns
dos responsveis identificados pelas pessoas que responderam aos questionrios
enviados. O propsito era recolher informaes mais precisas sobre as pessoas que
realmente tinham algum grau de comprometimento com a preservao dos acervos
em formato digital dessas instituies.
Durante a 56. Reunio Anual da SBPC, celebrada na cidade de Cuiab,
Mato Grosso, em julho de 2004, realizaram-se as primeiras entrevistas semi-
estruturadas (Apndice B) com alguns dos responsveis pelos centros de
informao, bibliotecas e arquivos das unidades de pesquisa do MCT. Tal atividade


205
dependeu da disponibilidade dos respondentes durante o evento. Os dados obtidos
permitiram identificar os responsveis pelas prticas de preservao digital
existentes, os materiais e formatos mais freqentemente usados, alm de captar
opinies sobre as necessidades de preservao digital nas unidades de pesquisa.
Em seguida ao primeiro contato, fizeram-se visitas s unidades de
pesquisa, aplicando-se entrevistas presenciais semi-estruturadas, registradas em fita
magntica como recurso especial para coleta de dados, posteriormente transcritas
de forma precisa para entender como a interao foi estabelecida (SILVERMAN,
2000).
Durante a fase de pesquisa de campo, utilizou-se o mesmo roteiro de
entrevista em profundidade (FINK; KOSECOFF, 1985) usado com o primeiro grupo
de respondentes, orientado para obter informaes relacionadas com as atividades
de preservao dos acervos digitais.
As perguntas foram divididas em trs grupos. O primeiro relacionava a
formao profissional e as caractersticas das tarefas realizadas pelos entrevistados,
a saber:
a) profisso;
b) titulao mxima;
c) tempo de servio;
d) cargo ocupado atualmente;
e) tempo no cargo atual.
No segundo grupo, as questes dirigiam-se para a descrio das
atividades desenvolvidas pelos respondentes que envolvem algum tipo de
tratamento tcnico nos arquivos digitais da instituio:
a) Quais atividades cientficas so realizadas pela sua instituio?
b) Que tipo de produo cientfica j est em formato digital?
c) Quem so os usurios dessa produo cientfica?
d) Quais atividades de preservao de documentos digitais esto
sendo realizadas pela sua instituio?
O terceiro grupo de perguntas permitiu a coleta de opinies sobre o
material a ser preservado e seus responsveis:
e) Qual produo cientfica deve ser preservada pela sua instituio?
f) Quem so os responsveis por essas atividades de preservao?


206
Com elas, pretendeu-se detectar variveis que no haviam sido
contempladas no quadro conceitual preestabelecido pelo pesquisador, relacionadas
s expectativas dos responsveis pelas colees no que se refere ao que deve ser
feito para preservar seus documentos digitais.
Foram entrevistadas 86 pessoas entre aquelas identificadas no primeiro
levantamento para o envio do questionrio e as detectadas nas falas dos prprios
respondentes durante a aplicao do primeiro grupo de entrevistas. No Quadro 10
visualiza-se a listagem completa de profissionais e pesquisadores contatados
durante a pesquisa de campo.

Unidade Setor Cargo/Funo N
o
Entrevistas

AEB
Arquivo
Informtica
Comunicao
Diretoria
Tcnico
Tcnico
Tcnico
Pesquisador
1
1
2
1

CBPF
Biblioteca
Informtica
Comunicao
Bibliotecria
Tcnico
Tcnico
2
2
1
Ceitec Comunicao Pesquisador 1

CenPRA
Biblioteca
Biblioteca
Laboratrio
Comunicao
Bibliotecria
Pesquisador
Pesquisador
Tcnico
1
1
1
1

Cetem
Biblioteca
Informtica
Comunicao
Comunicao
Bibliotecria
Cientista da Informao
Pesquisador
Tcnico
1
1
1
1

Cgee
Centro de Inf.
Centro de Inf.
Informtica
Comunicao
Cientista da informao
Tcnico de informao
Tcnico de informtica
Tcnico
1
2
1
1

Cnen
Biblioteca
Centro de Informao
Comunicao
Bibliotecria
Pesquisador
Tcnico
1
1
1

CNPq
Biblioteca
Centro da Memria
Comunicao
Bibliotecria
Pesquisador
Tcnico
1
1
1

Finep
Biblioteca
Informtica
Comunicao
Bibliotecrias
Tcnico
Tcnico
2
1
1

Ibict
Biblioteca
Informtica
Comunicao
Bibliotecria
Tcnico
Tcnico
1
1
1
IDSM
Servio de Inf.
Comunicao
Tcnico de Informao
Tcnico
1
2
Impa
Biblioteca
Comunicao
Bibliotecria
Tcnico
2
2
Inpa
Biblioteca
Comunicao
Bibliotecria
Tcnico
1
2

Inpe
Biblioteca
Depto. Cientfico
Comunicao
Bibliotecria
Pesquisador
Pesquisador
3
1
1


Continua


207

Unidade Setor Cargo/Funo N
o
Entrevistas
Insa
Comunicao
Diretoria
Tcnico
Pesquisador
1
1

INT
Biblioteca
Informtica
Comunicao
Bibliotecrias
Tcnico de informtica
Tcnico
2
1
1


LNA
Biblioteca
Biblioteca
Informtica
Depto. Cientfico
Comunicao
Bibliotecria
Tcnico de informao
Pesquisador
Pesquisador
Tcnico
1
1
1
1
1

LNCC
Biblioteca
Informtica
Comunicao
Bibliotecria
Tcnico
Tcnico
1
1
1
LNLS-
ABTLuS
Biblioteca
Depto. Cientfico
Comunicao
Bibliotecria
Pesquisador
Tcnico
1
1
1

Mast
Biblioteca
Informtica
Comunicao
Arquivo
Bibliotecrias
Tcnico
Pesquisador
Tcnico
2
1
1
2
Mpeg
Biblioteca
Editorao
Bibliotecria
Tcnico
1
1

Nuclep
Comunicao
Comunicao
Informtica
Pesquisadora
Tcnico
Tcnico
1
1
1
ON
Biblioteca/DID
Comunicao
Bibliotecria
Tcnico
1
1

RNP
Biblioteca/DGI
Informtica
Comunicao
Cientista da Informao
Tcnico
Tcnico
1
2
1
Quadro 10 Listagem de respondentes das unidades de pesquisa do MCT entrevistados na
fase exploratria e de pesquisa de campo

Os respondentes foram caracterizados como representantes de setores-
chave das instituies procuradas, a saber: centro de informao, biblioteca,
arquivo, informtica, direo e departamentos de pesquisa. O critrio de seleo
desses respondentes decorreu de serem atores com algum grau de envolvimento
formal na manuteno dos acervos digitais da instituio e cujas opinies servissem
para examinar as percepes sobre o tema e processos adotados.
Os dados obtidos com os entrevistados permitiram estabelecer um tipo de
padro no quesito necessidade de prticas de preservao digital no detectado nos
questionrios, e a definio de novos nveis de aprofundamento a serem alcanados
por meio da observao e a anlise etnogrfica de contedo. O instrumento de
coleta utilizado nas entrevistas est no Apndice B.




208
3.3.5 Observao de curta durao


A coleta de dados por meio da observao oferece ao pesquisador a
oportunidade de obter informao no apenas sobre o que os entrevistados
asseguram que fazem ou pensam, mas de uma forma direta diante da realidade dos
eventos descritos (DESCOMBE, 2003).
Para Mayring (2002), as dimenses da observao devem ser
determinadas e concretizadas na construo de um guia de observao, estruturado
segundo a formalizao do contato estabelecido com os representantes do campo
observado. Este plano de procedimento formulado por Mayring constante e
formalizado no que ele chama de protocolos de observao, que registram as aes
empreendidas pelo pesquisador, at o momento da avaliao final dos dados
coletados (Quadro 11).



Determinao das dimenses de observao
Construo do guia de observao



Estabelecimento do contato com o
campo de observao



Ao no campo
Observao participante



Anotaes no campo
Protocolos de observao



Avaliao final


Quadro 11 - Plano de procedimento de observao
Fonte: Mayring (2002, p. 132)

Para obter-se um diagnstico sobre a situao da preservao digital no
MCT, como complemento tcnica de entrevista, empregou-se o registro dos
padres de comportamento das pessoas por meio da observao direta de curta
durao no participante (AAKER; KUMAR; DAY, 2004; GWATNEY, 2001). O
objetivo foi levantar indcios relevantes sobre as prticas reais de preservao


209
digital, a fim de controlar o registro sistemtico das aes executadas no tratamento
dos documentos digitais e a caracterizao das estratgias adotadas.
O critrio considerado para a utilizao desta tcnica de observao foi o
fato de ela no ser disruptiva e permitir a obteno dos dados de forma semi-direta,
segundo o comportamento dos sujeitos. Dessa forma, conseguiu-se obter uma
imagem das prticas dos responsveis pelos acervos digitais em determinado lugar,
contexto e tempo, dependendo de uma sucesso de eventos.



210
4 ANLISE DOS DADOS


A organizao dos dados foi resultado de um ciclo repetido de interaes
com as fontes bibliogrficas e com os respondentes. A primeira foi determinada por
dois objetivos especficos da pesquisa, que visavam caracterizar as prticas de
preservao digital e resgatar os conceitos e aplicaes usadas nas experincias
nacionais e estrangeiras.
As interaes com os respondentes por meio das entrevistas, a
observao de curta durao buscaram identificar as necessidades de preservao
digital da informao tcnico-cientfica das unidades de pesquisa do MCT, assim
como conduzir o estudo para uma abordagem mais qualitativa do tema, a aplicao
da tcnica de anlise etnogrfica de contedo. Dessa forma, foi possvel
desenvolver os critrios de preservao digital, propostos a partir de padres
encontrados nos dados coletados.
Segundo Pereira (2001, p. 67) [...] a mensurao qualitativa uma
medida derivada, que no se realiza diretamente sobre o fenmeno de interesse,
mas sobre as manifestaes desse fenmeno [...]. Com as trs tcnicas usadas
procurou-se classificar individualmente os respondentes pelas suas funes e
grupos de profissionais e descrever o conjunto de observaes realizadas nos locais
visitados.
As estratgias de anlise mostraram como o esforo para sintetizar as
informaes coletadas precisou reduzir a dimensionalidade do fenmeno com fins
de produzir conhecimento sobre o tema.


4.1. ANLISE BIBLIOMTRICA


O interesse na criao de indicadores bibliomtricos sobre a produo
cientfica vem acompanhando o crescimento da literatura publicada. No incio do
sculo XX apareceram as primeiras aplicaes de mtodos estatsticos anlise da
literatura de reas do conhecimento cientfico. Como uma nova prtica estatstica, e
sem ser denominada ainda bibliometria, os resultados obtidos nos primeiros estudos
proporcionaram um mtodo de anlise da prtica cientfica (ALVARADO, 2007).


211
Um dos primeiros tericos a definir o termo bibliometria, foi Pritchard como
a [...] aplicao de modelos matemticos e estatsticos aos livros e a outros meios
de comunicao escrita [...] (PRITCHARD, 1969, p. 25). A tcnica tem sido utilizada
para identificar algumas caractersticas das publicaes cientficas, a produtividade,
os paradigmas e as relaes entre disciplinas cientficas (BROOKES, 1973;
IKPAAHINDI, 1985; POTTER, 2002).
Para Narin (1976), a bibliometria pode ser dividida em descritiva e
avaliativa. A bibliometria avaliativa estaria dedicada a analisar os aspectos
qualitativos da produo cientfica atravs da anlise de citaes e publicaes. J a
bibliometria descritiva estuda as caractersticas especficas de distribuio
geogrfica, evoluo temporal, entre outras. Narin tambm afirma que a contagem
de artigos proporciona indicadores vlidos da produo cientfica e o do
desenvolvimento de temas relacionados e das instituies de origem.
Para fins desta pesquisa, a necessidade de entrevistas, narrativas
histricas e memrias de fontes interessadas contemplou tambm, a apropriao de
um mtodo quantitativo para a compreenso das percepes dos envolvidos nas
atividades de preservao digital. Os ndices estatsticos utilizados serviram para
observar o fenmeno da produo cientfica sobre preservao digital na variedade
dos assuntos e na regularidade dos temas mais freqentemente abordados.
A anlise bibliomtrica foi usada na identificao de ligaes entre
documentos e no mapeamento da literatura da rea, fornecendo informaes sobre
o desenvolvimento de campos especficos e subsdios para formas de interpretao
no contexto da realidade de instituies de pesquisa no Brasil.


4.1.1 Bibliometria descritiva da preservao digital


Para poder conhecer as abordagens tericas e prticas que tm sido
publicadas na ltima dcada, foi realizado um estudo bibliomtrico descritivo,
coletando dados de referncias bibliogrficas sobre o tema da preservao digital do
perodo de 1996 at 2007. Na reviso da literatura foi constatada a ausncia de um
controle da produo bibliogrfica sobre o tema na forma de bases de dados ou da


212
publicao de bibliografias da rea. Existe apenas listagem de textos relevantes em
sites de iniciativas e projetos de instituies nacionais e estrangeiras.
No perodo que compreendeu a elaborao desta pesquisa, a tcnica de
coleta adotada foi o acompanhamento nos ltimos cinco anos das pginas de
iniciativas e projetos de preservao digital onde so publicadas listagens e
documentao relacionada ao assunto (ver Apndice C). Cronologicamente, as
referncias foram selecionadas por serem bastante ilustrativas em relao ao
desenvolvimento de alguns temas de interesse da rea.
Tendo como foco a evoluo temtica da preservao digital como
assunto de documentos publicados de 1996 a 2007, foram analisados 319 trabalhos
apresentando os aspectos mais relevantes citados nessa produo, seus autores,
tipo de autoria, tipo de documentos, origens e propostas. Tambm foi includa a
produo nacional nesse perodo registrada em artigos de peridicos, captulos de
livros, teses e dissertaes.
Os trabalhos apresentados nos eventos da rea no foram includos nesta
anlise devido a que muitos desses sites no permitiam o acesso aos documentos
ou o texto integral no constava na relao de trabalhos apresentados nas pginas
oficiais.
Pretendeu-se, com esta anlise, responder s seguintes questes que
envolvem o problema desta pesquisa:
1. Quais so os interesses dos autores em relao aos subtemas
relacionados com a preservao digital?
2. Como se desenvolveram os principais subtemas relacionados com a
preservao digital?
3. Quais foram as principais propostas e aspectos da preservao digital
debatidos?
4. Qual o tipo de documento que est sendo publicado?
5. De qual rea do conhecimento eram as publicaes que abordaram o
tema da preservao digital?
6. Que peridicos cientficos veicularam artigos sobre preservao
digital?
As respostas a estas questes proporcionaram uma viso do assunto no
contexto internacional e nacional. O tratamento bibliomtrico realizado na bibliografia
reunida tinha como objetivos:


213
a) identificar os autores e os tipos de documentos mais usados, os sub-
temas, propostas, aspectos discutidos no perodo de 1996-2007;
b) conhecer a produtividade dos autores e o tipo de autoria;
c) identificar as reas do conhecimento que mais publicaram sobre o
tema.
A compilao das referncias bibliogrficas sobre o tema preservao
digital permitiu insero de dados dessas variveis no programa estatstico SPSS.
Com a aplicao da ferramenta SPSS Statistical Package for the Social Sciences
foi possvel obter dados bibliomtricos que permitiram a contextualizao da
produo cientfica da rea nos anos 1996-2007. O levantamento incluiu a
organizao dos dados em dez variveis, a saber:
1. autores: foram includos os nomes de autores e co-autores da
bibliografia consultada;
2. autoria: os documentos foram registrados segundo o tipo (nica e
mltipla) e a ordem de autoria dos trabalhos;
3. rea: no levantamento bibliogrfico foram identificadas cinco reas do
conhecimento de onde partiram as publicaes de trabalhos sobre o
assunto (cincia da informao, arquivologia, biblioteconomia, cincia
da computao e histria);
4. subtema: foram definidos quatro subtemas segundo a abordagem geral
dos trabalhos em relao ao tema principal e o enfoque que os autores
destacaram (percepes, gerenciamento, estratgias e certificao);
5. proposta: esta varivel se referiu ao assunto especfico exposto e
descrito de forma mais aprofundada pelos autores nos seus textos,
sendo identificados 12 tipos de propostas;
6. aspecto: esta varivel foi criada para identificar dentro dos subtemas os
tpicos discutidos com maior freqncia nos trabalhos publicados,
foram 14 questes discutidas resgatadas na anlise dos documentos;
7. tipo de publicao: foram identificadas no levantamento 9 tipos de
publicaes (artigo; livro; tese; dissertao; relatrio; captulo de livro;
texto online; norma, declarao); o tipo de documento trabalho em
evento cientfico no foi includo por causa da dificuldade de acessar
os contedos da maioria dos trabalhos apresentados nos ltimos anos;


214
8. peridico: este item foi destacado por se tratar da forma de publicao
mais usada pelos autores da rea para divulgar seus trabalhos; foram
identificados 68 ttulos (Tabela 8);
9. pas: esta varivel serviu para identificar a origem das publicaes e
sua predominncia geopoltica (15 pases);
10. ano: foi utilizada para contextualizar temporalmente a produo em
preservao digital.
Essas variveis foram submetidas a um tratamento estatstico descritivo
(anlise de freqncia) no qual foram cruzados os seguintes fatores:
- subtema versus autores;
- subtema versus autoria;
- subtema versus pas
- subtema versus ano;
- proposta versus aspecto discutido;
- ano versus tipo de publicao;
- rea versus tipo de publicao;
- pas versus tipo de publicao;
- ano versus peridico.


4.1.2 Avaliao da produtividade


Quantificou-se a produo individual dos principais autores em diferentes
perodos e seu impacto no desenvolvimento da rea. A seguir apresentam-se as
anlises dos resultados seguindo as sete questes formuladas.

Qual o interesse dos autores em relao aos subtemas relacionados com a
preservao digital?

Os autores produziram documentos sobre quatro subtemas: Percepo,
Gerenciamento, Estratgias e Certificao. A mdia de produes por autor
bastante baixa (Mdia = 1,29, DP = 0,79). A maioria dos autores (83,1%) teve
apenas uma produo; 10,5% dos autores produziram dois documentos cada e 4%
dos autores produziram trs documentos cada. Um autor produziu quatro


215
documentos (H. M. Gladney), quatro autores produziram cinco documentos cada (K.
Thomaz, M. Day, NLA, OCLC/RLG) e um autor produziu sete documentos (N.
Beagrie).
A Tabela 1 apresenta a distribuio de autores em funo dos subtemas
relacionados preservao digital. Conforme pode ser verificado, a maioria dos
autores (67,1%) produziu documentos sobre Gerenciamento e Estratgias refletindo,
desta maneira, maior porcentagem de publicaes nestes temas (68,7%). A tabela
tambm aponta uma distribuio semelhante do nmero de pases envolvidos
nestas publicaes.

Tabela 1 Produo dos autores em funo dos subtemas de interesse
Subtema
N
o
.
autores
%
N
o
.
pases
%
N
o
.
publicaes
%
Certificao 35 12,4 7 20,0 38 11,9
Estratgias 89 31,4 9 25,7 104 32,6
Gerenciamento 101 35,7 8 22,9 115 36,1
Percepo 58 20,5 11 31,4 62 19,4
TOTAL 283 100 35 100 319 100


Conforme pode ser verificado na Figura 21, dos 16 pases envolvidos na
produo de documentos, apenas seis pases produzem documentos em todos
subtemas relacionados preservao digital, a saber: Estados Unidos, Inglaterra,
Brasil, Austrlia, Alemanha e Holanda. Notadamente, os pases que mais
produziram documentos foram os Estados Unidos e a Inglaterra, sendo suas
produes equivalentes a 56% e 22%, respectivamente, do total de publicaes.




216


Figura 21 Subtemas e locais das publicaes


Como se desenvolveram os principais sub-temas relacionados com a
preservao digital?

A Tabela 2 apresenta a distribuio de freqncia absoluta (fa
p
) de
trabalhos publicados em cada um dos subtemas e o tipo de autoria nas respectivas
categorias.

Tabela 2 Freqncia de publicaes e autoria em funo do subtema
Subtema fa
p
%
Autoria
nica
%
Autoria
mltipla
%
Certificao 38 11,9 29 12 9 11,7
Estratgias 105 33,0 77 32,0 28 36,4
Gerenciamento 116 36,5 90 37,3 26 33,8
Percepo 60 18,9 46 19,1 14 18,2
TOTAL 319 100 241 100 77 100


A Tabela 2 evidencia que a maioria dos trabalhos publicados tratou dos
subtemas Estratgias e Gerenciamento, perfazendo um total de 69,5%. Poucos
trabalhos se dirigiram a questes relacionadas Certificao. Destaca-se que 75,8%
do total de publicaes (i.e., 241 trabalhos) corresponderam autoria nica, contra
24,2% (i.e., 77 trabalhos) de trabalhos publicados por mais de um autor.
Uma explicao do baixo ndice de trabalhos que tratavam os assuntos
relacionados com a certificao est no fato de que os resultados dos testes de


217
aplicao de indicadores de auditoria propostos nos atuais modelos de referncia
(Repository Audit and Certification - RAC, Model Requirements for Electronic
Records Management - MoReq2 e o Catalogue of Criteria for Truested Digital
Repositories) encontram-se em avaliao e reviso (CRL; 2007; KACZMARECK et
al., 2006; NESTOR, 2006).
Com relao predominncia da autoria nica, pode-se afirmar que
motivada pela rpida publicao de resultados de pesquisas individuais, que
regularmente demoram menos tempo em serem concludas do que as que contm
resultados de grandes projetos e inciativas implementadas.
A Figura 22 apresenta a tendncia de contribuio de cada subtema
durante o perodo de tempo analisado.



Figura 22 Contribuio dos subtemas no perodo 1996 a 2007

A Figura 22 evidencia o aumento da contribuio da maioria dos subtemas
a partir de 1997, excetuando o subtema Percepo, cuja contribuio permaneceu
relativamente estvel. Destaca-se que a participao de Gerenciamento e
Certificao foi muito similar ao longo de todo o perodo, sendo que, nos anos de
2000 e 2003, houve aumento significativo de publicaes nestas reas. Isto pode
estar relacionado ao fato de que, para essa poca j haviam projetos estveis em
diversos pases e que a pesquisa comeou a enfocar o desenvolvimento de
ferramentas e repositrios confiveis (McGOVERN, 2007).


218
A tendncia de contribuio do tipo de autoria pode ser vista na Figura 23,
onde se observa aumento crescente no nmero de autorias nicas durante o
perodo 1996-2007, sendo que, nos anos de 2000 e 2003, registrou-se nmero
expressivo de trabalhos individuais. A freqncia de trabalhos publicados por mais
de um autor aumentou modestamente em 1998, e tendeu a se estabilizar at 2004,
quando pode ser verificado pequeno aumento deste tipo de autoria, que retornou
aos nveis anteriores no ano de 2007.




Figura 23 Freqncia do tipo de autoria em funo do ano de publicao

Quais foram as principais propostas e aspectos relacionados com a
preservao digital debatidos?

Foram identificados 12 tipos de propostas no perodo analisado. Estas
propostas esto relacionadas na Tabela 3. A categoria recomendao foi o tipo
mais sugerido pelos pesquisadores (55,3%), seguido de projetos (15,6%). As dez
categorias restantes corresponderam a 29,1% do total de propostas registradas,
sendo curso e catlogo os tipos menos sugeridos pelos autores.








219
Tabela 3 - Tipos de propostas para preservao digital
Tipo freqncia %
recomendao 163 55,3
projeto 46 15,6
modelo 20 6,8
software 16 5,4
poltica 13 4,4
colaborao 12 4,1
manual 8 2,7
guia 6 2,0
tutorial 4 1,4
dicionrio 4 1,4
curso 2 0,7
catlogo 1 0,3
TOTAL 295 100


Uma anlise temporal da ocorrncia de propostas, observada na Figura
24, mostra que foram apresentadas recomendaes ao longo de todo o intervalo
1996 a 2007, e que o nmero de recomendaes tendeu a aumentar a partir de
1997. Em 2000 e 2003 o nmero de recomendaes foi superior aos demais anos
do intervalo temporal considerado. Em segundo lugar se destacaram os projetos
apresentados a partir de 1998, tendo ocorrido aumento significativo nos anos de
2000, 2003 e 2006.



Figura 24 Tipos de propostas apresentadas no perodo 1996 a 2007




220
Durante grande parte do perodo analisado tambm foram registradas
propostas de manuais, software, polticas e colaboraes. As propostas menos
presentes ao longo do perodo foram tutoriais, cursos, dicionrios e catlogos.
Uma anlise qualitativa foi realizada para avaliar quais foram as questes
debatidas no contexto das propostas apresentadas. Quatorze questes foram
identificadas e podem ser vistas na Tabela 4, a seguir, que inclui a freqncia
absoluta de ocorrncia e a respectiva porcentagem de cada questo. Seis tipos de
questes dominaram as propostas e juntas perfizeram 71% do total de questes:
iniciativa, sistemas e ferramentas de arquivamento, colees e recursos digitais,
instituies e atributos e requisitos.

Tabela 4 - Questes debatidas no perodo 1996-2007
Questes debatidas freqncia %
iniciativa 14,1 13,9
sistemas e ferramentas de arquivamento 12,2 12,0
colees e recursos digitais 11,9 11,7
objetos e informao digital 11,3 11,4
instituies 10,7 10,8
atributos e requisitos 10,7 10,8
metadados 6,9 7,0
publicaes eletrnicas 6,3 6,3
padres 6,0 6,0
custos 2,5 2,5
legislao 2,2 2,2
migrao 1,9 1,9
acesso 1,9 1,9
emulao 1,6 1,6
Total 100 319


O Quadro 12, a seguir, retrata a presena de cada uma das questes
debatidas no contexto das propostas ao longo do perodo 1996-2007. Nesta figura,
as clulas preenchidas em cor cinza indicam que a questo foi debatida no
respectivo ano. Conforme ilustra esse Quatro, nove questes estiveram presentes
ao longo de praticamente todo o perodo focalizado: colees e recursos digitais,
objetos e informao digital, instituies, iniciativa, sistemas e ferramentas de
arquivamento, atributos e requisitos, publicaes eletrnicas, padres e metadados.
Dentre estas, registrou-se que questes relacionadas s colees e recursos
digitais, bem como objetos e informao digital foram as mais presentes no contexto


221
das propostas ao longo dos ltimos 11 anos. Em contrapartida, observa-se que no
estiveram muito presentes nas propostas discusses sobre questes relacionadas
ao acesso, migrao, legislao, emulao e custos durante o mesmo perodo.

Ano
Questes Debatidas
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
acesso
atributos e requisitos
colees e recursos digitais
custos
emulao
iniciativa
instituies
legislao
metadados
migrao
objetos e informao digital
padres
publicaes eletrnicas
sistemas e ferramentas de arquivamento
Quadro 12 - Questes debatidas em cada ano do perodo

Por fim, a Tabela 5 traz a porcentagem de ocorrncia de cada questo
debatida no contexto de cada proposta apresentada no intervalo 1996-2007. A
tabela mostra como o nmero de ocorrncias de recomendaes sobre todas as
questes identificadas foi maior. Uma caracterstica comum desses trabalhos esteve
na forma como eles cobriam toda a variedade de assuntos relacionados ao tema e,
a necessidade de apresentar descries bsicas sobre o gerenciamento dos objetos
digitais.









222

Tabela 5 - Propostas e Questes Debatidas ao longo do perodo 1996-2007
Propostas (%)
Questes Debatidas
Rec Pro Mod SW Pol Col Man G Tut Dic Cur Cat
iniciativa
6,46 3,74 0,00 0,00 0,68 1,70 0,00 0,00 0,34 0,00 0,34 0,00
colees e recursos digitais
8,50 0,68 0,00 0,34 0,68 0,34 1,02 0,00 0,34 0,00 0,00 0,00
objetos e informao digital
9,52 0,00 0,34 0,68 0,00 0,00 0,00 0,34 0,34 0,00 0,00 0,00
instituies
6,46 2,38 0,68 0,00 0,68 0,68 0,00 0,00 0,00 0,00 0,34 0,00
atributos e requisitos
6,46 0,34 2,04 0,00 1,70 0,00 0,34 0,34 0,00 0,00 0,00 0,34
metadados
1,70 1,02 1,36 0,00 0,34 0,00 0,34 0,34 0,34 0,68 0,00 0,00
publicaes eletrnicas
3,40 3,06 0,00 0,00 0,00 0,34 0,00 0,00 0,00 0,00 0,00 0,00
padres
3,06 0,68 0,34 0,34 0,00 0,00 0,68 0,68 0,00 0,68 0,00 0,00
custos
2,38 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
legislao
1,70 0,34 0,00 0,00 0,34 0,00 0,00 0,00 0,00 0,00 0,00 0,00
migrao
0,68 1,02 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
acesso
1,36 0,00 0,34 0,00 0,00 0,34 0,00 0,00 0,00 0,00 0,00 0,00
emulao
0,34 0,34 0,68 0,00 0,00 0,00 0,00 0,34 0,00 0,00 0,00 0,00
sistemas e ferramentas
3,74 1,70 0,68 4,08 0,00 0,68 0,34 0,00 0,00 0,00 0,00 0,00
Legenda: Rec = recomendao, Pro = projeto, Mod = modelo, SW = software, Pol = poltica, Col = colaborao, Man =
manual, G = guia, Tut = tutorial, Dic = dicionrio, Cur = curso, Cat = catlogo

Qual o tipo de documento que est sendo publicado?
A Figura 25 apresenta a tipologia de documentos verificada na amostra
coletada. A porcentagem de cada tipo de documento pode ser observada junto a
cada eixo da figura.
A tipologia mais freqentemente utilizada pelos autores foi artigo (62%) e,
em segundo lugar, textos on-line. Todos os demais tipos de documentos
representaram 23% da tipologia observada, ou seja, os autores no tm preferido
utilizar teses, declaraes, normas, dissertaes, captulos de livro, livros ou
relatrios para divulgar seus trabalhos na rea de preservao digital.




223


Figura 25 Tipologia de documentos

Conforme pode ser constatado na Figura 26, a linha de tendncia,
delineada na cor preta e pontilhada, evidencia aumento crescente do nmero total
de documentos produzidos no perodo de 1996 a 2007. Este aumento iniciou
marcadamente a partir de 1997, sendo que nos anos de 2000 e 2003 a produo foi
significativamente superior aos demais anos do perodo.



Figura 26 Tendncia da produo de documentos no perodo 1996 a 2007

interessante observar o tipo de documento produzido no perodo de
1996 a 2007, conforme ilustra a Figura 27.


224




Figura 27 Tipo de produo em funo do ano de produo


A Figura 27 mostra que a categoria mais presente ao longo de todo o
perodo foi artigo. Alm disto, verifica-se tendncia de aumento na quantidade de
artigos publicados ao longo dos 11 anos de observao. A segunda categoria de
publicao mais presente durante este intervalo de tempo foram os textos on-line, e
a terceira categoria foram os relatrios. Nota-se, ainda, que os livros comearam a
ser produzidos a partir do ano de 1999.

De qual rea do conhecimento eram as publicaes que abordaram o tema da
preservao digital?

As publicaes encontradas estavam associadas a uma das seguintes
reas: biblioteconomia, arquivologia, cincia da informao, cincia da computao
e histria. Conforme ilustra a Tabela 6, a maioria dos trabalhos foi produzida na rea
de biblioteconomia. Produes nas reas de histria ou cincia da computao so
muito raras.





225

Tabela 6 Distribuio de freqncia da rea do conhecimento
rea freqncia %
biblioteconomia 256 80,3
arquivologia 34 10,7
cincia da informao 20 6,3
cincia da computao 5 1,6
histria 2 0,6
sem/rea 2 0,6
TOTAL 319 100

A Tabela 7, a seguir, apresenta a distribuio das publicaes em funo
da rea de conhecimento. Dois valores em cada clula da tabela so mostrados: os
nmeros ao lado dos parnteses indicam a freqncia de ocorrncia de cada
publicao na respectiva rea de conhecimento, e o nmero entre parnteses indica
a porcentagem da respectiva produo em relao ao total de produes.

Tabela 7 Tipos de publicao em funo da rea de conhecimento
rea de Conhecimento
Tipo de
Publicao
cincia da
informao
arquivologia biblioteconomia
cincia da
computao
histria TOTAL
artigo 11 (3,5%) 19 (6,0%) 165 (52,1%) 1 (0,3%) (0%) 61,8%
captulo de livro 1 (0,3%) 4 (1,3%) 6 (1,9%) (0%) 2 (0,6%) 4,1%
declarao (0%) 1 (0,3%) 2 (0,6%) (0%) (0%) 0,9%
dissertao 5 (1,6%) (0%) 1 (0,3%) (0%) (0%) 1,9%
livro 1 (0,3%) 4 (1,3%) 12 (3,8%) (0%) (0%) 5,4%
norma (0%) 3 (0,9%) 1 (0,3%) (0%) (0%) 1,3%
relatrio 29 (9,1%) (0%) (0%) (0%) (0%) 9,1%
tese 2 (0,6%) (0%) (0%) (0%) (0%) 0,6%
texto on-line (0%) 3 (0,9%) 40 (12,6%) 4 (1,3%) (0%) 14,8%

Conforme mostra essa tabela foram produzidos artigos em quatro reas
de conhecimento, sendo que a maior parte ocorreu em biblioteconomia. A maioria
dos livros, captulos de livros, textos on-line e declaraes tambm estavam
associados a esta rea do conhecimento.
A maior parte da produo na rea de cincia da informao consistiu de
relatrios, mas tambm foram registrados alguns artigos, livros, tese, dissertao e
captulo de livro.


226
Na rea de arquivologia foram encontrados os seguintes tipos de
publicao: artigo, livro, captulo de livro, texto on-line, norma e declarao. Na
cincia da computao foram registrados poucos textos on-line e artigos, e na rea
de histria somente encontrou-se a produo do tipo captulo de livro.

Que peridicos cientficos veicularam artigos sobre preservao digital?

Como pode ser observado na tabela 8, a seguir, a concentrao de
nmeros de peridicos que mais publicaram artigos sobre preservao digital esteve
nos Estados Unidos e na Inglaterra. Existe alta concentrao de artigos em
pequeno nmero de peridicos, a maioria da rea da biblioteconomia e cincia da
informao.

Tabela 8 - Ttulo e pas de origem dos peridicos com artigos sobre preservao digital
Ttulo Pas Artigos
ACM Transactions on Computer Systems Estados Unidos 1
ACM Transactions on Information Systems Estados Unidos 1
Alexandria Inglaterra 1
American Archivist Estados Unidos 1
American Libraries Estados Unidos 2
Ariadne Inglaterra 13
ARL: A Bimontly Report on Research Library Issues and
Action
Estados Unidos 1
Arquivstica.net Brasil 3
Aslib Proceedings Inglaterra 1
Australian Academic & Research Libraries Austrlia 2
Change Estados Unidos 1
Chronicle of Higher education Estados Unidos 1
Cincia da Informao Brasil 1
Collection Management Estados Unidos 3
College & Research Libraries Estados Unidos 2
Communications of ACM Estados Unidos 1
Computers and the Humanities Holanda 2
Computers in Libraries Estados Unidos 1
Data Science Journal Frana 2
DataGramaZero Brasil 2
Digital Library Network Estados Unidos 1
D-Lib Magazine Estados Unidos 35
Documents Numerique Frana 1
EDUCAUSE Review Estados Unidos 2
El Profesional de la Informacin Espanha 1
First Monday Estados Unidos 2
Hi Energy Physics Libraries Webzine Sua 1
Information Services & Use Holanda 2
International Journal of Digital Curation Inglaterra 4
International Journal on Digital Libraries Alemanha 3
Issues in Science and Technology Librarianship Estados Unidos 1

Continua


227

Tabela 8 - Continuao
Ttulo Pas Artigos
Journal of Academic Librarianship Holanda 1
Journal of American Society for Information Science and
Technology
Estados Unidos 1
Journal of Archival Organization Estados Unidos 1
Journal of Digital Information Estados Unidos 2
Journal of Electronic Publishing Estados Unidos 4
Journal of Library Administration Inglaterra 1
Journal of Research of the National Institute of Stand Tech Estados Unidos 2
Journal of the Association of Moving Image Archivists Estados Unidos 1
Learned Publishing Inglaterra 4
Libraries and the Academy Estados Unidos 3
Library and Information Research News Inglaterra 1
Library Hi Tech Inglaterra 2
Library Journal Estados Unidos 1
Library Journal, Net Connect Estados Unidos 1
Library Management Inglaterra 1
Library Resources & Technical Services Estados Unidos 1
Library Review Inglaterra 2
Library Trends Estados Unidos 6
Multimedia Information and Technology Inglaterra 1
New Review of Academic Librarianship Inglaterra 4
OCLC Systems & Services Estados Unidos 3
On-line Journal for Cultural Studies Austria 1
Perspectivas em cincia da informao Brasil 1
Program Inglaterra 2
Reference Librarian Estados Unidos 1
Research Information Estados Unidos 2
Revista IP Brasil 1
RLG DigiNews Estados Unidos 27
SciCom Info Sucia 1
Science & Technology Libraries Estados Unidos 1
Serials Inglaterra 3
Serials Librarians Estados Unidos 4
Serials Reviews Estados Unidos 11
Technicalities Estados Unidos 1
The Botton Line: Managing Library Finances Inglaterra 1
Update Inglaterra 1
Vine Inglaterra 1

Os exemplos citados refletem a comunidade de prtica definida por
representantes de arquivos, bibliotecas, museus e outras instituies de ensino e
pesquisa. Foi constatada a origem geogrfica da maior parte das informaes
divulgadas, as recomendaes e descries dos aspectos tcnicos da preservao
digital publicadas por autores em peridicos no exterior, os quais, de alguma forma,
estavam relacionados com iniciativas e projetos de instituies no Primeiro Mundo.





228
4.1.3 Temticas e questes discutidas


As referncias citadas formaram um contingente de documentos
selecionados, que produziram a necessidade de delimitar o escopo da anlise
bibliomtrica. Todos os trabalhos retratam uma amostragem da produo intelectual
sobre os assuntos relacionados ao tema principal desta pesquisa.
O estudo apontou como resultados que a definio sobre o conceito de
preservao digital no mais uma preocupao para os autores e que os aspectos
relacionados com a implantao e certificao de repositrios digitais esto no
centro do debate nos ltimos anos. Os autores revelaram a preocupao com a
necessidade de conhecimento sobre os procedimentos de armazenamento e acesso
aos documentos digitais.
Tambm, o estudo permitiu avaliar a produo cientfica em categorias
especficas, levando em considerao os debates centrais propostos pelos autores.
A definio das variveis foi o resultado da reviso da literatura que envolveu um
dos objetivos especficos desta pesquisa, que identificar os critrios para o
estabelecimento de sistemas de gesto de preservao digital de informao
cientfica.
Identificados os principais autores e fontes de informao da rea, as
questes discutidas por eles focalizaram as caractersticas das iniciativas e as
caractersticas das colees e objetos digitais com que eles trabalham. O
aparecimento de alto nmero de trabalhos em publicaes peridicas nacionais e
estrangeiras divulgando apenas recomendaes uma indicao do estgio de
desenvolvimento de estudos sobre o assunto.
Em vrios livros da rea da cincia da informao a preservao digital
aparece como um tpico relativo ao gerenciamento de informao em bibliotecas e
repositrios digitais. Tambm rara a publicao de teses ou dissertaes
dedicadas ao tema da preservao digital. Pode afirmar-se que a rea da
preservao digital est na sua fase de institucionalizao e legitimao.






229
4.2 ANLISE DOS DADOS DOS QUESTIONRIOS


Examinar a amostra da populao das unidades de pesquisa do MCT que
possuem centros de informao e biblioteca implicou uso de mtodos de coleta de
dados para constituir uma lgica de anlise. A aplicao de questionrios e
entrevistas permitiu a coleta direta de informao com as pessoas envolvidas com
as atividades institucionais relacionadas com a preservao dos documentos
digitais.
Como mostraram Fink e Kosecoff (1985), os questionrios e entrevistas
so mtodos vlidos, exeqveis e que transferem credibilidade aos resultados das
pesquisas, havendo apenas a necessidade de se indagar a quem as perguntas
sero dirigidas, onde e com que freqncia, assim como a abordagem de anlise e a
interpretao dos dados.
O questionrio utilizado nesta pesquisa (Apndice A) foi produto da
necessidade de contextualizar as prticas de preservao dos documentos digitais e
do interesse por parte da Biblioteca de Poltica em Cincia e Tecnologia (BPCT) da
Coordenao-Geral de Gesto e Inovao (CGGI) do Ministrio da Cincia e
Tecnologia (MCT). A biblioteca registrava, entre seus projetos para o ano de 2004, o
levantamento das atividades que as unidades de pesquisa realizavam com relao
ao tratamento dos seus documentos bibliogrficos, em qualquer suporte.
O questionrio foi encaminhado pela responsvel da BPCT via correio
eletrnico para os endereos oficiais dessas instituies, as respostas foram
analisadas conjuntamente com a BPCT e as informaes coletadas puderam ser
confirmadas posteriormente, por meio das entrevistas nas sedes das unidades.
A aplicao do questionrio foi uma escolha justificada pela expectativa de
poder identificar o maior nmero de pessoas envolvidas com os trabalhos de
preservao de documentos em todos os formatos. No quesito sobre o tratamento
dos documentos digitais, esperava-se encontrar dados que pudessem auxiliar na
localizao de informaes oficiais sobre esses objetos digitais.
Os dados dos questionrios evidenciaram o contexto dos centros de
informao do MCT, o perfil das suas equipes e as caractersticas do manejo da
informao digital no mbito do Ministrio.



230

4.2.1 Caractersticas dos centros de informao


A maioria das unidades de pesquisa do Ministrio da Cincia e Tecnologia
conta com centros de informao ou setor de biblioteca onde so tratados todos os
materiais bibliogrficos das suas reas de competncia, produzidos por
pesquisadores internos e externos instituio.
Foram recebidos questionrios com respostas de responsveis por
centros de informao e bibliotecas de 20 unidades de pesquisa do MCT. Os dados
foram classificados para anlise em sete grupos:
1) setor responsvel pelo tratamento dos materiais;
2) tipos de materiais tratados nos centros;
3) tipo de aplicao de software usado;
4) ferramenta para indexao dos contedos;
5) tipo de acesso;
6) tratamento da produo cientfica local;
7) tratamento dos materiais digitais.
As respostas das instituies apontaram as peculiaridades em relao ao
tipo de tratamento dado aos registros da produo cientfica. O contexto histrico de
cada unidade pode ser observado no Apndice D.
O Quadro 13, a seguir, apresenta os locais das unidades de pesquisa e os
materiais bibliogrficos tratados pelas respectivas unidades. Como pode ser
verificado, seis unidades de pesquisa no responderam a esta questo, quais sejam:
Inpa, Mast, CNPq, Cetem, Impa e Cnen.
Para rastrear a localizao dos arquivos digitais, foi necessrio perguntar
sobre o setor responsvel pelo tratamento segundo o tipo de material. Baseados nas
respostas de treze unidades, constatou-se que, segundo a percepo dos
responsveis pelos centros de informao e biblioteca, eram eles os encarregados
por esse trabalho.
Isso pode ser verificado no Quadro 13, uma vez que a maioria das
unidades de pesquisa atribuiu s bibliotecas a responsabilidade do respectivo
tratamento.



231
Tipo de material
Unidade
de
pesquisa
Monografias
(livros/ anais/
teses/
dissertaes)
Analticas
(captulos
de livros)
Peridicos Artigos
Comunicaes
em eventos
Multimeios
(filmes, CDs,
DVDs,
fotografias
etc.)
TCC
Trabalhos
Experimentais
Produo
docente
Outros
CBPF
Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca
CenPRA
Diviso de
Comunicao e
Gabinete DCOG
DCOG DCOG DCOG
CGEE
Informao Informao Informao Informao Informao Informao
Finep
Biblioteca Biblioteca Biblioteca Biblioteca
Ibict
Processos
Tcnicos
Aquisio Processos
Tcnicos

IDSM
Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca
Inpe
Processamento
Tcnico de
Livros
Processamento
Tcnico de
Peridicos
Processamento
Tcnico de
Livros
Processamento
Tcnico de
Livros
Memria
Tcnico-
Cientfica

INT
Biblioteca
LNA
Biblioteca Biblioteca
LNCC
Biblioteca Biblioteca
LNLS
Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca
Mpeg
Biblioteca Biblioteca Biblioteca Biblioteca e
Arquivo
Biblioteca (coleo
de livros raros)
ON
Diviso de
Informao e
Documentao

RNP
Centro de
Informaes

Quadro 13 - Tipo de material segundo e setor responsvel no centro de informao e biblioteca



232
O Cnen contava com 14 unidades vinculadas, algumas delas com
bibliotecas, mas unicamente a biblioteca sede foi includa nesta pesquisa. Um
centro de informao que no foi includo foi a Coordenao de Sistemas de
Informao da unidade Indstrias Nucleares do Brasil (INB). A resposta
recebida ao envio do questionrio explicava que:
- [...] o acervo de nossa biblioteca constitudo basicamente de
normas tcnicas nacionais e estrangeiras para atender s
necessidades das duas fbricas de combustvel nuclear. A produo
intelectual interna se existe no est acessvel, nem consta do
acervo da nossa biblioteca, tendo em vista o carter restrito de parte
das atividades da INB. (Bibliotecria R2)

A segunda comparao dos resultados ocorreu com relao aos
tipos de materiais e aos software utilizados para o registro em bases de dados
locais. O Quadro 14, a seguir, apresenta as bases de dados usadas pelos
centros de informao e bibliotecas para o registro dos materiais bibliogrficos.
O Quadro inclui as respostas de 18 unidades de pesquisa. Cetem e CNPq no
responderam a este item do questionrio.
No Quadro, as clulas preenchidas com a palavra No significam
que a unidade no utiliza o sistema de base de dados aplicado em outros
materiais pela prpria unidade.
Existe uma variedade de solues em funcionamento nas bibliotecas
e centros de informao, representando um modelo que no permite a
integrao das informaes de todas as instituies. As solues encontradas
eram bases de dados proprietrias, provedores de dados de arquivos abertos,
repositrios digitais e sistemas de publicao eletrnica. A falta de
compartilhamento das solues adotadas deixou em evidncia as
caractersticas de sistemas de gesto da informao pouco integradoras dos
centros de informao e bibliotecas.






233
Tipo de material
Unidade
de
pesquisa
Monografias
(livros, anais, teses/
dissertaes)
Analticas
(captulos de
livros)
Peridicos Artigos
Comunicaes
em eventos
Multimeios
(filme, CD, DVD,
fotografia, etc.)
TCC /
Trabalhos
Experimentais
Produo
docente
Outros
CBPF
Sistema Prprio Sistema
Prprio
Sistema
Prprio
Sistema
Prprio
Sistema Prprio Sistema Prprio Sistema Prprio Sistema Prprio
CenPRA SICTEC
CGEE Prprio Prprio Prprio Prprio Prprio Prprio
Cnen
Microisis com
interface desenvolvida
localmente
Secs Bireme
(local)
Anais de eventos
sistema prprio
(base Anais)
Microisis com
interface
desenvolvida
localmente)

Finep Sysbibli Sysbibli Sysbibli Sysbibli
Ibict
Microisis PHL 8.0 No Caribe - PHL
8.0
Microisis
PHL 8.0
1

Microisis PHL 8.0
PHL 8.0
2
Gerenciado no
DEP/RJ

IDSM Caribe Caribe Caribe Caribe Caribe
Impa Horizont Horizont
Inpa BIBLIOBASE BIBLIOBASE BIBLIOBASE BIBLIOBASE
inpe Sophia No Sophia No Sophia Sophia No URLib Service
3

INT SYSBIBLI/PHL SYSBIBLI/PHL CD de Anais Cientfica Defesas de teses
LNA
Access for Windows Access for
Windows
No Dentro de
monografias

LNCC Pergamum pergamum
LNLS
RM Biblios No RM Biblios No RM Biblios RM Biblios RMBiblios Delphi / SQL
Server

Mast Microisis Microisis Peripuc Microisis Microisis Microisis Microisis
Mpeg
Caribe Caribe Caribe Caribe Caribe (coleo
livros raros)
ON
Microisis ( sendo
implantado)
Pergamum
No ReriPuc
(sendo
implantado)
No No Microisis (sendo
implantado)
Sim
RNP No No web No No No No No Access Windows

Quadro 14 Bases de dados usadas nos centros de informao e bibliotecas para o registro dos materiais bibliogrficos




234

As ferramentas de indexao utilizadas pelos centros e bibliotecas
das unidades, segundo o tipo de material, podem ser vistas no Quadro 15.
Somente duas unidades de pesquisa no responderam a esta solicitao do
questionrio (ON e CNPq). Neste Quadro, as clulas que contm a palavra
No significam que a ferramenta de indexao escolhida no foi aplicada para
esse tipo de material.
A maioria das unidades de pesquisa do MCT conta com algum tipo
de ferramenta de indexao dos registros bibliogrficos em suas bases de
dados. Esse tipo de mecanismo permite que seja realizada a correta descrio
da produo cientfica internacional e local. Os dados do Quadro 15 atestam
que a forma tradicional de descrio bibliogrfica continua prevalecendo
nessas instituies.

















235
Tipo de material
Unidade
de
pesquisa
Monografias (livros/
anais/teses/
dissertaes)
Analticas
(captulos de
livros)
Peridicos Artigos revistas
Comunicaes
em eventos
Multimeios
(filme, CD, DVD,
Fotografia, etc.)
TCC/Trabalhos
Experimentais
Produo
docente
Outros
CBPF INSPEC No
CenPRA
AINFO-NTIA
(EMBRAPA)
AINFO-NTIA
(EMBRAPA)
AINFO-NTIA
(EMBRAPA)

Cetem
Cabealho de assunto
Bibliodata

CGEE Termos livres Termos livres Termos livres Termos livres Termos livres Termos livres
Cnen Vocabulrio prprio No
Finep
Vocabulrio
sistematizado
Vocabulrio
sistematizado
Vocabulrio
sistematizado
Vocabulrio
sistematizado

Ibict
Tesauro da Cincia da
Informao TCI e o
Spines para reas
correlatas
TCI TCI
IDSM INTERVOC INTERVOC INTERVOC INTERVOC INTERVOC
Impa
Classificao de assunto
do IMPA
Classificao de
assunto do
IMPA
Classificao de
assunto do IMPA
Classificao de
assunto do IMPA
Classificao de
assunto do IMPA
Classificao de
assunto do IMPA
Classificao de
assunto do IMPA

Inpa
Library of Congress (LC)
e Biblioteca Nacional
(BN)
LC e BN LC e BN LC e BN
Inpe
Tesauro da NASA No Tesauro da NASA Tesauro da
NASA
Tesauro da
NASA

INT Vocabulrio controlado
LNA No No No No
LNCC
Subject Heading da LC Subject Heading
da LC

LNLS
Assunto No Assunto No Assunto Assunto Assunto Ano de
Publicao

Mast
Vocabulrio controlado Vocabulrio
controlado
Vocabulrio
controlado
Vocabulrio
controlado
Vocabulrio
controlado

Mpeg
CDD20ed. SUBJECT,
23ed. THESAURUS
ESPECIALIZADOS
CDD20ed.
SUBJECT,
23ed.
THESAURUS
CDD CDD
(coleo
de livros
raros)
RNP
Vocabulrio livre Vocabulrio
livre
Vocabulrio livre Vocabulrio livre Vocabulrio livre Vocabulrio livre Vocabulrio livre Vocabulrio livre

Quadro 15 - Ferramenta de indexao utilizada segundo o tipo de material


236
O Quadro 16, a seguir, indica o tipo de acesso disponibilizado pelas
unidades de pesquisa do MCT, segundo o tipo de material. O Mast e INT no
responderam a este item do questionrio.
Como observado na reviso da literatura, uma das preocupaes
centrais dos envolvidos na aplicao de critrios de preservao digital o tipo
de acesso e a insero de dados nos repositrios (CCSDS, 2003; DAY, 2002).
Nos casos em que ainda no foi realizada nenhuma forma de padronizao em
relao a metodologias de preservao digital, esperava-se que existisse uma
postura institucional que estabelecesse as condies mnimas para o
funcionamento de algum sistema de preservao digital. Entretanto, esta
expectativa no se confirmou.
No caso das unidades de pesquisa do MCT, os materiais analgicos
e digitais permitem dois tipos de acesso: o bibliogrfico, que disponibiliza as
informaes catalogrficas do registro; e aquele que permite o acesso ao texto
completo.
Observou-se que, nas instituies que permitiam algum tipo de
acesso ao texto completo, isso era realizado por meio da indicao do site da
revista na qual o mesmo estava disponvel. Conforme demonstrado na reviso
da literatura, esse tipo de prtica no pode ser considerado de preservao
digital, pois se a biblioteca apenas disponibiliza o endereo da revista ou uma
cpia do texto da revista com acesso livre na Internet, no h qualquer garantia
de preservao deste material.





237


Quadro 16 Tipo de acesso disponibilizado pelas unidades de pesquisa do MCT segundo o tipo de material



Tipo de material
Unidade
de
pesquisa
Monografias
(livros/ anais/
teses/
dissertaes)
Analticas
(captulos de
livros)
Peridicos
Artigos
revistas
Comunicaes
em eventos
Multimeios (filme,
CD, DVD,
fotografia, etc.)
TCC/ Trabalhos
Experimentais
Produo docente Outros
Cenpra Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico
Cetem Texto completo
CGEE
Bibliogrfico e
Texto completo
Bibliogrfico e
Texto
completo
Bibliogrfico e
Texto
completo
Bibliogrfico e
Texto
completo
Bibliogrfico e
Texto completo
Bibliogrfico e Texto
completo

Cnen Bibliogrfico Bibliogrfico Bibliogrfico
Finep Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico
Ibict Bibliogrfico Bibliogrfico Bibliogrfico
IDSM Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico
Impa
Bibliogrfico
On-line

Texto
completo
on-line

Inpa Texto completo Texto completo Texto completo Texto completo Texto completo
Inpe
Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico e Texto
completo

LNA Bibliogrfico Bibliogrfico
LNCC Bibliogrfico Bibliogrfico
LNLS
Bibliogrfico
Intranet/ On-line
Bibliogrfico
Intranet /
alguns textos
completos
Bibliogrfico
On-line
Bibliogrfico
Intranet /On-line
Bibliogrfico Intranet
/ On-line / alguns
textos completos
Bibliogrfico
Intranet / On-line
Bibliogrfico Intranet /
On-line / alguns textos
completos

Mpeg Bibliogrfico Bibliogrfico Bibliogrfico
ON Bibliogrfico Bibliogrfico
RNP Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Texto completo


238
As formas de tratamento da produo cientfica das diferentes
unidades de pesquisa podem ser observadas no Quadro 17, a seguir. Quatro
unidades no responderam a esta questo: INT, ON, CNPF e LNA.
Conforme mencionado anteriormente, requisito indispensvel para o
estabelecimento de um sistema de preservao digital nas instituies a
necessidade de definir as formas de armazenamento e metodologias
adequadas para a conservao dos materiais analgicos e digitais (FUNARI,
2005; LYNCH, 2003; PETERS, 2002).
O Quadro evidencia que as unidades de pesquisa aplicam formas de
classificao, armazenamento e metodologias de conservao da produo
cientfica em qualquer suporte. Alm disso, destaca-se a falta de ateno que a
preservao de longo prazo tem merecido nessas unidades e a necessidade
da anlise dos requisitos, planejamento, concretizao e avaliao de solues
tecnolgicas adequadas para a preservao dos recursos digitais.
As prticas de preservao continuam sendo moldadas pelas
atividades tradicionais de preservao para o material impresso, sendo que a
preocupao com a preservao digital ainda no central para a maioria
dessas instituies. O tipo de documento que apresenta alguma
implementao de preservao digital o peridico eletrnico. Relatrios
tcnicos em formato digital e outros tipos de literatura cinzenta esto
comeando a ser coletados, mas sem enfrentar diretamente a preservao de
longo prazo.







239
Unidade de
pesquisa
Classificao Forma de armazenamento
Metodologia para conservao (em qualquer
suporte)
CBPF
Especfico para a coleo p/ ano: Classificao
Decimal Dewey p/ livros
Especfico para a coleo em caixas: estantes Especfico para a coleo: cpias em papel e
digitalizadas: higienizao e desinfestao por firma
especializada
CenPRA Igual a do acervo geral: papel e digital Igual a do acervo geral: papel e digital Igual a do acervo geral: banco de dados
Cetem CDD
CGEE Igual a do acervo geral Igual a do acervo geral Igual a do acervo geral
Cnen
Igual a do acervo geral Igual a do acervo geral. Especfico para a coleo: a parte mais
recente est armazenada em arquivos PDF e disponibilizada via
intranet. O armazenamento dos arquivos est sendo feita num
servidor onde ficam os servios bibliogrficos
Igual a do acervo geral
Finep Especfico para a coleo: seqencial Especfico para a coleo: seqencial Especfico para a coleo: microfilme
Ibict
Igual a do acervo geral CDU As monografias so armazenadas em estantes metlicas, em
ordem de classificao; as colees de peridicos so
armazenadas em estantes metlicas em ordem alfabtica de ttulo.

IDSM Igual a do acervo geral: CDD
Impa
Especfico para a coleo: tabela especfica
Classificao de assunto do IMPA

inpa Igual a do acervo geral Igual a do acervo geral Igual a do acervo geral
Inpe
Especfico para a coleo (Duas seqncias:
1. geral, 2. pelo tipo de publicao)
Especfico para a coleo: arquivos (HTML, Word, PDF) Especfico para a coleo: armazenamento digital em
disco rgido; CD-ROM; Optical Disc
LNCC Igual a do acervo geral Igual a do acervo geral
LNLS
Igual a do acervo geral: Publicaes Internas,
Comunicao TcnicaCT, Especificaes Tcnicas
ET, Manual Tcnico MT, Memorando de Projeto
MeT, Notas de cursos e Workshops NCW,
Preprint, Relatrio de Bolsistas de Vero RBV,
Relatrio de Bolsistas RB, Relatrio de Estagirio
RE
Igual a do acervo geral: o documento registrado na Intranet,
recebe um nmero anual, o texto anexado e transformado em
PDF e disponibilizado para consulta dos usurios. O material
impresso e encadernado, arquivado por ano (ainda no
disponibilizamos p/ consulta via Web)

Mast Igual a do acervo geral Igual a do acervo geral Igual a do acervo geral
Mpeg
Igual a do acervo geral e especfico para a coleo:
acrescenta-se sigla para identificar MGCOL
Base de dados igual a do acervo geral e especfica para a coleo Igual do acervo geral: alguns em armrios deslizantes
RNP
Igual a do acervo geral: Classificao Decimal de
Dewey, 21. Ed. Categorias documentais, de acordo
com nossas necessidades e especificidades de
assuntos e documentos.
Igual a do acervo geral: Sistemtico, por ordem de classificao.:
estrutura de arquivos independentes, em diretrios e disponveis na
intranet e no website.
Manuteno de organizao dos arquivos eletrnicos
armazenados, segundo critrios de categoria, verso e
viso.
Quadro 17 Formas de tratamento da produo cientfica da unidade de pesquisa


240
O Quadro 18 indica se as unidades de pesquisa aplicam mtodos de
preservao aos materiais bibliogrficos. As seguintes unidades no responderam a
este questionamento: Impa, LNA, MPEG, Mast, Finep e IDSM.
Os responsveis pelos centros de informao e bibliotecas foram
interrogados com relao ao tratamento dado aos materiais em formato digital, uma
vez que, nas unidades de pesquisa, so produzidos objetos digitais. Esses podem
ser pela converso de formatos ou pela produo de documentos originalmente
digitais.
A pesquisa identificou que aproximadamente metade das instituies
realiza alguma forma de tratamento no acervo retrospectivo com vistas a formar
colees digitais para o acesso por parte dos seus usurios.
A digitalizao pode ser considerada como o incio da vida til de um
documento digital, e por esse motivo as prticas de preservao de objetos digitais
poderiam se estender ao planejamento da converso inicial de formatos. Apesar de
que nenhum procedimento de preservao digital pode ser aplicado a materiais
analgicos.






Quadro 18 - Mtodos de preservao aplicados aos materiais bibliogrficos nas
unidades de pesquisa

Os dados do Quadro 18 apontam que reduzido o nmero de estratgias
de preservao sendo implementadas nas agncias de pesquisa governamentais.
Unidade
de
Pesquisa
Aplicao de
metodologia de
digitalizao
Aplicao de
estratgia de
preservao
Participao em
iniciativa de
preservao digital
CBPF Sim No No
CenPRA Sim Sim No
Cetem Sim No No
CGEE No No No
Cnen Sim No No
CNPq Sim No No
Ibict Sim No No
Inpa No No No
Inpe No Sim Sim
INT Sim Sim No
LNA No No No
LNLS No No No
ON No No No
RNP No No No


241
Mas a complexidade destas estratgias no um sinal de maturidade na forma
como o problema est sendo abordado.
Em 2004, o Servio e Documentao e Acervo do CNPq informou no
questionrio que a biblioteca encontrava-se nas condies como foi recebida do
MCT, sem nenhuma classificao ou arranjo. Com a criao do Centro da Memria,
o CNPq iniciou, naquele ano, um processo de digitalizao das atas do Conselho
Deliberativo.
Em 2006, o Cetem digitalizou as sries esgotadas das suas publicaes
em verso impressa. No mesmo ano, a unidade de pesquisa CBPF comeou a
desenvolver um projeto de preservao digital, que partiu do interesse dos
funcionrios da Coordenao de Documentao e Informao Cientfica (CDI), mas
a iniciativa no recebeu continuidade. O objetivo do projeto era desenvolver
estratgias de preservao de informao digital tcnico-cientfica usando
metadados.
Outros projetos de digitalizao de acervos esto sendo iniciados nas
unidades, mas a organizao das novas colees digitais retrospectivas ainda no
foi avaliada. O fato de os centros e bibliotecas usarem solues proprietrias sugere
que a maioria das instituies pesquisadas no demonstra preocupao com o
estabelecimento de polticas de preservao digital nem no desenvolvimento de
Pacotes de Disseminao de Informao (PDI), como a norma OAIS recomenda. O
Inpe foi a nica unidade que adotou esse modelo no planejamento da sua biblioteca
digital.
Os dados evidenciaram, tambm, que a informao tcnico-cientfica
nessas instituies carece de padronizao com relao s atividades de
preservao digital. Alm disso, a pesquisa mostrou que os documentos digitais
esto armazenados em bases de dados proprietrias, sem nenhum plano
estratgico que garanta a longevidade da informao neles contida.
Desde 2002, o Ibict trabalha com sistemas de informao que servem
para a preservao digital. J em 2003, o instituto reuniu vrios especialistas para
discutir o tema da preservao digital e a criao de um comit. O comit foi
composto por representantes do Ibict, Biblioteca Nacional, Programa Sociedade da
Informao, Bireme, Capes, Abec, Unesco e especialistas convidados. Foram
criados vrios GTs, entre os quais estava o de Certificao Digital. Entretanto, a
iniciativa no teve prosseguimento devido a mudanas administrativas e de diretoria.


242
O Ibict continua interessado em identificar as tendncias e apontar as
atividades de preservao digital que podem ser aplicadas no contexto nacional de
C&T. Foram realizados estudos sobre ferramentas para repositrios institucionais
(CAF et al, 2003), concretamente, as pesquisas tiveram incio mediante a avaliao
das ferramentas mais adequadas para essa finalidade. Algumas das ferramentas
analisadas foram: Archimede da Layal University Library, o CDSware do CERN, o
Fedora das Universidades de Virginia e Cornell e o DSpace do MIT.
O Ibict acompanhou a primeira implementao do DSpace em lngua
portuguesa, em 2002, realizada pela Universidade do Minho, em Portugal, que
resultou na criao do seu repositrio institucional (RODRIGUES et al., 2004), o
RepositoriUM. A partir de ento, o Ibict iniciou atividades de experimentao com
este software. Em 2004, a Biblioteca do Superior Tribunal de Justia (STJ) recebeu
assessoramento do Ibict para a criao do repositrio institucional BDJur, (BASEVI,
2004). Alm disto, o Ibict estabeleceu uma parceria com a Universidade de So
Paulo (USP) que resultou na criao do Reposcom Repositrios Institucionais em
Cincias da Comunicao (FERREIRA; SOUTO, 2005).
A utilizao do software DSpace pelo Ibict surgiu com o projeto-piloto
denominado Ridi (Repositrio Institucional Digital do Ibict) que visava recuperar a
documentao de todas as atividades de pesquisa, publicando os contedos que se
encontravam dispersos em vrios departamentos. Em 2007, o Instituto estava
trabalhando em uma nova verso do DSpace totalmente em portugus (Brasil) e
baseada na verso mais atual deste software. O produto incluiu sua reviso e a
criao do pacote que est sendo repassado a outras instituies.
Internacionalmente faz-se reconhecida a importncia das parcerias na
realizao de atividades de preservao digital (FEENEY, 1999; LAVOIE, 2008).
Elas tm possibilitado melhor compreenso dos benefcios no compartilhamento de
custos e avaliaes de esforos no redundantes no estabelecimento de estratgias
efetivas de preservao.
Nas instituies pesquisadas, a construo da infra-estrutura considerada
necessria para esse tipo de projeto ainda no foi analisada, assim como no se
estimou a necessidade de contar com o apoio de instituies de fomento e de
pesquisa. Essa realidade reproduz, em menor escala, as concluses do estudo
realizado por Hedstrom e Montgomery para o RGL em 1998, ao afirmarem que as
instituies participantes desse consrcio no tinham desenvolvido polticas nem


243
prticas de preservao digital e nem assumido a responsabilidade da preservao
dos materiais em formato digital.
A separao entre as propostas de preservao digital que surgem nas
iniciativas internacionais e o status real da preservao digital em instituies como
as unidades de pesquisa comea a ser percebida, mas a insuficincia de recursos e
o planejamento inadequado das prticas para permitir o acesso de longo prazo so
o maior obstculo para o estabelecimento de sistemas confiveis de preservao
digital.


4.2.2 Perfil profissional das equipes


O primeiro contato com as equipes dos centros e unidades de pesquisa do
MCT se deu por meio da listagem interna que a biblioteca do Ministrio dispe de
todos os funcionrios desse rgo. Aps o envio do questionrio, na forma de um
documento circular da biblioteca do Ministrio, as respostas comearam a serem
enviadas para o pesquisador e os possveis respondentes identificados.
O segundo contato ocorreu durante os eventos das associaes de
cincia e tecnologia de 2004, 2005 e 2007, nos quais se reuniram representantes
das unidades de pesquisa. Nesses encontros foi possvel ter uma primeira viso do
contexto das unidades e dos profissionais que dispunham de informaes oficiais
sobre os setores de biblioteca do MCT.
As entrevistas realizadas durante os eventos de C&T com os
representantes das unidades complementaram as informaes coletadas no
questionrio, mais especificamente sobre os profissionais que realizavam algum tipo
de manuteno dos documentos digitais nas unidades.
O levantamento de dados sobre o perfil das equipes dos centros de
informao e biblioteca do MCT pretendia identificar as pessoas que fariam parte da
amostra de gestores da informao em formato digital do Ministrio. Como mostra a
Tabela 9, as 20 instituies que enviaram suas respostas definiram suas equipes
como sendo integradas por bibliotecrios, auxiliares tcnicos, analistas e arquivistas,
assim como pessoal administrativo.


244
Embora o questionrio apenas permitisse a opo de escolha de resposta
entre bibliotecrios e auxiliares, os respondentes manifestaram a presena dos
profissionais da rea da cincia da computao como sendo uma parte importante
para o desenvolvimento das atividades desses centros.
O grupo de participantes da pesquisa comeou a ser definido aps a
anlise do questionrio. Especificamente com relao populao, percebeu-se que
havia a necessidade de agrupar os respondentes em trs categorias: o primeiro
formado pela predominante presena de bibliotecrios; o segundo formado pelos
auxiliares tcnico-administrativos; por ltimo, o grupo dos tcnicos de informtica e
estagirios (estudantes de biblioteconomia, arquivologia e cincia da computao),
que apresentaram maior mobilidade com relao ao tempo de atuao nos locais
visitados.
























245
Tabela 9 Servidores nas bibliotecas das unidades de pesquisa do MCT


Alm dos itens identificados na Tabela 9, nenhuma das unidades
mencionou a presena, em suas equipes, de especialistas em preservao digital ou
a contratao de consultores para a realizao dessas atividades. Isto pode ser
explicado pela pouca divulgao no Brasil de consultorias dedicadas
especificamente preservao digital de acervos bibliogrficos.
Existe uma nica empresa brasileira dedicada a prestar esse tipo de
servios. A empresa TECH-IN, liderada por pesquisadores da rea da cincia da
informao e arquivologia com sede na cidade de Nova Lima, Minas Gerais, realiza
diagnsticos e formula propostas para sistemas de gesto de preservao de
Tipo de biblioteca e servidor
Unidade
de
pesquisa
Tipo de
Biblioteca
Servidores
(Bibliotecrios)
Servidores
(Auxiliares)
Servidores
encarregados
(Outros)
Total
CBPF Especializada 4 5 1 (analista) 10
CenPRA Abrangncia
geral
1 2 1 (analista) 4
Cetem Especializada 1 1 2 (analistas) 4
CGEE Especializada 1 0 1 (analista)
2 (tcnicos de
informao)
4
Cnen Especializada 2 1 1 (indexador) 4
CNPq Central/
Especializada
1 1 1 3
Finep 2 bibliotecas /
2 arquivos
4 3 1 (analista) 8
Ibict Especializada 2 2 1 (analista) 5
IDSM Especializada 1 1 0 2
Impa Especializada 2 2 1 (analista) 5
Inpa Especializada 1 0 0 1
Inpe Central /
Especializada
6 2 2 (analistas) 10
INT Especializada 3 0 1 (analista) 4
LNA Especializada 0 2 0 2
LNCC Especializada 1 3 1 (analista) 5
LNLS Especializada 1 0 1 (estagirio) 2
Mast Especializada 1 1
(administrativo)
1 (arquivista) 3
Mpeg Especializada 6 4 0 10
ON Especializada 2 1 1 (analista) 4
RNP Central/
Especializada
1 (apoio do
responsvel
pela Biblioteca
da Embrapa)
2 1 (assistente)
1 (analista)
5


246
documentos digitais. Os servios de consultoria de preservao digital que a TECH-
IN oferece, esto baseados nos modelos de referncias aqui citados e engloba o
trabalho de aculturizao prvia sobre o tema dos profissionais das instituies
interessadas (THOMAZ, 2008).
Como ser mencionado na anlise das entrevistas, algumas mudanas
organizacionais das unidades de pesquisa foram decisivas para a formao de
profissionais que atendessem s necessidades de preservao dos materiais digitais
nos espaos de suas bibliotecas e centros de informao.


4.3 ANALISE DOS DADOS DAS ENTREVISTAS


Os objetivos especficos para a fase de pesquisa de campo propostos
neste trabalho foram:
OE3) identificar as necessidades de preservao digital da informao
tcnico-cientfica das unidades de pesquisa do Ministrio da Cincia e
Tecnologia;
OE4) resgatar os conceitos e aplicaes usados nessas organizaes que
caracterizam suas prticas de preservao, tendo por parmetro as
condies locais que interfiram no entendimento do significado e
propsito da implantao das metodologias de preservao de
documentos digital.
Os resultados obtidos foram a identificao das necessidades de
preservao digital da informao cientfica das unidades de pesquisa do MCT, bem
como conceitos usados para caracterizar suas prticas de preservao, segundo os
principais envolvidos e as condies locais.
A aplicao do questionrio tinha por meta estabelecer um contato inicial
com os gestores dos centros de informao e bibliotecas e suas equipes. A
abordagem dos dados coletados passou a ser mais qualitativa, assumindo-se que, o
entendimento do significado e propsito das atividades de preservao presentes
nesses institutos, seria mediado pela interpretao do pesquisador e o seu marco de
referencial terico.


247
Como Richardson et al. mencionam (1999, p. 210), algumas das
vantagens da tcnica da entrevista esto na postura do entrevistado, que responde
com um grau maior de liberdade (diretividade da entrevista) e a expresso de
respeito por parte do entrevistador manifestao da opinio do entrevistado.
As narrativas histricas das memrias das fontes contatadas seguiram
uma ordem cronolgica que dependeu de fatores especficos de agendamento por
parte do entrevistador e dos entrevistados. As entrevistas foram gravadas em fita
magntica e MP3 em encontros agendados durante eventos cientficos nacionais e
em visitas s sedes das unidades de pesquisa.
O primeiro roteiro de entrevista usado nos encontros com representantes
das instituies, durante os trs eventos cientficos nacionais em 2004
44
, 2006
45
e
2007
46
, pretendia identificar os respondentes e avaliar o conhecimento que eles
detinham sobre o tratamento tcnico dado aos arquivos digitais nas suas
instituies. Tambm se registraram as opinies sobre o tipo de material que deve
ser preservado, bem como foram identificados os responsveis localmente.
O roteiro de entrevista com os respondentes nas sedes dos institutos
passou a ser orientado segundo o perfil da pessoa contatada. Como mencionado no
item 4.2.2, o questionrio apontou que os dois grupos a serem abordados nesta fase
seriam os profissionais da informao (bibliotecrios, arquivistas, tcnicos) e os da
computao.
A aplicao do segundo roteiro de entrevista foi, portanto, dividido em
duas partes dirigidas aos dois setores (biblioteca e informtica) representados pelos
respectivos profissionais. Nos casos em que a pessoa contatada no era totalmente
ligada s atividades de tratamento dos materiais digitais, aplicava-se o primeiro
roteiro semi-estruturado. O segundo roteiro era usado apenas nos casos em que a
interao se realizou com os respondentes previamente identificados.
Nas respostas aos questionamentos propostos, pretendeu-se detectar
novas variveis que no houvessem sido contempladas no quadro conceitual que a
reviso da literatura sugeriu. Os temas e assuntos discutidos encontravam-se
relacionados, em menor escala, s expectativas dos responsveis pelas colees

44
56 Reunio Anual da SBPC, 2004, Cuiab, MT.
45
XIV SNBU Seminrio Nacional de Bibliotecas Universitrias, 2006, Salvador, BA.
46
58 Reunio Anual da SBPC, 2007, Belm, PA.



248
digitais consideradas como materiais importantes para a instituio, considerando o
perfil cientfico e tecnolgico.
O Quadro 19 mostra o local das entrevistas com os representantes das 24
unidades de pesquisa e os tipos de entrevistas realizadas no perodo de 2004 a
2007.

Caractersticas da entrevista Unidade
de
pesquisa
Local da entrevista Entrevistado Entrevista
AEB
Arquivo (Braslia, DF)
Informtica (Braslia, DF)
Diretoria (Braslia, DF)
SBPC (Cuiab, MT)
SBPC (Cuiab, MT)
Tcnico
Tcnico
Pesquisador
Tcnico
Tcnico
Individual
Individual
Individual
Em grupo
Em grupo
CBPF
SBPC (Cuiab, MT)
Biblioteca (Rio de Janeiro, RJ)
Biblioteca (Rio de Janeiro, RJ)
Biblioteca (Rio de Janeiro, RJ)
Biblioteca (Rio de Janeiro, RJ)
Tcnico
Bibliotecria
Bibliotecria
Tcnico
Tcnico
Individual
Em grupo
Em grupo
Em grupo
Em grupo
Ceitec SBPC (Belm, PA) Pesquisador Individual
CenPRA
Biblioteca (Campinas, SP)
Biblioteca (Campinas, SP)
Biblioteca (Campinas, SP)
Biblioteca (Campinas, SP)
SBPC (Cuiab, MT)
Bibliotecria
Pesquisador Responsvel
Pesquisador
Pesquisador
Tcnico
Em grupo
Em grupo
Em grupo
Em grupo
Individual
Cetem
Biblioteca (Rio de Janeiro, RJ)
Informtica (Rio de Janeiro, RJ)
Informtica (Rio de Janeiro, RJ)
SBPC (Cuiab, MT)
SBPC (Cuiab, MT)
Bibliotecria Responsvel
Profissional de CI
Tcnico
Pesquisador
Tcnico
Individual
Individual
Individual
Em grupo
Em grupo
CGEE
Centro de Informao (Braslia, DF)
Centro de Informao (Braslia, DF)
Centro de Informao (Braslia, DF)
Centro de Informao (Braslia, DF)
SBPC (Cuiab, MT)
Profissional de CI
Tcnico Responsvel
Tcnico
Tcnico
Tcnico
Em grupo
Em grupo
Em grupo
Em grupo
Individual
Cnen
Biblioteca (Rio de Janeiro, RJ)
Biblioteca (Rio de Janeiro, RJ)
SBPC (Cuiab, MT)
Bibliotecria Responsvel
Pesquisador
Tcnico
Individual
Individual
Individual
CNPq
Biblioteca (Braslia, DF)
Centro da Memria (Braslia, DF)
SBPS (Cuiab, MT)
Bibliotecria Responsvel
Pesquisador Responsvel
Tcnico
Individual
Individual
Individual
Finep
Biblioteca (Rio de Janeiro, RJ)
Biblioteca (Rio de Janeiro, RJ)
Informtica (Rio de Janeiro)
SBPC (Cuiab, MT)
Bibliotecria Responsvel
Bibliotecria
Tcnico
Tcnico
Em grupo
Em grupo
Individual
Individual
Ibict
Biblioteca (Braslia, DF)
Informtica (Braslia, DF)
SBPC (Cuiab, MT)
Bibliotecria Responsvel
Tcnico
Tcnico
Individual
Individual
Individual
IDSM
SBPC (Belm, PA)
SBPC (Cuiab, MT)
SBPC (Cuiab, MT)
Tcnico Responsvel
Tcnico
Tcnico
Individual
Em grupo
Em grupo
Impa
Biblioteca (Rio de Janeiro)
Biblioteca (Rio de Janeiro)
Biblioteca (Rio de Janeiro)
SBPC (Cuiab, MT)
Bibliotecria Responsvel
Bibliotecria
Tcnico
Tcnico
Individual
Individual
Individual
Individual
Inpa
SBPC (Belm, PA)
SBPC (Belm, MT)
SBPC (Cuiab, MT)
Bibliotecria Responsvel
Tcnico
Tcnico
Em grupo
Em grupo
Individual
Inpe
SNBU (Salvador, BA) e
Biblioteca (So Jos dos Campos, SP)
Biblioteca (So Jos dos Campos, SP)
Biblioteca (So Jos dos Campos, SP)
SPBC (Cuiab, MT)
Bibliotecria Responsvel

Bibliotecria
Pesquisador
Pesquisador
Individual
Em grupo
Em grupo
Em grupo
Individual

Continua


249


Caractersticas da entrevista
Unidade
de
pesquisa
Local da entrevista
Entrevistado
Local da
entrevista
Insa
SBPC (Belm, PA)
SBPC (Belm, PA)
Tcnico
Pesquisador
Individual
Individual
INT
Biblioteca (Rio de Janeiro, RJ)
Biblioteca (Rio de Janeiro, RJ)
Informtica (Rio de Janeiro, RJ)
SBPC (Cuiab, MT)
Profissional de CI Responsvel
Bibliotecria
Tcnico
Tcnico
Individual
Individual
Individual
Individual
LNA
Biblioteca (Itajub, MG)
Biblioteca (Itajub, MG)
Biblioteca (Itajub, MG)
Biblioteca (Itajub, MG)
Biblioteca (Itajub, MG) e
SBPC (Cuiab, MT)
Bibliotecria
Tcnico Responsvel
Pesquisador
Pesquisador
Tcnico
Em grupo
Individual
Em grupo
Em grupo
Em grupo
Individual
LNCC
Biblioteca (Petrpolis, RJ)
Informtica (Petrpolis, RJ)
SBPC (Cuiab, MT)
Bibliotecria Responsvel
Tcnico
Tcnico
Individual
Individual
Individual
LNLS-
ABTLuS
Biblioteca (Campinas, SP)
Depto. Cientfico (Campinas, SP)
SBPC (Cuiab, MT)
Bibliotecria Responsvel
Pesquisador
Tcnico
Individual
Individual
Individual
Mast
Biblioteca (Rio de Janeiro, RJ)
Biblioteca (Rio de Janeiro)
Biblioteca (Rio de Janeiro, RJ)
SBPC (Cuiab, MT)
Arquivo (Rio de Janeiro, RJ)
Arquivo (Rio de Janeiro, RJ)
Bibliotecria Responsvel
Bibliotecria
Tcnico
Pesquisador
Tcnico
Tcnico
Individual
Individual
Individual
Individual
Em grupo
Em grupo
Mpeg
Biblioteca (Belm. PA)
SBPC (Cuiab, MT)
SBPC (Belm, PA)
Bibliotecria Responsvel
Tcnico
Tcnico
Individual
Individual
Individual
Nuclep
Comunicao (Itagua, RJ)
Comunicao (Itagua, RJ)
Informtica (Itagua, RJ)
Pesquisadora
Tcnico
Tcnico
Em grupo
Em grupo
Individual
ON
Biblioteca (Rio de Janeiro, RJ)
SBPC (Cuiab, MT)
Bibliotecria
Tcnico
Individual
Individual
RNP
Sala de Reunies (Rio de Janeiro, RJ)
Sala de Reunies (Rio de Janeiro, RJ)
Sala de Reunies (Rio de Janeiro)
SBPC (Cuiab, MT)
Profissional de CI Responsvel
Tcnico
Tcnico
Tcnico
Em grupo
Em grupo
Em grupo
Individual
Quadro 19 Listagem de entrevistados das unidades de pesquisa do MCT

Foram entrevistados 19 responsveis de 18 centros de informao e
biblioteca sendo que, um instituto contava com dois responsveis, um pela biblioteca
e outro pelo Centro de Memria (CNPq). Apenas dois responsveis pelas bibliotecas
e centros de informao visitados no foram encontrados para a realizao das
entrevistas.
Uma caracterstica das 90 entrevistas realizadas que 54 delas foram
individuais e 36 em grupo. Quatorze dos 19 responsveis pelos centros de
informao e bibliotecas foram entrevistados individualmente, sendo que um deles
foi entrevistado tambm em grupo (Inpe). Os outros cinco responsveis foram
abordados em entrevistas em grupos reunidos durante os encontros cientficos e nas
visitas aos locais de trabalho das 88 pessoas participantes da pesquisa.


250
O desenvolvimento das cinco entrevistas em grupo no foi definido
previamente pelo pesquisador devido, a que elas aconteceram de forma espontnea
por deciso dos prprios entrevistados na hora e local de abordagem.
Apesar de 11 dos entrevistados de quatro das unidades de pesquisa
visitada no possurem centro de informao ou biblioteca (AEB, Nuclep, Insa e
Ceitec), os respondentes foram caracterizados como representantes de setores-
chave das instituies procuradas, a saber: diretorias, arquivo, informtica e
comunicao.


4.3.1 Perfil profissional dos entrevistados


A caracterizao dos entrevistados tem em comum o escopo das suas
atividades voltado ao tratamento da informao tcnico-cientfica, embora houvesse
casos em que as funes de alguns pudessem ser classificadas em um ou mais
setores. Por exemplo, um pesquisador ocupar um cargo na rea de informtica e ao
mesmo tempo colaborar ativamente no desenvolvimento de projetos de
gerenciamento de informao (Inpa e CNEN) ou, no caso inverso, um bibliotecrio
lidar com a infra-estrutura da montagem de um servidor de dados de pr-prints na
instituio (Impa).
Como mostrado no item sobre o universo da pesquisa (3.2), foram
entrevistados 19 responsveis pelas bibliotecas e centros de informao de 20
unidades que contam com esse servio (o CNPq conta com dois responsveis, um
pela biblioteca e outro pelo Centro de Memria). Estes estavam includos no grupo
de 88 pessoas entrevistadas neste estudo.
O Quadro 20 disponibiliza a listagem completa de profissionais e
pesquisadores abordados durante a pesquisa de campo, ordenados segundo o setor
onde atuam.







251
Unidade de
pesquisa
Setor do instituto Profisso/funo
AEB
Arquivo
Informtica
Comunicao
Comunicao
Diretoria
Tcnico
Tcnico de informtica
Tcnico
Tcnico
Pesquisador
CBPF
Biblioteca
Biblioteca
Informtica
Informtica
Comunicao
Bibliotecria
Bibliotecria
Tcnico de informtica
Tcnico de informtica
Tcnico
Ceitec Comunicao Pesquisador
CenPRA
Biblioteca
Biblioteca
Pesquisa
Pesquisa
Comunicao
Bibliotecria
Pesquisador
Pesquisador
Tcnico
Tcnico
Cetem
Biblioteca
Informtica
Informtica
Comunicao
Comunicao
Bibliotecria
Cientista da Informao
Tcnico de informtica
Pesquisador
Tcnico
CGEE
Centro de Informao
Centro de Informao
Centro de Informao
Informtica
Comunicao
Cientista da informao
Tcnico de informao
Tcnico de informao
Tcnico de informtica
Tcnico
Cnen
Biblioteca
Informtica
Comunicao
Bibliotecria
Pesquisador
Tcnico
CNPq
Biblioteca
Centro da Memria
Comunicao
Bibliotecria
Pesquisador
Tcnico
Finep
Biblioteca
Biblioteca
Informtica
Comunicao
Bibliotecria
Bibliotecria
Tcnico de informtica
Tcnico
Ibict

Biblioteca
Informtica
Comunicao
Bibliotecria
Tcnico de informtica
Tcnico
IDSM
Servio de Informao
Comunicao
Comunicao
Tcnico de informao
Tcnico
Tcnico
Impa
Biblioteca
Biblioteca
Informtica
Comunicao
Bibliotecria
Bibliotecria
Tcnico de informtica
Tcnico
Inpa
Biblioteca
Comunicao
Comunicao
Bibliotecria
Tcnico
Tcnico
Inpe
Biblioteca
Biblioteca
Pesquisa
Comunicao
Bibliotecria
Cientista da Informao
Pesquisador
Pesquisador
Insa
Comunicao
Diretoria
Tcnico
Pesquisador
INT
Biblioteca
Biblioteca
Informtica
Comunicao
Bibliotecria
Bibliotecria
Tcnico de informtica
Tcnico
LNA
Biblioteca
Biblioteca
Informtica
Pesquisa
Comunicao
Bibliotecria
Tcnico de informao
Pesquisador
Pesquisador
Tcnico
LNCC
Biblioteca
Informtica
Comunicao
Bibliotecria
Tcnico de informtica
Tcnico


Continua



252

Unidade de
pesquisa
Setor do instituto Profisso/funo
LNLS-
ABTLuS
Biblioteca
Depto. Cientfico
Comunicao
Bibliotecria
Pesquisador
Tcnico


Mast
Biblioteca
Biblioteca
Informtica
Comunicao
Arquivo
Arquivo
Bibliotecria
Bibliotecria
Tcnico de informtica
Pesquisador
Tcnico
Tcnico
Mpeg
Biblioteca
Editorao
Comunicao
Bibliotecria
Tcnico
Tcnico
Nuclep
Comunicao
Comunicao
Informtica
Pesquisadora
Tcnico
Tcnico
ON
Biblioteca/DID
Comunicao
Bibliotecria
Tcnico
RNP
Biblioteca/DGI
Informtica
Informtica
Comunicao
Cientista da Informao
Tcnico de informtica
Tcnico de informtica
Tcnico
Quadro 20 Entrevistados por setor das unidades de pesquisa do MCT

No decorrer das entrevistas tornou-se evidente que os respondentes
trabalhavam em setores diferentes do mesmo instituto e em projetos relacionados
com o tratamento da informao cientfica. Alm dos setores de biblioteca e arquivo,
que seriam os lugares indicados para os trabalhos de preservao digital, os
respondentes eram oriundos dos setores de informtica, comunicao, editorao,
pesquisa relacionada temtica da instituio e diretorias.
A variedade de locais de trabalho dos participantes mostra que a tcnica
usada para obter informao procurou se beneficiar dos anos de experincia dos
profissionais e conseguir, dessa maneira, uma perspectiva mais ampla do que a dos
responsveis pelos acervos digitais.
Um grupo de pessoas que no haviam sido identificadas por meio do
questionrio foi o formado por 14 pesquisadores. Tratava-se de pessoas que tinham
desenvolvido ou realizavam projetos relacionados com o setor de biblioteca da
instituio chegando, em alguns casos, a serem responsveis pelo centro de
informao (CenPRA e CNPq). Os demais mantinham participao nos setores de
informtica, comunicao e pesquisa. Eles contriburam com muitas informaes
contextuais, mas para este estudo foram utilizadas apenas aquelas ligadas ao tema
da preservao digital.
Os dados coletados e as opinies dos entrevistados permitiram
estabelecer um tipo de padro no quesito necessidade de prticas de preservao


253
digital, que no havia sido detectado nos questionrios, e a definio de novos
nveis de aprofundamento que pudessem ser alcanados por meio da observao e
da anlise etnogrfica de contedo.


4.3.2 Anlise dos contedos das entrevistas


A metodologia de anlise do contedo das entrevistas levou em
considerao a necessidade de organizar os respondentes em grupos para que,
dessa forma, fosse detectado o eixo comum nas respostas dadas aos
questionamentos. No Quadro 21 esto apresentados os respondentes, segundo a
funo e a instituio de origem.




















Quadro 21 - Funo dos entrevistados nas unidades de pesquisa


As respostas dos 88 entrevistados foram agrupados em cinco categorias
de respondentes definidas, segundo a esfera de ao profissional de origem, a
saber:
Funo Unidade de Pesquisa Total
Arquivista Mast, AEB 3
Bibliotecrio Impa, Inpe, CBPF, Mast, ON, CenPRA, Finep, LNA, INT 10
Bibliotecrio
responsvel
Ibict, Impa, Mpeg, Inpe, Cnen, LNCC, LNLS, Mast, Finep, CNPq,
Cetem, Inpa
12
Pesquisador Inpe, Cnen, LNLS, Mast, CenPRA, LNA, Cetem, AEB, Nuclep,
Insa, Ceitec
14
Pesquisador
responsvel
CenPRA, CNPq 2
Profissional de CI Cetm, CGEE 2
Profissional de CI
responsvel
RNP, INT 2
Tcnico Ibict, Impa, Mpeg, CBPF, Cnen, LNCC, LNLS, ON, CenPRA,
Finep, CNPq, LNA, RNP, Cetem, INT, Inpa, CGEE, IDSM, AEB,
Nuclep, Insa
24
Tcnico de biblioteca Impa, Mast, CGEE 3
Tcnico de informtica Ibict, CBPF, LNCC, Mast, Finep, RNP, Cetem, INT, CGEE, AEB,
Nuclep
13
Tcnico responsvel LNA, CGEE, IDSM 3


254
1. grupo 1: formado por bibliotecrios responsveis pelas bibliotecas,
bibliotecrios auxiliares, profissionais da cincia da informao e tcnicos
de biblioteca (total = 28 pessoas);
2. grupo 2: integrado por tcnicos responsveis pelas bibliotecas e tcnicos
em geral de diferentes reas (total = 27 pessoas);
3. grupo 3: formado por pesquisadores de vrias reas do conhecimento
responsveis por bibliotecas e pesquisadores em geral (total = 17
pessoas);
4. grupo 4: com tcnicos de informtica (total = 13 pessoas);
5. grupo 5: formado por 3 arquivistas.

Constatou-se que a maioria dos respondentes do grupo 2, que tinham
funes e cargos de tcnicos, foram os que evidenciaram maior participao nas
entrevistas em eventos cientficos. Os dois tcnicos responsveis (CGEE e LNA) e
os membros dos outros quatro grupos foram abordados principalmente nas
entrevistas nas sedes das instituies. As respostas das entrevistas em grupo foram
transcritas, e as manifestaes de cada um dos respondentes separadas de acordo
com essa tipologia.


4.3.2.1 Sobre as prprias funes e atividades de preservao


Na cronologia das entrevistas foi possvel constatar que os contatos com
os grupos ficaram muito dirigidos s caractersticas locais, e que os representantes
desses grupos de entrevistados no tiveram dificuldade em mencionar algumas das
suas preocupaes com relao ao material cientfico que deveria ser preservado e
sobre as necessidades da existncia de projetos de preservao digital.
- Os projetos do instituto tm muita documentao que no est registrada.
So informaes que so importantes para a histria da instituio. Ns
estamos preocupados no com o nmero, mas na preservao da
memria. Os editais agora mencionam a preservao da memria, tem
projetos no CNPq, no Mast e no INT, mas voc tem que ter profissionais
com essa viso da necessidade. No Mast esto preocupados no apenas
em preservar, mas em ensinar s pessoas sobre a preservao.
(Bibliotecria responsvel 1)



255
- No temos atividade de preservao. A gente at ficou preocupada. Ns
atuamos em uma rea em que tnhamos um grande especialista, mas essa
pessoa faleceu e muitas coisas ficaram com ele, as informaes no foram
repassadas. Hoje a preocupao existe em termos no de guardar, mas
que exista um processo de continuidade do conhecimento, de a gente
repassar o que produziu. (Pesquisador geral 2)

- No temos essa discusso de preservao de longo prazo. Essa
competncia foi distribuda para cada secretaria de coordenao; o
pesquisador pertence a essa secretaria, isso repassado para as
bibliotecas da rea e nossa inteno que estejam disponibilizados
eletronicamente outros trabalhos dos pesquisadores, por isso uma
comisso foi constituda para ter mnimas regras dessa distribuio, uma
comisso de pesquisadores. Se cada instituio tiver uma definio de
como vai trabalhar com isso, ela vai ter as coisas mais arrumadas.
(Tcnico geral 12)

- No necessrio fazer nenhuma atividade de preservao do material
cientfico publicado por que ele pertence a grandes bancos internacionais e
no precisamos mant-lo. A nica preocupao que eu tenho de manter
o registro da apario do Laboratrio na mdia, a parte da pesquisa no
necessria. Mas ns temos tudo muito bem catalogado, porque quando um
astrnomo pede tempo de uso de telescpio, ns fazemos uma triagem de
como tem sido o aproveitamento desse tempo, e se ele est publicando
com esses dados ou no. A biblioteca faz essa triagem e as comisses de
pedido de tempo tm uma secretaria que concentra num banco de dados
todo o uso de todos os pesquisadores envolvidos em projetos. Temos outro
banco de dados de manuais tcnicos preservado na nossa instituio.
(Pesquisador geral 3)

- De 2000 para c j est tudo digitalizado, as teses e os artigos, os
trabalhos apresentados em colquios so entregues em formato digital. A
poltica foi de que, a partir de 2000, tudo tem de estar em formato digital. O
que for antes disso, decidiu-se que no ia se fazer nada, apenas guardar
em papel. Porque achou-se que no valia a pena. No existe nenhum
projeto de preservao, at houve oramento numa poca, feito para uma
empresa que estava interessada em fazer. Mas eles no se interessaram,
acharam que as coisas com mais qualidade acabam sendo publicadas em
revistas e que so preservadas de alguma forma. (Tcnico geral 13)

- Aqui no Centro estamos caminhando para todo mundo ter os mesmos
formatos e catlogo entre as unidades vinculadas. Mas aqui no temos
nenhuma coleo da biblioteca que esteja digitalizada, tudo est em papel.
O projeto Memria est comeando, tudo o que foi escrito pelos
pesquisadores daqui e os que os estrangeiros que escreveram sobre o
Centro. O portal que vai ser lanado neste ano vai ter um link para a
produo cientfica, com o que seria uma base de dados com referncias
aos trabalhos desses autores. (Bibliotecria responsvel 3)

- Em termos de preservao das colees eletrnicas nunca pensei nisso,
ningum nunca me cobrou nada a esse respeito. (Tcnico geral 12)

A percepo e a confirmao de que o lugar das atividades de
preservao seria na biblioteca estiveram presentes nas falas, mesmo naquelas em
que esse setor no existia.
- O responsvel pela preservao dos relatrios dos projetos o Setor de
Documentao. (Tcnico geral 2)



256
- A responsvel pela preservao a biblioteca. (Tcnico geral 4)

- A responsvel pela guarda da produo a Diretoria Tcnico Cientfica.
(Tcnico geral 5)

- A responsvel pela preservao da produo cientfica a Biblioteca.
Cada ano temos um ciclo de cursos e palestras. (Tcnico geral 11)

- Eu acho que tudo que ns fazemos deve ser preservado, a memria
tcnica muito importante. As coisas mais antigas ainda esto em papel,
isso deveria ser tratado e disponibilizado, se bem que algumas coisas no
deveriam ser disponilizadas porque so projetos terceirizados. Mas
importante que eles sejam preservados pela biblioteca porque at dentro
do prprio desenvolvimento do centro isso no pode ser disponibilizado em
congressos, mas elas podem estar disponveis para outros pesquisadores
que querem utilizar essas informaes para determinado estudo.
(Pesquisador geral 2)

Como outras pesquisas internacionais mostraram (WHEATLEY;
BEAGRIE; BRADLEY, 2004), as organizaes no garantem recursos especficos
para a preservao digital, sendo isso considerado uma das maiores ameaas
permanncia dos documentos digitais. Os comentrios sobre a realidade das
bibliotecas e centros de informao apontaram as condies do servio pblico
como obstculo para a continuidade dos trabalhos de preservao. Isso ficou
evidente nas observaes de 80% dos entrevistados.
- No existe um compromisso de guardar informaes. Principalmente
hoje, com esse nvel de xodo que est atingindo o servio pblico, no se
consegue repor o pessoal para ter o controle melhor das coisas. Cada ano
que passa parece que mais pessoas tm de fazer o papel de vrias
pessoas ao mesmo tempo. Isso prejudica o trabalho, a qualidade do
trabalho e o nvel da informao que est sendo preservada. (Tcnico geral
3)

- No Museu temos 30 anos de acervo do CNPq, ns disponibilizamos,
criamos um livro e um CD-ROM, pessoas que querem saber a histria do
CNPq consultam l. Mas somos poucas pessoas para processar tanta
informao. (Tcnico de biblioteca 1)

- A biblioteca foi desativada faz tempo, mais ou menos seis anos, ela est
sendo reativada aos poucos, mas perdeu-se muita coisa dentro dessa
paralisao no referente renovao de publicaes, por exemplo.
(Tcnico geral 3)

- Ns no temos biblioteca, quem cuida das informaes a rea da
comunicao social, quem guarda cada diretoria, a guarda no
centralizada. Tudo est em formato digital. Dentro da rea da
administrao temos uma pessoa que responsvel por guardar todas as
informaes em papel. (Tcnico geral 10)

- No Centro cada grupo de pesquisa tenta conseguir financiamento, e eles
so responsveis pela preservao dos equipamentos e pela
documentao desses projetos. (Tcnico geral 8)



257
As atitudes dos entrevistados com relao a essas barreiras apresentam
uma noo geral de que a informao produzida nessas unidades deveria ser
acessada, tambm identificaram os desafios de trabalhar em colaborao com
outras unidades e centros internacionais de pesquisa.
- O que importa que de fato h uma preocupao em atender de maneira
rpida qualquer pedido de artigo cientfico de uma pesquisa que tenha sido
realizada no Laboratrio. (Tcnico geral 4)

- A poltica do Instituto sempre foi de divulgao de seus resultados.
Recebemos 12 mil pessoas anualmente. (Bibliotecrio responsvel 1)

- O projeto da Memria da Cincia do CNPq foi do vice-presidente do
CNPq, que na poca esteve no Museu antes de montar esse projeto. Ele
esteve conversando com os pesquisadores, pediu textos, e com essas idas
ao Museu e textos ele fortificou a idia para desenvolve-la no CNPq. Se
esse trabalho hoje existe, a base dele foi toda pega no Museu de
Astronomia. (Tcnico de biblioteca 1)

- Ns interagimos com pesquisadores, eles entram no nosso site e
encontram informaes que j temos armazenadas em fita. Quando existir
o observatrio Virtual Brasileiro, que vai estar conectado ao Observatrio
Virtual Mundial, a sim vai haver instituies colaborando, mas ser um
trabalho gigantesco porque vai exigir que padronizemos dados com outros
pases. (Bibliotecria auxiliar 1)

- Todos os memorandos tcnicos, alm de estarem no formato em papel e
digital, backups esto disponveis em outras instituies. Toda a produo
tcnico-cientfica est em linha; os cientistas deixam sua produo
depositada na biblioteca. (Tcnico geral 4)

- A biblioteca est sendo informatizada para digitalizar o acervo de teses;
ainda no temos isso, no temos oramento, nem gente suficiente. O
Observatrio sedia e coordena um banco de dados ambientais para a
indstria, em um projeto que envolve outras instituies de ensino e
pesquisa. (Tcnico geral 11)


Em entrevistas com pesquisadores e tcnicos participantes de projetos de
preservao digital, fica evidente a dificuldade encontrada por eles, pelo fato de ser
uma iniciativa que comeou por interesse pessoal.
- Em 1995, um pesquisador localizou um software para montar um
simpsio e descobriu que ele podia ser usado para uma biblioteca digital.
Migramos todos os registros que estavam no Microisis com toda a coleo
dos anos 1960 a 2006, com 12.400 registros; 6 mil eram texto completo.
Alguns foram digitalizados a partir de 2000. Com a obrigatoriedade de
depositar a tese na Biblioteca Digital, j temos 583 teses. Agora a
Biblioteca Digital, alm de ser um repositrio que guarda a memria
cientfica, serve para o planejamento de gesto do instituto. Temos tudo
digitalizado de cada rea do Programa Espacial. E agora estamos entrando
na gesto dos arquivos. (Bibliotecria responsvel 1)

- Todo o meu tempo, como voc pode imaginar, foi absorvido para a
montagem desse software; agora talvez, com muita coisa finalizando, eu
vou ter mais tempo para fechar uma espcie de pacote; ele j esta
disponvel na web desde o incio, o problema personaliza-lo para isso que


258
voc precisa. A pessoa precisa ter conhecimento do sistema operacional,
se vai instalar em Linux, porque em Linux existem problemas de
permisses, e isso delicado. Depois o software foi desenvolvido em
linguagem TCL, o prprio banco de dados eu fiz no TCL uma linguagem
muito simples e limpa, comparada com PERL ou PHP, ela muito enxuta e
rpida, mesmo sendo uma linguagem interpretada que normalmente mais
lenta. Eu no esperava que fosse funcionar, quando comecei a usar TCL,
eu no tinha idia do potencial, mas at hoje est sendo bem til.
(Pesquisador geral 1)

- No Instituto temos outros profissionais que trabalham com preservao
digital. Tem o professor Bergamini, que trabalhou com a professora Katia
Thomaz sobre a norma OAIS. Esse trabalho foi o apndice da traduo da
norma ISO. O professor Banon fez a reviso que faz parte do apndice.
(Bibliotecria responsvel1)

- O Laboratrio comeou para valer a fazer cincia em julho de 1997,
quando o equipamento entrou em operao. As reas que vieram depois
so muito recentes, tem a biologia molecular estrutural e as nanocincias,
todas muito novas e com pouco acervo. (Tcnico geral 4)

- A rea muito especfica, a biblioteca no tem uma demanda muito
grande do pblico externo, quem procura so poucas pessoas e as
bibliotecrias do conta de fazer esse servio. Fazem o controle interno da
memria tcnica quanto aos pedidos dos pesquisadores. Elas so
responsveis pela divulgao da produo cientfica (Tcnico geral 6)

- Eu acho que uma das coisas mais difceis de voc determinar, igual em
uma casa, o que que voc vai guardar, o que prioritrio. Como so
produes de indivduos, a minha produo sempre vai ser mais importante
para mim, para te dizer a verdade. uma coisa humana. (Tcnico geral 12)



4.3.2.2 Sobre o tratamento dos objetos digitais na instituio


Os entrevistados informaram os formatos dos arquivos que os
pesquisadores usam mais frequentemente na produo dos documentos digitais, os
quais seriam: PDF, HTML, Word, PPS, LATEX, JPG, GIF. As referncias a algum
tipo de tratamento desses objetos digitais evidenciaram sugestes de solues
tecnolgicas prprias, sendo que a maioria delas no considera a necessidade de
concordncia com os modelos de preservao digital OAIS e TDR.
- Os documentos esto em um banco de dados administrado por uma
equipe de pesquisadores e coordenadores. A Diretoria Tcnico-Cientfica
a encarregada desse arquivamento da produo para ser publicada
tambm. Ela tem diversas linhas de pesquisa e cada programa de pesquisa
tem seu arquivo. Tudo est em formato digital, impresso e em arquivos em
CD e disquete. (Tcnico geral 5)

- Toda a documentao que se produz na rea de engenharia
armazenada em um sistema nosso de documentao. Na rea da
segurana tambm acontece, um trabalho operacional e de rotina


259
documentado e armazenado no nosso sistema interno. A gente quer
resgatar algumas informaes da histria da Rede e publicar, porque para
ns isso faz muita falta, e os prprios usurios desconhecem o contedo
do sistema. (Tcnico geral 7)

- Na biblioteca do Centro ns temos um sistema que a memria tcnica
desenvolvido por um analista que esteve aqui como bolsista, e todos
nossos relatrios tcnicos, depois de digitalizados, passam pela biblioteca .
O pesquisador entrega em formato Word e a secretria da coordenao
transforma em formato PDF e chega para a biblioteca para padronizao. A
memria tcnica comeou em 2002, mas est apenas na intranet. Os
dados referenciais desde 1978 foram migrados, mas o texto completo
ainda no. Tnhamos um projeto de digitalizao, mas nunca chegou verba
para isso. (Bibliotecria responsvel 2)

- Antes tudo era em papel. Agora a maior parte da produo cientfica est
em formato digital. O Instituto tem uma biblioteca digital com registros
desde 1984, onde temos todas as publicaes editadas pelo Instituto.
Temos um arquivo dos dados desde que o Instituto foi criado. Ele nasceu
como um repositrio, um servio de divulgao. No final dos anos 1980,
usamos o Microisis da Bireme para melhorar aquela base, nela a produo
cientfica passou a ter resumo e referncias. Nessa mesma poca
passamos a trabalhar toda a produo retrospectiva. Desde 2001, temos
uma tabela que todo documento depositado precisa seguir; ele vai pela
rea, pelo grupo e pelo tipo. Assim, o que vai aparecer para o usurio o
artigo e a apresentao do material audiovisual, caso seja um trabalho em
evento. (Bibliotecria responsvel 1)

Como destacado na reviso da literatura, as abordagens tecnolgicas de
preservao esto direcionadas ao acesso permanente (THIBODEU, 2002). No
Brasil, o Inpe se destaca pelo nmero de solues propostas para a preservao
digital implementada, tanto por tipo de material como pelo tipo de mecanismo que
garante o acesso permanente aos documentos.
- Quando quis integrar o trabalho dos grupos de pesquisa, eu imaginei o
identificador e a partir da constru a biblioteca digital, se no tivesse esse
identificador no teria essa biblioteca. Primeiro usamos o e-mail como
identificador, mas agora passou a ser usado o nome do computador. A
diferena com o DOI e com o Handle que voc no depende de acordo
com ningum. Voc pode identificar seus identificadores e no existe
conflito. Qualquer um pode usar o identificador persistente, apenas deve
seguir uma regra muito simples, basta seguir o nome do domnio, nome da
mquina, e-mail da pessoa ou domnio do computador. Com isso voc cria
uma identidade para cada trabalho depositado. O sistema permite a
estruturao dos acervos. Podem ser reagrupados dois acervos. Voc
pode encapsular, por exemplo, teses com dissertaes. Com os
identificadores, pode-se achar o documento que foi encapsulado.
(Pesquisador geral 1)

- A Biblioteca Digital est guardada hoje em 12 computadores; compramos
um servidor Sun em 1998, com oramento da Fapesp, e a partir da
decidimos centralizar os servidores que tem cada um dos servios da BD,
sendo criada a subdiviso dos servios. No temos espelhamento,
propomos isso ao MCT desde 2004, mas no houve resposta. Temos uma
mquina de segurana que o Grupo de Segurana do Inpe teve a
preocupao de criar. (Bibliotecria responsvel 1)



260
- Tambm temos o acervo de pre-prints, que uma tendncia interessante;
estamos fazendo o trabalho e ele fica preservado. Se o autor decide o que
vai fazer com ele, primeiro deposita uma cpia pr-print, e ela vai ser
preservada quando ele for publicado. (Bibliotecria responsvel 1)

- As fotografias esto em parte digitalizadas, a histria oral est guardada
em DVD e estamos com um estudo pronto para a produo multimdia.
(Bibliotecria responsvel 1)

Para evitar que as informaes sejam corrompidas, as tcnicas de
preservao devem iniciar no momento da criao do objeto digital (HODGE, 2000).
Nas unidades de pesquisa, a sistematizao dos processos de tratamento dos
arquivos digitais comea a ser aplicado, ainda que a maioria contemple apenas a
parte que concerne ao depsito de documentos.
- Toda a produo est em formato digital. (Tcnico geral 1)

- Em termos de publicaes, a nica coisa que fizemos a partir de certo
momento comear a digitalizar tudo o que podia. (Pesquisador geral 2)

- A gente no recebe nada em papel tudo vem atravs de formulrio
eletrnico desde 2002. Temos n procedimentos s via formulrio na
pgina eletrnica. No aceitamos que ningum entregue disquete ou pelo
correio. Pelo menos j evolumos bastante, os pesquisadores do
laboratrio j fazem tudo no formato Latex especfico para essa rea, o que
sistematizou bem o depsito dos trabalhos. (Tcnico geral 4)

- Todas as sries esto em formato digital e os livros esto sendo
escaneados e convertidos para PDF e disponibilizados nas pginas do
Centro. Os relatrios esto sendo armazenados em disquete, em CD.
(Tcnico geral 6)

- No CNPq no se trabalha mais com papel, todas as informaes de
resultados de pesquisa ficam armazenadas em formato eletrnico. (Tcnico
geral 9)

Constatou-se, tambm, a noo geral existente entre os tcnicos de
informtica, de que a preservao digital seria apenas alguma coisa relacionada
com a manuteno de cpias de segurana.
- O Servio de Documentao e Arquivo recebe e a Informtica faz uma
cpia de segurana. Os responsveis pela preservao seriam as reas
tcnicas, mas futuramente passar para a Informtica. (Tcnico informtica
9)

- Os backups so feitos basicamente em fitas, e elas so fisicamente
guardadas em outro local no perto do servidor. Vai ter um prdio para
fazer isso, temos uma outra mquina que faz um backup on-line e est em
outro bloco do instituto. (Tcnico informtica 1)

- Para preservao temos duas mquinas, uma na biblioteca, outra fora do
prdio, na rea de segurana de TI. Trs vezes por semana so feitas as
atualizaes (backup) que ficam em outro prdio. (Tcnico informtica 10)



261
- Quem cuida do banco de dados tem a obrigao de efetuar todo o
procedimento de segurana e migrar para outro banco de dados. O
servidor j faz automaticamente duas vezes por dia, e uma por ms, e ns,
em cima disso, fazemos periodicamente, colocando em outras mquinas.
Deveria ser em outro prdio, mas hoje fica tudo na nossa diviso. Estamos
fazendo cpias em CD e em DVDs. (Tcnico informtica 11)

A necessidade de sistematizar os processos que envolveriam a
preservao da informao cientfica nas unidades foi percebida em poucos
implementadores dos sistemas de gerenciamento de informao entrevistados.
Tambm, alguns profissionais da informao esto preocupados com o uso
extensivo de tecnologias e com seu registro em solues cada vez mais complexas.
No Inpe, a concepo desses sistemas esteve influenciada pela percepo de
repositrios que seguem o modelo OAIS, segundo os principais participantes dos
projetos.
- Nossa biblioteca Digital pode ser exportada por meio do protocolo OAI.
Isso completaria toda a parte de gerenciamento de uma biblioteca digital, a
segurana, a identificao persistente e a interoperabilidade. Quando eu
tomei conhecimento, primeiro foi um empurro do Ibict, recebemos um
carta do Ibict para ver se a gente poderia importar os dados, a eu fui ver o
site do OAI e l estava bem explicado. A gente conseguiu implementar isso
em um ms. Desde 2003, fomos dos primeiros a integrar a Biblioteca
Digital de Teses e Dissertaes (BDTD). O contedo da BD poderia ser
coletado tambm pelo coletador de repositrios OASIS.BR do Ibict.
(Pesquisador geral 1)

- A gente ainda est em busca do modelo ideal de sistematizao de
informao da produo cientfica e de como indexar essa informao,
porque os prprios pesquisadores s vezes adotam modelos americanos,
europeus. (Tcnico geral 4)

- O software do Inpe tem muito a ver com o modelo OAIS. Eu observei que
o OAIS tinha muito conceito que j existia na nossa estrutura de biblioteca
digital, e estamos reutilizando essa metodologia. Nosso sistema parte do
OAIS. O OAIS muito sofisticado. (Pesquisador geral 1)

Como foi mostrado na reviso da literatura (LAVOIE; DEMPSEY, 2004), os
sistemas de preservao digital estariam divididos em nveis, sendo que um deles
incluiria os servios relacionados com permisses de acesso, disseminao e tudo
que fosse ligado s polticas. Nas unidades de pesquisa do MCT, a necessidade de
polticas relacionadas com a preservao dos documentos digitais foi percebida
apenas no Inpe.
- A parte da submisso foi criada com polticas de prazos a cumprir, pois
temos prazos para responder a perguntas estratgicas; mas a busca da
produo no uma coisa simples. Embora tenhamos essa poltica a
cultura no se estabelece, voc tem que ir no corpo a corpo com o
pesquisador e sempre tem que estar perguntando ou checando o Web of
Science. A poltica no garantia de que o cientista vai depositar seu
documento. Estamos criando um servio personalizado no site onde est


262
uma planilha usada na biblioteca digital para ele fazer o depsito l. Ns
estabelecemos os campos das informaes daquilo que no tirar o tempo
do pesquisador, depois a biblioteca completa as informaes que faltam.
(Bibliotecria responsvel 1)

- O Inpe sempre teve polticas de editorao e de preservao, com
normas tcnicas para publicao e depsito. Ns (Inpe) temos uma poltica
de preservao, sempre existiu, mas ela depende do Conselho de
Editorao. A nova verso que est sendo aprovada menciona trs coisas:
a biblioteca digital, o manual de editorao e a obrigatoriedade de depsito
para os autores. Essa obrigatoriedade j existia, mas no era explicita.
(Pesquisador geral 1)

Nas instituies pesquisadas, alm de poucas contarem com pessoal
especializado no tratamento de arquivos digitais, foi detectada a ausncia de um
consenso claro sobre quais seriam as estratgias e os mtodos de preservao
digital a serem aplicados; esses fatores aparecem como barreiras para a efetivao
de aes concretas dentro do Ministrio.
As explicaes para o desenvolvimento lento de projetos de preservao
digital, na rea do gerenciamento da informao cientfica em agncias
governamentais no Brasil, estariam associadas falta de uma aplicao direta de
polticas e tecnologias que sigam padres internacionais e da formao de recursos
humanos.
Finalmente, por meio das entrevistas foi possvel confirmar a existncia da
iniciativa individual e pioneira do Inpe, mesmo com a insuficincia de recursos e o
planejamento fragmentado de atividades de preservao digital dirigidas pelo seu
Servio de Informao e Documentao.


4.4 ANLISE ETNOGRFICA DE CONTEDO


O acompanhamento das diversas etapas administrativas e tcnicas que
envolvem o gerenciamento dos registros digitais permitiu observar as condies
sociais da sua produo e sua comparao com os projetos de preservao digital
propostos na literatura. Tal anlise pode ser efetuada no mbito da cincia da
informao usando uma tcnica de outra rea, como mais uma evidncia da sua
convergncia com outras disciplinas e atividades.


263
Dentre as cincias sociais, a antropologia aquela que tem oferecido mais
exemplos de como a impreciso permeia todas as formas de avaliao da realidade
(GEERTZ, 1988). O levantamento mais perfeito, o mais rigoroso teste estatstico
depende do significado que as palavras, categorias e at nmeros transmitem. A
pesquisa etnogrfica uma das tcnicas de anlise qualitativa mais aproveitada por
diversas reas do conhecimento na busca por interpretaes cientficas da realidade
(CULYBA; HEIMER; PETTY, 2004).
A tcnica Anlise Etnogrfica de Contedo (AEC) foi concebida na rea de
cincias da comunicao, como abordagem para o estudo da origem e uso de
conceitos formulados nas mdias. Na rea de jornalismo, as pesquisas que
aplicaram a tcnica assumiram como propsito a formulao de conceitos em
notcias sobre eventos transmitidos nas mdias como jornais. Os documentos ou
materiais divulgados so definidos como representaes simblicas de informaes
ligadas a situaes complexas.
Por ser um tipo de Anlise Qualitativa de Documentos (AQD), a AEC
envolve exemplos tericos e emergentes de documentos de bases de informao,
desenvolvimento de protocolos para anlise sistemtica e constantes comparaes.
Diferentemente da anlise de contedo tradicional, a AEC interage com as
informaes sem ficar restrita a amostras.
A pesquisa qualitativa de anlise etnogrfica de contedo usa mtodos de
investigao indutivo e dedutivo (ALTHEIDE, 1987), combina a observao com
outros mtodos para triangulao dos dados, para garantir a completa e acurada
descrio de relaes e interaes que ocorrem entre membros de um grupo
(EWING et al., 2003). Entre as vantagens dessa tcnica, citam-se as seguintes:
a) observaes no precisam ser estruturadas ao redor de uma
hiptese;
b) em termos de validade, junto com a observao, ela pode servir
para coletar informao profunda sobre determinado tema ou
comportamento;
c) preocupa-se com uma realidade que no pode ser quantificada,
buscando a compreenso e no a explicao.
A anlise etnogrfica de contedo, definida como [...] the reflexive
analysis of documents [...] (PLUMMER, 1983), faz parte do grupo de modalidades
de pesquisa qualitativa que surgiu na segunda metade do sculo XX, junto com a


264
observao participante e a grounded theory (DENZIN; LINCOLN, 2000). Nessas
duas tcnicas, o pesquisador quer chegar o mais perto possvel do seu objeto, no
intuito de abrir nova perspectiva dentro da situao observada (GLASER, 1978).
Por tratar o processo de amostragem como uma comparao constante,
cujas descobertas so usadas para delinear categorias especficas e narrativas
descritivas, a anlise etnogrfica de contedo est enquadrada no campo da
pesquisa etnogrfica. Nessa abordagem, os dados coletados seguindo alguma
forma de protocolo estruturado podem trazer tona questes cruciais e temas no-
aparentes em uma primeira aproximao, permitindo o retorno aos dados quando
novas perguntas vo surgindo. Tambm, segundo Altheide (1987), a anlise
etnogrfica de contedo pode ser contrastada com a anlise de contedo, no
sentido de esta partir de pressuposies positivistas de objetividade e da
amostragem esttica dos dados.
Seguindo a proposta deste trabalho e um dos seus objetivos especficos
que o de resgatar os conceitos e aplicaes usadas para caracterizar as prticas
de preservao digital (Objetivo especfico 4), utilizou-se a tcnica de anlise
etnogrfica de contedo para examinar as percepes dos envolvidos e, dessa
forma, descobrir temas decorrentes, padres emergentes e processos enfatizados e
adotados.
Tanto na anlise bibliomtrica como na pesquisa de campo, os
documentos publicados por pesquisadores de trs unidades de pesquisa do MCT
foram englobados, considerando seus trabalhos como contribuies na formulao
de definies e recomendaes gerais, para os interessados no tema de
preservao digital. Cabe destacar que, apenas os trabalhos de uma dessas
unidades partiram da aplicao prtica de projetos de preservao digital.


4.4.1 Observaes de campo


Tericos como Selltiz et al. (1975, p. 70) recomendam, como tcnicas de
coleta de dados apropriadas a estudos exploratrios, o exame de registros de
conhecimentos existentes, a entrevista no estruturada e a observao. Para fins


265
desta pesquisa e partindo de uma abordagem essencialmente qualitativa, cada
objetivo especfico deste estudo precisou de mtodos e tcnicas adequadas.
O objetivo da observao das prticas de preservao digital
implementadas nessas instituies de pesquisa pblicas brasileiras era coletar
dados complementares sobre as percepes e aes relacionadas s necessidades
de preservao digital e comparar os resultados com os obtidos em outros estudos
citados na bibliografia.
A pesquisa de campo, que consiste na observao atenta de um objeto
(ou fenmeno) de interesse do pesquisador, envolve tcnicas de coleta e
apresentao de dados e discusses qualitativas dos resultados. A pesquisa de
campo nas sedes dos centros de informao confirmou e incrementou os dados
recebidos nos questionrios enviados via correio eletrnico.
Foram coletadas fotografias, cpias de textos impressos sobre as
instituies e depoimentos gravados. As observaes nos locais visitados foram
registradas em forma de notas e dirios.
Durante as visitas s 20 sedes das unidades de pesquisa do MCT, tornou-
se possvel observar, por curto perodo de tempo, os responsveis pelos centros de
informao e suas equipes, em grupo e individualmente, procurando obter maior
quantidade de dados, apoiando-se no interesse dos entrevistados pelo tema da
pesquisa.
As visitas permitiram uma forma de interao com a maioria das pessoas
identificadas, sendo que todas elas foram agendadas e os respondentes avisados
sobre o teor das visitas. Os encontros com os entrevistados se deram nas
instalaes das bibliotecas e centros de informao, nas salas dos pesquisadores e
de reunies. A maioria dos responsveis pelos centros entrevistados mostrou as
instalaes e apresentou suas equipes. Na maioria dos casos, foi possvel visitar os
setores de arquivo, informtica e as diretorias.
Nos setores de arquivo visitados constatou-se, tambm, no haver
nenhuma atividade de preservao digital expressa por parte das equipes
abordadas. Nos setores de informtica foi possvel observar o local de
armazenamento dos arquivos digitais, algumas das rotinas de cpias de segurana
e uso de bases de dados. De maneira geral foi percebida: a ausncia da aplicao
de um plano estratgico de preservao digital; o uso mnimo de padres


266
internacionais de interoperabilidade e inexistncia de mecanismos que garantissem
a inalterabilidade dos registros digitais.
Nas unidades de pesquisa, as atividades relacionadas com a migrao de
formatos e com as cpias de segurana foram as mais apontadas pelos analistas de
sistemas e de suporte tcnico. Com exceo de uma unidade, nenhuma havia
adotado alguma soluo tecnolgica especificamente voltada preservao dos
documentos digitais.
As prticas de migrao para as novas verses de software que foram
mencionados refletiram a dependncia nas solues proprietrias. Nos casos em
que houve adoo de software livre e que existia preocupao na aquisio de
algum grau de interoperabilidade entre os sistemas, os responsveis pelos centros
manifestaram seu interesse em que essas solues pudessem chegar a ser usadas
na aplicao de estratgias de preservao de longo prazo da informao cientfica
(Protocolo OAI, LOCKSS, DSpace, SEER).
Registraram-se algumas contribuies por parte de grupo tcnico e de
representantes das diretorias, ainda que no lidassem diretamente com a
preservao dos documentos digitais. Elas mostraram outras vises do problema
relacionadas conservao de bens culturais ou de aparelhos tecnolgicos usados
e solues encontradas para o acompanhamento gerencial de projetos, a saber:
- Todos os projetos e relatrios que passam pelo crivo da Fundao
deveriam ser preservados (Tcnico geral 2).

- Os trabalhos dos pesquisadores devem ser preservados. Eu acho que o
levantamento histrico feito do acervo do Museu, que conta a histria no
s da astronomia, mas das cincias no Brasil, um acervo que veio do
Observatrio Nacional e que foi todo tratado, e isso tem de ser digitalizado.
(Tcnico geral 1).

- Tudo deveria ser preservado, principalmente a rea de arqueologia, uma
das reas mais fortes do Museu. Os curadores das colees nos
departamentos e servios ligados s coordenaes so os que lidam com a
conservao. (Tcnico geral 1).

- O que deveria ser preservado no Centro so as diretrizes de atuao, os
guias de procedimentos de trabalho (Tcnico geral 3).

- O Centro criou desde 1992 um sistema de gesto de acompanhamento
de projetos, um sistema que permite o controle do fluxo da informao no
centro gerenciado pela rea de planejamento. (Tcnico geral 3).


Outro aspecto constatado nas visitas foi a pouca meno a padres de
metadados que contemplem a preservao digital nas solues tecnolgicas


267
adotadas. Mesmo nas instituies que denotaram algum grau de preocupao com
a preservao dos documentos digitais o foco se dirigia para a aquisio de material
digital e a promoo de algum tipo de acesso.
- Esse o compromisso bsico de todo pesquisador que tem um projeto
aprovado no Laboratrio, ele no pode se negar a apresentar o resultado
do trabalho dele e deixar uma cpia na biblioteca. (Tcnico geral 11)

- O acesso aos documentos na nossa memria tcnica depende do tipo de
documento, pode ser restrito; a informao aparece na nossa intranet, mas
a permisso chega na biblioteca e a gente consulta pesquisadores se
podem ser acessados. (Bibliotecrio responsvel 5)

- Os textos completos no so colocados na pgina do Laboratrio porque
so muito pesados. Quando algum pede um artigo, a biblioteca envia o
documento. (Tcnico geral 6)

Com a observao nas unidades de pesquisa esperava-se encontrar
percepes e aes que mostrassem a viso local sobre a preservao digital. A
documentao recolhida nas instituies visitadas permitiu acompanhar a alocao
de recursos materiais e humanos nos centros de informao e bibliotecas, e suas
atividades relacionadas com as colees digitais de informao cientfica. Tambm,
foi constatada a natureza dos projetos planejados (Ibict, CBPF) e implementados
(Inpe), com os efeitos das intermitncias das polticas institucionais nas prioridades
de suas administraes.


4.4.2 Os documentos


Na pesquisa de campo foram obtidos materiais publicados nas unidades
de pesquisa e do MCT, procurando encontrar conceitos ligados ao contexto da
preservao digital. Identificaram-se apenas trs tipos de documentos: de
divulgao, oficiais e bibliogrficos.








268
4.4.2.1 Materiais de divulgao


As unidades com mais de uma dcada de existncia tm publicado
materiais sobre o histrico da instituio. Durante a pesquisa de campo se teve
acesso a esses materiais. Percebeu-se que alm da ausncia de um tratamento
padronizado no uso e divulgao de informaes consideradas histricas, os temas
relacionados com a preservao digital no estiveram presentes.
Alm das informaes nas pginas dos portais das unidades na internet,
as instituies j publicaram algum tipo de informao descrevendo a histria da
fundao e suas transformaes no tempo. Essas informaes esto contidas em
livros (Inpa), teses e dissertaes (MPEG, LNLS, Cetem, LNA, Ibict) que mencionam
fatos histricos e pessoas destacadas na instituio.
Nos materiais de divulgao analisados a preservao de suportes de
informao analgicos e instrumentos de pesquisa foram citados, mas no foi
encontrada nenhuma descrio de procedimentos relacionados manuteno de
arquivos digitais.
Existe um nico material distribudo pela Coordenao de Documentao
em Histria da Cincia do Mast (MUSEU DE ASTRONOMIA E CINCIAS AFINS,
2007), mencionando o oferecimento do quinto curso de segurana de acervos
culturais em maio de 2007. Ele destaca que, no terceiro dia, a estrutura do curso
incluiria contedo sobre preservao digital. A palestra abordou: definies,
obsolescncia das mdias digitais, metadados e projetos internacionais em
andamento.


4.4.2.2 Documentos oficiais


Em termos de publicaes oficiais que mencionam o tema, h um
documento (INSTITUTO BRASILEIRO DE INFORMAO EM CINCIA E
TECNOLOGIA, 2003) assinado pela diretora do Ibict, instituindo um comit tcnico
de estudos sobre preservao de documentos em arquivos digitais. Nele so
relacionadas as necessidades de estabelecer propostas para a criao de polticas e


269
diretrizes nacionais de preservao de documentos digitais no mbito da Biblioteca
Digital Brasileira (BDB), programa institucional mantido pelo rgo.
O comit teve apenas uma reunio geral, mas foram criados grupos de
trabalho para discusso de assuntos ligados preservao digital. O nico
documento encontrado como resultado de reunies foi o do GT de Certificao
digital, no qual so propostas a criao de um sistema de certificao digital e a
expedio de um selo brasileiro de preservao digital (INSTITUTO BRASILEIRO
DE INFORMAO EM CINCIA E TECNOLOGIA, 2003b).
No Inpe foi localizado o documento que caracteriza a poltica de
editorao e preservao da produo intelectual do instituto. Em 2005, em forma de
resoluo, o diretor da instituio, assessorado pelo Conselho de Editorao e
Preservao da Produo Intelectual do Inpe, determinou que o Servio de
Informao e Documentao definisse as [...] caractersticas do sistema de software
no que se refere, em particular, ao item preservao por longo prazo [...], assim
como [...] supervisionar submisses e migrar/atualizar contedos. (INSTITUTO
NACIONAL DE PESQUISAS ESPACIAIS, 2005, p. 2).


4.4.2.3 Material bibliogrfico


O levantamento bibliogrfico inicial da pesquisa ajudou a identificar os
autores brasileiros que escreveram sobre o tema no perodo de 1996 a 2007, entre
os quais servidores do Cnen, do Inpe e do Ibict. Na seleo dos documentos
produzidos nas unidades, foram includos trabalhos apresentados em eventos que
no foram tratados na anlise bibliomtrica (item 4.1). A Tabela 10 mostra os
materiais bibliogrficos coletados nas trs instituies referidas.









270
Tabela 10 - Produo bibliogrfica sobre preservao digital no MCT (1998-2007)

Tipo de documento
Unidade
de
pesquisa
Artigo Captulo Dissertao Livro
Trabalho
em evento
Cnen 1 1 0 0 2
Ibict 2 0 1 0 3
Inpe 4 0 0 1 6
TOTAL 7 1 1 1 11

Percebeu-se que os trabalhos em eventos foram os materiais
bibliogrficos a que mais vezes recorreram os autores para divulgar os resultados
das suas pesquisas. Esta evidncia pode ter origem na rapidez da divulgao que
esse formato permite. Em segundo lugar esto os artigos que conseguem ter uma
abrangncia mais ampla de subtemas e com nmero maior de propostas. Por ltimo,
com um nico registro cada, esto os captulos de livro, dissertaes e livros, sendo
que o nmero de casos pode ser atribudo ao prprio tipo de formato que requer
perodo de tempo considervel para sua produo (ver Apndice E).
Seguindo a caracterizao que Altheide (1987) prope para o que seria
um formato de apresentao dos contedos, os registros encontrados que
mencionavam assuntos ligados preservao digital, continham poucas referncias
aos subtemas e propostas mais frequentemente citados na literatura da rea. Os
assuntos discutidos no saram dos limites das recomendaes gerais, com apenas
uma soluo tecnolgica aplicada localmente.


4.4.3 Questes discutidas


Seguindo a abordagem da AEC, falar de um padro de aparecimento e
uso dos conceitos relacionados com a preservao digital precisaria envolver os
contextos onde eles surgiram.
Os dados bibliogrficos expostos podem ser agrupados em duas
categorias, segundo o contexto da abordagem do tema por parte dos pesquisadores
das trs unidades de pesquisa do Ministrio. A primeira categoria seria aquela em
que a preservao digital aparece como parte de uma discusso terica que expe a
carncia de propostas nacionais para abordar a problemtica. A segunda categoria


271
estaria conectada com as caractersticas locais prprias de uma implementao de
solues de preservao de documentos digitais.
O primeiro grupo foi composto por trabalhos provenientes de duas
unidades que ainda no implementaram metodologias de tratamento de preservao
de objetos digitais. No Ibict, a etapa de estudos e prospeco de tecnologias ainda
no deu continuidade implementao de estratgias reconhecidas
internacionalmente, tais como, consrcios de repositrios DSpace, rede de
bibliotecas LOCKSS ou a preservao desagregada de repositrios EPrints, entre
outras.
No Cnen no h ainda o planejamento para a criao, armazenamento e
acesso s colees digitais locais. Como informou um pesquisador dessa instituio:
- Tem as coisas que so nossas que estamos colocando na coleo digital
e que no tem planejamento em termos de preservao digital; a nica
coisa que tem que estamos guardando em formato pdf, no tem mais
nada. Em termos de segurana, temos um servidor novo e as cpias de
backup. Temos um prottipo de memria tcnica que certamente vai conter
uma poltica de preservao digital no futuro. O importante agora dar
acesso. (Pesquisador geral 5)

As decises sobre a implementao desse tipo de projeto so tomadas
pelas diretorias desses institutos. O respondente apontou que:

- Fica at entranho, porque na verdade eu trabalho aqui, lido com esse
negcio, mas uma coisa isolada, uma formao acadmica que acaba
sendo no aproveitada. (Pesquisador geral 5)

De forma parecida, na nica instituio do grupo que implementou um
projeto de preservao digital e que contou com o apoio da diretoria, o pesquisador
que em primeiro lugar props um sistema de preservao digital manifestou o
carter de iniciativa individual na busca da soluo. Segundo ele:
- O software no era para essa misso, foi desenvolvido de forma
independente em 1998, ele comeou a ser usado para gerenciar as teses e
os eventos. No estava muito definido o que era. Ele um software gratuito
para as instituies pblicas, j houve um interesse privado, mas
esperamos que, com o projeto de lei sobre o acesso livre que torna
obrigatrio o desenvolvimento de repositrios, o interesse seja maior.
(Pesquisador geral 1)

Nos trs institutos onde o tema da preservao digital foi abordado, as
formulaes dos subtemas e aspectos discutidos estiveram presentes em todos os
tipos de documentos analisados: artigo, dissertao, captulo de livro, livro, assim
como em trabalhos em eventos.


272
O que poderia ser considerado como padro de surgimento e uso dos
termos relacionados com a preservao digital estaria na meno deles dentro de
definies, propostas de recomendaes e detalhamento tcnico de aplicaes
destacados na produo bibliogrfica desses pesquisadores, como mostra o Quadro
22.


Unidade de
pesquisa
Documentos
Experincias
citadas
Subtemas e
propostas
Aspectos
discutidos
Cnen
Artigos,
captulo de
livro, trabalho
em evento
Iniciativas e
projetos
internacionais
Definies,
estratgias,
recomendaes
Sistema de
arquivamento,
padres, acesso
Ibict
Artigos,
dissertao,
trabalhos em
eventos
Iniciativas e
projetos
internacionais
Definies,
estratgias,
recomendaes
Objetos digitais,
instituies,
legislao
Inpe
Artigos, livro,
trabalhos em
evento
Projeto local Descrio de
projeto, software,
manual, poltica
Iniciativa, sistema
de arquivamento,
padres

Quadro 22 Contedo dos documentos produzidos por servidores do MCT sobre
preservao digital


No mbito do MCT surgiram algumas das primeiras definies de
preservao digital em portugus. No mesmo perodo j haviam sido publicados
trabalhos em Portugal relacionados com o tema. Em ambos os pases, os conceitos
foram tradues de formulaes feitas por pesquisadores de lngua inglesa
(FERREIRA, 2006, RODRIGUES, 2003; BORBINHA, 2001).
As recomendaes mencionadas nos textos analisados tambm seguem
as propostas de autores em publicaes estrangeiras. Elas vo desde aquelas
relacionadas formao dos responsveis, at a indicao de procedimentos e
tecnologias para o gerenciamento da preservao de documentos digitais.
Finalmente, os contextos mencionados em que surgem formulaes locais
sobre o tema, so reas do Ministrio nas quais se buscam solues para os
problemas que os documentos digitais apresentam. A pergunta sobre como estava
sendo percebida a preservao digital nas unidades de pesquisa do MCT pode ser
respondida afirmando que o problema est na inexistncia de experincias prticas
e na ausncia de decises institucionais, que no tm emergido por parte das
diretorias.


273
Uma amostra da produo sobre o tema e de como o Inpe conseguiu
dentro da instituio estabelecer o primeiro projeto e poltica de preservao digital
do Ministrio, est disponvel no Apndice E.


4.5 DETERMINAO DE CRITRIOS


Um critrio uma idia a partir da qual decidimos ou valorizamos alguma
coisa ou algum. Isso implica requerer de indicadores que ajudem a visualizar
algumas aes concretas para poder avaliar se o critrio est sendo atendido ou
no. Para o dicionrio Houaiss ele seria uma norma de confronto, avaliao e
escolha.
A definio mais usada de critrio que ele sirva de base para que
pessoas e coisas possam ser comparadas ou julgadas. Por isso, um critrio de
preservao digital uma regra que permite a fundamentao racional da escolha,
deciso e deliberao de uma entidade, com relao ao servio de informao de
preservao que ele presta sua comunidade.
O objetivo central desta tese foi propor um conjunto de critrios de
preservao digital que possam ser usados na elaborao de projetos de servios
de gesto de informao de carter cientfico nas unidades de pesquisa do MCT.
Considerando os argumentos expostos na reviso de literatura, configurou-se um
conjunto de pressupostos para tentar entender os problemas crticos relacionados
permanncia das informaes digitais. Assim a formulao dos critrios de
preservao digital de informao cientfica partiram, num primeiro momento dos
seguintes pressupostos:
1) a gesto dos documentos digitais um contnuo integrado de
processos que envolvem todo o ciclo de vida documental;
2) existncia de graus de completude dos sistemas organizacionais
com relao gesto da preservao dos documentos digitais;
3) a percepo de que as necessidades de preservao digital so
determinantes na definio desses sistemas;
4) os critrios de preservao digital so plausveis de serem
adequados ao contexto das organizaes.


274
A primeira etapa de uma possvel adequao de critrios bsicos de
preservao digital observou a definio dos tpicos tratados na literatura que
revelaram a importncia do tema (ver item 2.7). A produo cientfica das reas de
arquivologia, biblioteconomia e cincia da informao indicou alguns dos tpicos que
podem ser abordados no estudo da preservao digital, entre os quais:
a) alcances das estratgias (THIBOBEAU, 2002; BEAGRIE, 2003);
b) arquitetura das solues (LAVOIE; GARTNER, 2005; LAZORCHAK,
2005);
c) metodologias apropriadas (HODGE; CARROLL, 1999);
d) motivaes e necessidades dos usurios (WOODS, 2002);
e) percepes e aes dos gestores (WEBB, 2000; GLADNEY, 2006).
O contexto explorado na pesquisa de campo evidenciou que qualquer
implementao de solues para a preservao de documentos digitais precisa
contemplar todas as atividades que envolvem o ciclo de vida do objeto digital. A
literatura da rea mostrou que, j na fase inicial da criao das colees digitais
(tenham sido nascidas digitais ou digitalizadas), devem ser observados alguns
critrios de preservao ao estabelecer as primeiras aes para sua permanncia:
a. avaliao dos contedos;
b. identificao dos requisitos de metadados;
c. avaliao da capacidade dos metadados serem coletados;
d. cotejamento da soluo selecionada com as funes dos modelos
de referncia existentes;
e. seleo de software e aplicativos automatizados de estratgias de
preservao.
Em um primeiro momento, gestores dos centros de informao e
bibliotecas, como as do MCT, precisariam decidir quais so os critrios de
preservao digital que devem ser observados nas suas unidades para garantir a
persistncia dos documentos digitais em seus sistemas de informao. O julgamento
de qual soluo adotar pode surgir da observncia desses critrios, determinando,
assim, o tipo de resultado que se quer obter.
Na literatura se encontra a definio de diversos tipos de elementos,
princpios, propriedades, atributos, requisitos e critrios contemplados, quando se
deseja criar um tipo de servio de informao orientado preservao de longo
prazo (BROWN, 2003; CONARq, 2006; CORNELL UNIVERSITY LIBRARY, 2003;


275
CRL, 2007; RLG/NARA, 2006; 2007; RLG/OCLC, 2002). Como descrito, os grupos
de pesquisa que fizeram esse tipo de formulao vm testando e propondo regras
baseados em modelos de referncia (OAIS, TDR, TRAC, Moreq, DRAMBORA, e-
Arq) nas suas prprias iniciativas e projetos.
Todos os esforos de elaborao de normas para definir padres de
preservao digital tm o nico propsito de que a informao contida nos sistemas
de informao permanea acessvel por longo perodo de tempo. Quando se
estabelece um servio de informao orientado a esse propsito, a instituio deve
informar quais so os critrios que ela est seguindo.
O levantamento realizado nas unidades de pesquisa do MCT deu a
conhecer que, com exceo do Inpe, seus centros de informao e bibliotecas no
esto aplicando nenhuma metodologia de preservao digital no tratamento dos
seus documentos digitais de informao cientfica.
Comparando com outros estudos no Brasil, e dos grupos de estudo que
comeam a surgir em instituies de ensino superior (PUC-Rio, UNICAMP, UFPB,
UniRio, UFMG), a situao no diferente, como demonstra a pesquisa de Thomaz
(2004), ao analisar o ambiente de arquivamento de informao digital em
organizaes pblicas brasileiras de mdio e grande porte.
No caso das unidades de pesquisa do MCT, o conjunto de critrios para o
estabelecimento de sistemas de informao orientados preservao digital a ser
proposto pode ser usado para avaliar as atribuies de responsabilidade, a
confiana que ele deve possuir e a acessibilidade que esse tipo de sistemas de
informao deve permitir.
A determinao da lista de critrios foi elaborada segundo as principais
formulaes de requisitos bsicos existentes e que esto sendo testados, assim
como a predisposio que os sistemas devem mostrar auditoria externa para
confirmao da concordncia com os modelos de referncia reconhecidos
internacionalmente (BULLOCK, 1999; DIGITAL CURATION CENTRE; DIGITAL
PRESERVATION EUROPE, 2007; MoReq2, 2007; OCLC-CRL, 2007; RLG, 2007;
RLG/OCLC, 2002).
Os dois modelos de referncia reconhecidos internacionalmente para
serem seguidos pelos sistemas de gerenciomento de informao cientfica em
objetos digitais so OASIS e TDR. Com base neles estabeleceu-se o conjunto de


276
critrios que englobam os aspectos gerenciais e institucionais necessrios para o
funcionamento desses sistemas.


4.5.1 Critrios institucionais


Os critrios institucionais so aqueles que servem para informar os filtros
que o sistema de preservao digital possui, com relao a garantir sua
permanncia organizacional e de recursos constantes para seu funcionamento. Eles
representam uma referncia que os usurios tm de que existe uma entidade
institucional que responder pela guarda, manuteno e acesso aos documentos
depositados nesses sistemas.
Ao mesmo tempo, o grupo de critrios institucionais de preservao digital
refere-se completude da estrutura funcional do sistema de informao
estabelecido, segundo seus componentes tecnolgicos e de papis necessrios a
seu funcionamento, assim como garantia da consistncia das informaes
arquivadas.
As seis categorias de critrios institucionais propostas, lideradas pelo
critrio de confiabilidade so as seguintes:
1. Confiabilidade
2. Responsabilidade poltica
3. Sustentabilidade econmica
4. Incluso em repositrios digitais
5. Transparncia
6. Acessibilidade de longo prazo

Os critrios institucionais, que englobam as caractersticas necessrias
para o funcionamento de um sistema de preservao digital, permitem determinar as
prticas de preservao e as condies institucionais que afetam a forma como
enfrentada a preservao da informao em formatos digitais.
Os indicadores dos critrios institucionais de preservao do
conhecimento cientfico, ao serem sistematizados e incorporados s funes dos
gestores da informao digital local, podem servir para medir a produtividade dos


277
centros de informao e bibliotecas, focalizando a utilizao da informao e
reutilizao do conhecimento das novas geraes de cientistas.


4.5.1.1 Confiabilidade


Um critrio institucional que determina os aspectos que a comunidade
observa quando se estabelece um servio de preservao digital o da
confiabilidade. Ele envolve questes sobre os formatos aceitveis para depsito,
armazenamento e esquema de segurana aplicado, temas que devem ser tratados
abertamente com todos os participantes do projeto de preservao, incluindo seus
usurios potenciais (BENNETT, 1997).
O critrio da confiabilidade est intimamente relacionado com a adoo de
padres internacionais, usados como elementos para a certificao de que as
colees digitais observam todos os fatores condicionantes de preservao. Esto
contidos no critrio confiabilidade os indicadores que expressam as garantias que a
instituio prov de que o servio prestado adequado s necessidades da
comunidade-alvo. O cumprimento deste critrio conferido algumas vezes aos
servios terceirizados ou uso de solues no oriundas da instituio.
Observa-se o estabelecimento de uma dependncia fsica na manuteno
dos acervos digitais quando a confiana de que o servio cumpre funes de
preservao de longo prazo no compete ao centro de informao ou biblioteca.
Nesses casos, independentemente da soluo adotada, a instituio deve
estabelecer os graus de responsabilidade e informar o critrio que est sendo
cumprido.
Cabe aos gestores a tarefa de identificar e revisar as informaes de
empacotamento dos dados dentro dos sistemas tecnolgicos adotados e sua
concordncia com o modelo de referncia OAIS (CCSDS, 2002). O armazenamento
estaria determinado pela maneira como foram organizadas as informaes de
contedo, a informao descritiva e as permisses de acesso.
Um sistema de preservao digital deve possuir, em sua estrutura, dispositivos que
permitam a guarda das informaes sobre a segurana, direitos autorais, tipos de
acessos e possibilidades de auditorias. A confiabilidade tambm deve ser


278
considerada nas medidas de segurana, observadas na construo dos repositrios
digitais. Essas medidas podem garantir que os materiais depositados mantero sua
autenticidade no decorrer do tempo.


4.5.1.2 Responsabilidade poltica


A apreciao do critrio institucional responsabilidade poltica, efetuada
por meio da avaliao das polticas de implementao ou pelo tipo de parcerias que
ela envolve, pode ajudar a identificar as variveis organizacionais que determinam a
presena ou no de aes concretas ante aos riscos de perdas da produo
cientfica local.
A partir das resolues oficiais divulgadas como poltica de preservao
digital, que incluem as funes e atributos que cabem s instituies ou setores
responsveis por adotar os critrios de preservao assumidos, possvel detectar
tambm a importncia da informao registrada nesses sistemas. A verificao da
observncia de critrios pode confirmar se a instituio tem na sua misso manter
repositrios de informao confiveis (TDR, 2002).
A natureza da declarao da poltica, resoluo ou mandato de
preservao digital evidente nas primeiras bibliotecas nacionais a determinarem
suas polticas, como a National Library of Australia ou a British Library. Nesta ltima,
a formulao dos critrios para o estabelecimento do elemento preservao nas
solues adotadas est contida nos seguintes indicadores:
1) desenvolvimento de um sistema de armazenamento e
gerenciamento de materiais digitais a longo prazo;
2) caractersticas das funes do sistema a ser desenvolvido e do
material a ser depositado;
3) propriedades do sistema para ser considerado desejvel aos
propsitos para os quais foi criado (tipo de dados, automao dos
processos, formatos armazenveis, tipos de back-ups);


279
4) utilizao de solues temporrias, at o estabelecimento do
sistema definitivo.
47

No caso dos repositrios institucionais de acesso livre, a preservao
digital no prioridade em sua criao, mas quando os critrios de preservao so
observados, os repositrios adquirem carter de responsabilidade que as
organizaes no manifestam quando disponibilizam um servio de acesso livre.
Ao publicar sua poltica de preservao digital, as instituies informam
que seus repositrios possuem a habilidade tcnica para manter e demonstrar a
autenticidade e integridade dos objetos preservados. Afirmam, tambm, seu
compromisso em criar servios de preservao digital como, por exemplo, os
servios que esto sendo acompanhados pelo Directory of Open Access
Repositories (OpenDOAR)
48
da University of Nottingham.


4.5.1.3 Sustentabilidade econmica


O critrio de sustentabilidade econmica til na avaliao do grau de
responsabilidade de um sistema de preservao, segundo o tipo de apoio que
recebe internamente e das instituies de fomento. Este critrio inclui consideraes
sobre a parte do oramento anual dedicado a atividades de preservao digitais, tais
como migrao, atualizao, criao de metadados, entre outras.
Os possveis modelos de negcios dos sistemas de preservao digital
ainda esto sendo estruturados, influenciados principalmente pela natureza das
instituies de ensino e pesquisa, e pela forma como esto sendo percebidos pelas
agncias oficiais, responsveis pelo fortalecimento da capacidade de cada pas na
rea de cincia e tecnologia.
Algumas tcnicas para reduzir custos com os sistemas de preservao
digital apontam para a necessidade de identificar os componentes do sistema que
requerem maior quantidade de investimento, em cada uma das etapas do ciclo de
vida dos objetos digitais (CHAPMAN, 2003; ROSENTHAL et al, 2005).

47
NA: verso traduzida e adaptada da Poltica da British Library disponvel em: http:// Acesso em
12/set/2008)
48
URL: http://www.opendoar.org. Acesso em 20/out/2008.


280
A unio de experincias entre as instituies que desenvolvem projetos de
preservao digital representa parte fundamental do critrio de sustentabilidade
econmica. A importncia das parcerias reconhecida internacionalmente
(JIS/NPO, 1995), porque elas possibilitam melhor compreenso dos benefcios no
compartilhamento de custos e avaliaes de esforos no redundantes (CLOONAN,
2001; NATIONAL LIBRARY OF AUSTRALIA, 2003).
Devido ao grande volume de informao e natureza da tecnologia digital,
as parcerias entre criadores de materiais digitais podem definir qual a parcela de
responsabilidade e as atribuies que lhes correspondem (BESSER, 2007).


4.5.1.4 Incluso em repositrios digitais


Um dos primeiros passos na direo da preservao dos objetos digitais
a sua transferncia para um repositrio digital. A responsabilidade desse processo
compartilhada pelo depositante e pela instituio que oferece esse servio.
No modelo de referncia OAIS, os materiais so transmitidos aos
repositrios por meio dos Pacotes de Submisso de Informao (PSI), como forma
de garantir a persistncia dos documentos. Com eles so implementadas as
decises sobre as caractersticas essenciais dos materiais digitais, sua preservao
e acesso, independentemente da tecnologia aplicada (LeFURGY, 2002). Seria
recomendvel que os sistemas de gesto da informao cientfica incorporassem
todas as regras e descrio da consistncia dos materiais que esto nos PSI em
relao tecnologia adotada na criao dos documentos digitais.
O critrio de incluso pressupe que a instituio possui uma coleo
prpria de documentos digitais que contm a produo cientfica local. Esse
indicador essencial do carter cientfico dos dados proporciona validade aos
contedos do sistema adotado, certificando a conformidade desses registros com as
normas e padres. Tais padres devem ser reconhecidos nas polticas
estabelecidas para incluso e na declarao das polticas de direitos autorais
adotadas.
Na estrutura de arquivamento do OAIS, o critrio incluso estaria
representado dentro do Pacote de Submisso de Informao (PSI) como a descrio


281
que serve para avaliar os mecanismos adotados para garantir a autenticidade dos
objetos digitais. As tcnicas de assinatura digital e de marca dgua digital tambm
esto sendo usados com essa finalidade.
A coleo digital a ser preservada dever conservar o seu formato original
e informar qualquer modificao ou transformao futura (LYNCH, 2000). O servio
de preservao digital deve oferecer garantias de que os formatos das colees nele
depositadas sero atualizados periodicamente, usando software livre e minimizando
o acesso fsico s mdias. A habilidade de manter a completitude dos dados pode
ser detectada usando tcnicas de verificao dos pacotes de software para
repositrios como o DSpace (MOORE; SMITH, 2007) e o LOCKSS.


4.5.1.5 Transparncia


Os repositrios digitais so ferramentas necessrias para os produtores,
disseminadores e usurios de documentos digitais. Projetos direcionados
preservao digital em repositrios insitucionais devem atender a pr-requisitos e
serem parte de um processo transparente de disponibilizao de longo prazo dos
objetos digitais. Os responsveis pela aplicao dos padres e normas reconhecidos
internacionalmente so os desenvolvedores desses projetos.
A formulao do critrio transparncia tem como propsito a observncia
dos processos bsicos de um sistema de gesto da preservao digital nas
instituies. Desde a adoo de uma soluo de software livre, como a Unesco
(2007) e o projeto Open Access Repositories in New Zealand (OARINZ)
recomendam (CATALYST, 2006), at o uso compartilhado de esquemas de
metadados de preservao.
Em alguns casos, a transparncia na recuperao de dados depositados
nos sistemas de preservao digital pode depender da soluo tecnolgica adotada
(JAMES et al., 2003). Contar com a documentao dos procedimentos garantia de
que todos os arquivos sero recuperados de forma organizada.
Uma forma de garantir a autenticidade dos registros e dar certeza aos
usurios de que o texto recuperado est inalterado considerar os componentes de
sistemas usados para extrao de metadados e auditoria de documentos (ex.: Data


282
Time Stamping ou DTS), ou recorrer a mecanismos de auditoria em rede, como o
LOCKSS realiza (ROSENTHAL et al., 2005).
Atender necessidade de que os sistemas contenham mecanismos de
auditoria e que sejam compatveis com as propostas de certificao valoriza o
trabalho dos gestores responsveis e expe a preocupao com a memria
institucional (RLG/OCLC, 2002).
Parte integrante do critrio transparncia so os processos de certificao.
Eles so um dos itens indispensveis quando se planeja realizar trabalhos
colaborativos com redes de repositrios e bibliotecas digitais que usem os mesmo
padres de metadados e de intercmbio de dados (WATERS; GARRETT, 1996). O
desenvolvimento das redes de preservao digital mostra que, sem essa condio,
no poder haver uma integrao e colaborao entre projetos de preservao fora
e dentro das instituies (OCL/CRL, 2007).
Certificar um sistema de preservao sob a norma OAIS significa que a
instituio mantedora revela suas interfaces internas nas especificaes de cada um
dos pacotes de informao definidos por uma norma (SIP, AIP, e PDI). Projetos de
preservao digital, como o Nestor da Alemanha, o Digital Curation Center na
Inglaterra e os da RLG e NARA apontam para uma aplicao colaborativa dos
critrios de forma a expor qualquer risco e o registro das decises assumidas.
A medio do indicador certificao encontra-se em discusso entre os
especialistas da rea, para quem a certificao pode representar ou no um
processo em vrios nveis que refletem os graus de competncia e confidencialidade
da instituio (AMBACHER, 2007).
Com o crescimento do nmero de repositrios em funcionamento, se faz
necessrio o estabelcimento de programas nacionais de certificao de repositrios
digitais de informao cientfica apoiem seus mecanismos de avaliao e medio
em normas internacionais.


4.5.1.6 Acessibilidade de longo prazo


Os gestores dos sistemas de preservao digital devero incluir
informaes sobre o tipo de tratamento especfico para cada coleo e se ele


283
precisar de um aplicativo especial para ser reusado. O planejamento da
manuteno da acessibilidade deve informar qual estratgia ser considerada nos
casos de mudana de software e os termos e condies para uso dos materiais.
O item acesso em um repositrio digital direcionado pelo modelo de
referncia OAIS ajuda a identificar os servios e processos que possibilitam aos
usurios visualizar os acervos. A acessibilidade do sistema de preservao digital
permite medir as facilidades de uso que ele proporciona aos usurios, a dimenso
das tarefas realizadas e o grau de conhecimento que eles tm das funes do
sistema.
Nos projetos de preservao digital em funcionamento freqente
encontrar um tipo de guias e manuais de usurio, oferecendo material referencial
bsico que visa obteno da certificao da acessibilidade manual ou automtica
(BEAGRIE; JONES, 2006; KACZMAREK et al., 2006).
Como mencionado, a acessibilidade de um sistema de preservao digital
depende, tambm, da sua capacidade de ser interopervel. Essa condio
alcanada por meio do uso de ferramentas de software livres, possibilitando a
alterao de qualquer parte do sistema sem nenhuma conseqncia nas suas
funcionalidades.
A interoperabilidade representa um desafio para os repositrios digitais,
pois oferece a possibilidade de trabalhar colaborativamente com outros servios de
preservao digital, trazendo ganhos para as organizaes ao transferir contedos
entre repositrios solucionando, dessa forma, suas necessidades de cpias de
segurana remotas e replicaes.
O critrio de acessibilidade de longo prazo pode ser medido por meio de
indicadores de desempenho que proporcionam os dados sobre a eficincia do
sistema no atendimento de usurios e suas expectativas de tempo e tipo de
resposta. Tambm, o contexto tcnico de conectividade entre links (linkage) impe
a preservao da integridade dos objetos digitais, levando em considerao suas
relaes com outros recursos e criando contextos mais amplos que identificam
caractersticas da rede a que pertencem.






284
5 CONCLUSES E SUGESTES


Considerando a proposta geral desta pesquisa de formular um conjunto de
critrios necessrios implementao de sistemas de gesto de preservao de
informao cientfica em documentos digitais, pode-se afirmar que esse objetivo foi
alcanado na definio dos critrios institucionais de preservao digital para as
unidades de pesquisa do MCT.
A definio desses critrios foi resultado do estudo das principais
propostas de requisitos, padres e normas internacionais encontradas na literatura
das reas da cincia da informao e arquivologia. O levantamento bibliogrfico
possibilitou ressaltar a natureza multidisciplinar da preservao digital, envolvendo
essas duas cincias com outras teorias das reas humanas e aplicadas.
Quatro foram os objetivos especficos, desta pesquisa, a saber:
1. caracterizar as prticas de preservao digital da informao cientfica;
2. identificar os critrios para sistemas de gesto da preservao digital;
3. identificar as necessidades de preservao digital;
4. identificar os conceitos e aplicaes usadas que podem interferir ou
no na implementao de procedimentos padronizados de
preservao digital da informao cientfica.
Os dois primeiros objetivos foram alcanados na anlise das experincias
com projetos de preservao citados na literatura. O levantamento bibliogrfico
proporcionou uma aproximao aos resultados de experincias internacionais de
projetos e pesquisas da rea, levando constatao da origem das prticas e da
identificao dos fatores que compem os critrios necessrios para o
funcionamento de um sistema de preservao digital.
Os dois objetivos restantes foram alcanados por meio da pesquisa de
campo, que possibilitou a deteco das necessidades que os setores de informao
devem preencher e as condies nas quais surgiu a primeira experincia com
sistemas de preservao digital no MCT.
Como a pesquisa envolveu uma populao restrita responsveis por
centros de informao e bibliotecas do MCT e suas equipes no possvel
generalizar os resultados obtidos. Contudo, a pesquisa possibilitou trazer
considerao a abordagem dos critrios de preservao digital, envolvendo os


285
sistemas de informao cientfica. No se pode deixar de apontar que o nvel de
tratamento administrado s possveis variveis contidas nos indicadores desses
critrios foi consoante ao limitado nmero de experincias dentro do Ministrio da
Cincia e Tecnologia
A verificao das prticas de tratamento dos materiais digitais levou
seleo dos critrios dirigidos, principalmente, aos dirigentes e responsveis pelos
centros de informao e bibliotecas do MCT. Resumindo, os critrios de preservao
propostos so:
1) confiabilidade, integrada pelo conjunto de requisitos tcnicos e
gerenciais que garante a integridade dos formatos, a permanncia do
armazenamento dos dados e a segurana em todas as etapas do
servio;
2) responsabilidade poltica, que obriga a instituio a assumir uma
parcela de controle na manuteno dos acervos digitais;
3) sustentabilidade econmica, que define as aes necessrias para a
continuidade do servio;
4) incluso em repositrios digitais, que estrutura instncias de validao
de dados, seu carter cientfico e da abrangncia dos servios;
5) transparncia, que explicita e documenta as especificaes tcnicas
para a recuperao, auditoria e certificao dos contedos;
6) Acessibilidade de longo prazo, que visa a manuteno tcnica do
sistema, suas condies de interoperabilidade, desempenho e linkage
com outros objetos e servios em rede.
Como observado na literatura, a importncia relativa que dada ao tema
da preservao digital pode variar em funo da rea ou subrea cientfica
considerada. Por exemplo, a arquivologia e a cincia da informao podem ter
diferenas com relao ao foco dos trabalhos, mas mostram as mesmas
necessidades de esquemas e modelos de preservao digital.
Na reviso da literatura observou-se que uma porcentagem elevada de
trabalhos cientficos, baseados em experincias com projetos de preservao digital,
dedica-se a publicar, ainda, recomendaes sobre todas as opes existentes de
tratamento de materiais digitais. Entre as explicaes possveis para esse fato, est
a recentidade de projetos e iniciativas e as incertezas sobre a durabilidade desses
sistemas.


286
Tecnicamente, o tratamento adequado dos documentos digitais
corresponde, ainda, descrio detalhada dos seus componentes fsicos e
imateriais e padronizao no uso dos seus sistemas e formatos. Tal afirmao
pode ser confirmada na consulta bibliografia deste trabalho e no resumo das
atividades de preservao em vrios pases do mundo nos ltimos dez anos escrita
por pesquisadores, como McGovern em 2007.
As alternativas de tratamento dos objetos digitais apresentadas precisam
ser avaliadas e discutidas para que os gestores desses acervos possam chegar a
uma concluso adequada sobre qual estratgia seguir.
A literatura apresentada proporcionou alternativas para discutir os
atributos, critrios e normas de funcionamento de sistemas de informao para a
preservao digital. As experincias internacionais apontam a necessidade urgente
de estratgias de preservao aplicadas aos materiais que esto sendo produzidos
nas instituies preocupadas com a memria patrimonial e a herana cultural.
A maior dificuldade registrada nesses projetos e iniciativas est
concentrada na parte organizacional e tecnolgica das solues encontradas. A
formao de recursos humanos necessrios para o funcionamento desses sistemas
comea a ser definida em instituies de ensino e pesquisa, onde repercute o
interesse para que os cursos e ementas de disciplinas das reas de cincia da
informao, arquivologia e museologia abordem essa necessidade nos seus
contedos.
A constatao da reduzida relevncia que as instituies conferem s
atividades de preservao digital pode explicar porque no foram identificadas
experincias semelhantes na rea do governo brasileiro que lida com a informao
cientfica e tecnolgica, assim como o pequeno nmero de trabalhos que sirvam de
referncia para a implementao desse tipo de servio no Brasil.
A fim de avaliar as noes que os gestores dos acervos digitais dessas
instituies de pesquisa tinham sobre a preservao digital, foram selecionados
alguns depoimentos coletados na pesquisa de campo realizada com essa finalidade,
assim como se props uma classificao do seu contedo adaptada do modelo da
anlise etnogrfica de contedo sugerida por Altheide (1987).
Os dados coletados diretamente com os responsveis dos centros de
informao e suas equipes, em datas e lugares diferentes, por meio de questionrios
e entrevistas, confirmaram a carncia de conhecimentos sobre o tema. Pode-se


287
conjecturar que a percepo dessas pessoas sobre a preservao de documentos
digitais corresponde quela mantida pelo respectivo rgo.
O Inpe foi a nica unidade de pesquisa que desenvolveu uma soluo
tecnolgica nessa direo, incluindo a formulao de uma poltica para padronizar
as atividades de depsito e acesso.
O Inpe adotou o modelo de arquitetura de arquivamento digital OAIS em
seu projeto de biblioteca digital e apresentou preocupao quanto ao
desenvolvimento de Pacote de Disseminao de Informao (PDI), como a norma
recomenda. Nas outras unidades, houve apenas a confirmao da existncia de
atividades relacionadas com a migrao de formatos e com as cpias de segurana,
mostrando que os setores responsveis no esto seguindo nenhum critrio de
preservao digital.
Com base no exposto, constatou-se que a manifestao da necessidade
de preservao a longo prazo dos objetos digitais e de maior integrao entre os
sistemas de informao cientfica aponta para a adoo institucional de normas e
padres de preservao digital. Os participantes do projeto do Inpe expressaram
que a aderncia a esses padres deve apoiar-se na adequao de critrios para o
desenvolvimento de repositrios digitais confiveis.
Pode-se afirmar que, considerando a ampla divulgao de ferramentas de
software livre para a construo de repositrios digitais e de exemplos relevantes
como a do prprio Inpe e das iniciativas apoiadas pelo Conarq, a postura dos
responsveis pelos centros de informao e biblioteca comea a mudar, assim como
a percepo sobre o tratamento das colees digitais.
Posde-se afirmar, que a preservao digital mais do que um processo
tcnico, ela um processo social e cultural pelo fato de que nela se aplicam
critrios. tambm um procedimento legal porque define os direitos e privilgios
necessrios para a manuteno permanente dos registros cientficos.
Considerando as observaes anteriormente expostas, pode-se concluir
que os objetivos desta tese foram alcanados. Espera-se que esta pesquisa oferea
subsdios para que instituies que lidam com informao cientfica em formato
digital possam identificar os critrios mnimos que podem ser observados nos
programas, polticas e projetos de preservao digital.
A confirmao da mudana na percepo dos gestores dos centros de
informao e bibliotecas sobre os assuntos ligados preservao digital poderia se


288
constituir em tema de estudos a serem realizados no futuro. Nestes poderiam ser
comparadas informaes oficiais e os projetos, alm de administrar metodologias
semelhantes quelas desenvolvidas na presente tese.
Como foi observado, percepes individuais e institucionais podem ser
analisadas e sua constatao comparada em perodos de tempo considerveis. Isto
permite acompanhar a variao da percepo dos gestores e as aplicaes das
polticas nos diferentes setores das instituies.
Existe, nas reas da cincia da informao e arquivologia no Brasil, a
necessidade de estudos que tratem no apenas da natureza dos objetos digitais,
mas tambm de definio de polticas institucionais que incluam a preservao
desses objetos como bens materiais de contedo cientfico relevante.
necessrio desenvolver pesquisas sobre a aprendizagem e aplicao de
normas e padres a serem cumpridos pelos integrantes das equipes que gerenciam
os sistemas de informao. Estas pesquisas poderiam adotar perspectivas da
cincia da informao sobre as competncias dos profissionais da rea ante os
novos recursos de informao digital, especialmente nas tarefas e rotinas de
funcionamento de sistemas de preservao.
O Brasil precisa, nas reas que lidam com informao e atividades de
desenvolvimento cientfico, de canais oficiais para a identificao, comunicao e
avaliao da preservao digital de longa durao. O modelo distribudo de centros
de preservao digital no Brasil pode ser semelhante queles desenvolvidos pelas
iniciativas observadas na comunidade internacional durante a ltima dcada:
formulao de polticas que envolvam o uso de tecnologias e padres testados e
adaptados em projetos de colees digitais. A organizao desses centros no pode
desconsiderar a sua dimenso internacional, pois, no momento em que se escolhe
determinado conjunto de critrios de preservao, ele deve ser integrado aos outros
repositrios que adotem critrios semelhantes.
O desenvolvimento de conjuntos de critrios para a reteno de longo
prazo de materiais produzidos por pesquisadores de instituies pblicas dever
incluir uma discusso detalhada sobre a implementao de polticas para
repositrios digitais, metadados de preservao para formatos especficos de
documentos e consideraes sobre o gerenciamento dos direitos autorais no
ambiente digital.


289
Recomenda-se, finalmente, que projetos, programas e polticas de gesto
de informao cientfica a serem estabelecidos nos rgos pblicos identifiquem sua
orientao, segundo critrios reconhecidos internacionalmente.


290
REFERNCIAS


AAKER, D. A.; KUMAR, V; DAY, E. G. S. Marketing research. Hoboken , NJ : John
Wiley & sons, 2004.


ABRAMO, P. Pesquisa em cincias sociais. In: HIRANO, S. (Org.). Pesquisa social:
projeto e planejamento. So Paulo: T. A. Queiroz, 1979. p. 21-88.


ALEMNEH, D. G.; HASTINGS, S. K.; HARTMAN, C. N. A metadata approach to
preservation of digital resources: the University of North Texas Libraries: experience.
First Monday, v. 7, n. 8, Aug. 2002. Disponvel em:
<http://firstmonday.org/issues/issue7_8/alemneh/index.html>. Acesso em: 8 ago.
2006.


ALTHEIDE, D. Ethnographic content analysis. Qualitative Sociology, v. 10, n. 1, p.
65-77, Spring 1987.


ALVARADO URBIZAGSTEGUI, R. A bibliometria: histria, legitimao e estrutura.
In: TOUTAIN, L. M. B. B. (Org.). Para entender a cincia da informao. Salvador:
EDUFBA, 2007. p. 185-217.


AMBACHER, B. Government archives and the digital repository audit checklist:
modern record program. JoDI, v. 8, n. 2, 2007.


AMERICAN INSTITUTE OF PHYSICS. Publishing services. 2003. Disponvel em:
<http://www.aip.org/publishing/services/cs_archleg.html>. Acesso em: 18 jun. 2006.


ANDERSON, S.; PINFIELD, S. Preserving e-prints: scaling the preservation
mountain. In: DPC-CURL SEMINAR ON INSTITUTIONAL REPOSITORIES, 2004,
London. Proceedings London: [s. n.], 2004.


ARMS, W. Digital libraries. Cambridge: MIT Press, 2000.


BANON, G. J. F. Biblioteca Digital da Memria Tcnico-Cientfica do INPE. So
Jos dos Campos: INPE, 2006. Disponvel em: <http://urlib.net/dpi.inpe.br/banon-
pc2@1905/2005/12.07.19.19>. Acesso em: 24 out. 2008.


______; BANON, L. C. Ferramentas on-line associadas a uma biblioteca digital para
publicao em eventos: Projeto XII SBSR. In: SIMPSIO INTERNACIONAL DE


291
BIBLIOTECAS DIGITAIS, 3., 2005, So Paulo. Anais... So Paulo: INPE, 2005.
Disponvel em: <http://urlib.net/sid.inpe.br/iris@1912/2005/12.02.12.24>. Acesso em:
24 out. 2008.


BASEVI, T. BDJur Consortium: Juridical Digital Library: implementing DSpace in the
Brazilian Judiciary. In: ICCC CONFERENCE ON ELECTRONIC PUBLISHING, 9.,
2005, Leuven , Be. Proceedings Leuven, Be: Katholieke Universiteit de Leuven,
2005.


BEAGRIE, N. A continuing Access and digital preservation strategy for the
Joint Information Systems Committee (JISC). London: JISC, 2002. Disponvel em:
<http://www.jisc.ac.uk/index.cfm?name=pres_continuing>. Acesso em: 14 jan. 2007.


______. National digital preservation initiatives: an overview of developments in
Australia, France, the Netherlands, and the United Kingdom and of related
international activity. Washington: Council on Library and Information Resources and
the Library of Congress, 2003. Disponvel em:
<http://www.clir.org/pubs/reports/pub116/pub116/pub116.pdf>. Acesso em: 28. out.
2006.


______; GREENSTEIN, D. A strategic policy framework for creating and
preserving digital collections. London: Kings College, 1998. Disponvel em:
<http://ahds.ac.uk/managing.htm>. Acesso em: 28 out. 2006.


BEARMAN, D. Electronic evidence: strategies for managing records in
contemporary organizations. Pittsburgh: Archives and Museum Informatics, 1994.


BELKIN, N. J. Information concepts of information for Information Science. Journal
of Documentation, London, v. 34, n.1, p. 55-85, 1978.


BELLOTTO, H. L. Arquivos permanentes: tratamento documental. 2. ed. rev. e
ampl. Rio de Janeiro: FGV, 2004.


BENNETT, J. C. A framework of data types and formats, and issues affecting
the long term preservation of digital material. London: British Library, 1997.
(JISC/NPO studies on the preservation of electronic materials, 50). Disponvel em:
<http://www.ukoln.ac.uk/services/papers/bl/jisc-npo50/bennet.html>. Acesso em: 25
mar. 2007.




292
BERNE Convention for the Protection of Literary and Artistic Works, of September 9,
1886. Disponvel em: <http://www.wipo.int/treaties/en/ip/berne/index.html>. Acesso
em: 30/out/2002


BESSER, H. Collaboration for electronic preservation. Library Trends, v. 56, n.1, p.
216-229, 2007.


______. Digital longevity. In: SITTS, M. K. (Ed.). Handbook for Digital Projects: a
management tool for preservation and access. Massachusetts: Northeast Document
Conservation Center, 2000. p. 155-166.


BLAKE, M. German network of expertise in digital preservation. Electronic Library,
v. 22, p. 368-369, Apr. 2004.


BOERES, S. A. A. Poltica de preservao da informao digital em bibliotecas
universitrias brasileiras. 2004. 167 f. Dissertao (Mestrado em Cincia da
Informao e Documentao) - Faculdade de Economia, Administrao,
Contabilidade e Cincia da Informao e Documentao, Universidade de Braslia,
Braslia, 2004.


______; MRDERO ARELLANO, M. A. Polticas e estratgias de preservao de
documentos digitais. In: CINFORM, 4., 2005, Salvador, BA. Proceedings...
Salvador, BA: Dilogo Cientfico, 2005. Disponvel em:
<http://dici.ibict.br/archive/00000263>. Acesso em: 16 fev. 2007.


BORBINHA, J.; CORREIA, A. M. R. Deposit of scientific and technical gray literature
in Portugal: a case study. In: INTERNATIONAL CONFERENCE ON ENTERPRISE
INFORMATION SYSTEMS, 2001, Setubal, Portugal. Proceedings Setubal,
Portugal: ICEIS Press, 2001. p. 8-19.


______. Metadata: conceito e sua relevncia para as
bibliotecas. In: CONGRESSO NACIONAL DE BIBLIOTECRIOS, ARQUIVISTAS E
DOCUMENTALISTAS, 7., 2001, Porto. Actas...
Porto: [s. n.], 2001.


BRADLEY, K. APSR sustainability issues discussion paper. Canberra: National
Library of Australia, 2004. Disponvel em:
<http://www.apsr.edu.au/documents/APSR_Sustainability_Issues_Paper.pdf>.
Acesso em: 18 ago. 2006.




293
BROOKES, B. C. Numerical methods of bibliographical analysis. Library Trends, v.
22, n. 1, p. 18-43, July, 1973.


BROWN, A. Selecting file format media for long term preservation. UK: The
National Archives, 2003.


BRUCE, H. Personal, anticipated information need. Information Research,
Washington, v. 10, n. 3, Apr. 2005. Disponvel em: <http://informationr.net/ir/10-
3/paper232.html>. Acesso em: 9 jan. 2006.


BUDAPEST OPEN ACCESS INITIATIVE. [site]. 2002. Disponvel em:
<http://www.soros.org/openaccess/read.shtml>. Acesso em: 18 jun. 2006.


BULLOCK, A. Preservation of digital information: issues and current status.
Ottawa: National Library of Canada, 1999. Disponvel em:
<http://www.collectionscanada.ca/9/1/p1-259-e.html>. Acesso em: 28 jul. 2005.


BURGOS, M. B. Cincia na periferia: a luz sncroton brasileira. Juiz de Fora:
EDUFJF, 1999.


CAF, L. et al. Repositrios Institucionais: nova estratgia de publicao cientfica
na rede. In: ENCONTRO NACIONAL DE INFORMAO EM CINCIAS DA
COMUNICAO, 13., 2003, Belo Horizonte. Anais Belo Horizonte: [s.n.], 2003.


CAMILEON: Creative archiving at Michigan e Leeds: emulating the old on the
new. United States: JISC and National Science Fundation, 2001. Disponvel em:
<http://www.si.umich.edu/CAMILEON/>. Acesso em: 19 ago. 2006.


CANDS ROMERO, J. El papel de los metadados en la preservacin digital. El
Profesional de la Informacin, v. 15, n. 2, mar./abr. p. 126-136, 2006.


CAPLAN, P. Building a digital preservation archive: tales from
the front. VINE, v. 34, n. 1, p. 38-42, 2004.


CARLIN, A. P. Aspects of spatial arrangement in libraries. In : LASK, T. (Ed.).
Constructions sociales de l'espace, les territoires de l'anthropolgie de la
communication. Lige: Ls ditions de l'Universit de Lige, 2003. p. 87-99.




294
______. Disciplinary debates and bases of interdisciplinary studies: the place of
research ethics in library and information science. Library and Information Science
Research, v. 25, n. 1, p. 3-18, Spring 2003.

CATALYST. Technical evaluation of selected open source repository solutions
on behalf of CPIT. Version 1.3 approved. Wellington, New Zealand: [s. n.], 2006.


CEDARS PROJECT TEAM. Cedars Guide to Preservation Metadata. The Cedars
Project, 2002.


CENTER FOR RESEARCH LIBRARIES. Trustworthy Repositories Audit and
Certification (TRAC): criteria and checklist (TRAC). 2007. Disponvel em:
<http://www.crl.edu/content.asp?l1=13&l2=58&l3=162&l4=91>. Acesso em: 14 mar.
2005.


CHAPMAN, S. Counting the costs of digital preservation: is repository storage
affordable? Journal of Digital Information, v. 4, n. 2, 2003.


CHEPESUIK, R. The future is here: Americas libraries go digital. American
Libraries, v. 2, n. 1, p. 47-49, 1997.


CHILVERS, A. H. Managing long-term access to digital data approach: a
metadata approach. Inglaterra: Loughborough University, 2000.


CHUDNOV, D. DSpace durable digital documents. Serials, v. 14, n.3, Nov. 2001.

CLOONAN, M. V. W(h)ither preservation? Library Quarterly, Chicago, v. 71, n. 2, p.
231-242, Apr. 2001.


COLEMAN, J.; WILLIS, D. SGML as a framework for digital preservation and
access. Washington: Commission on Preservation and Access, 1997.


COMMISSION ON PRESERVATION AND ACCESS AND THE RESEARCH
LIBRARIES GROUP. Preserving digital information: report of the task force on
archiving of digital Information. Washington, 1996. 64 p.


CONSULTIVE COMMITTEE FOR SPACE DATA SYSTEMS (CCSDS). Producer-
archive interface methodology abstract standard. Washington: Blue Book, 2002.
Disponvel em: <http://ssdoo.gsfc.nasa.gov/nost/isoas/CCSDS--651.0-R-1-draft.pdf>.
Acesso em: 27 jan. 2004.



295
______. Producer-archive interface methodology documents. Washington: Blue
Book, 2003: http://nssdc.gsfc.nasa.gov/nost/isoas/paim.html>. Acesso em: 4 dez.
2006.


______. Reference model for an Open Archival Information System (OAIS).
Washington: Blue Book, 2002. Disponvel em:
<http://public.ccsds.org/publications/archive/650x0b1.pdf> Acesso em: 10 mar. 2006.


CONSELHO NACIONAL DE ARQUIVOS. Carta para a preservao do patrimnio
arquivstico digital. Rio de Janeiro: UNESCO, 2004. Disponvel em:
<http://www.arquivonacional.gov.br/conarq/cam_tec_doc_ele/preservacao/cartapres
ervacao.asp>. Acesso em: 6 abr. 2006.


CORNEL UNIVERSITY LIBRARY. Digital preservation management:
implementing short-term strategies for long-term problems. 2004. Disponvel em:
<http://www.library.cornell.edu/iris/tutorial/dpm/>. Acesso em: 16 nov. 2005.


COSTA, M. F.; COSTA, M. F. B. Metodologia de Pesquisa: conceitos e tcnicas.
Rio de Janeiro: Intercincia, 2001.


COUNCIL ON LIBRARY AND INFORMATION RESOURCES (Library of Congress).
Capturing analog sound for digital preservation: report of a roundtable discussion
of best practice for transferring analog discs and tapes. Washington, 2006.


COX, J.; COX, L. Scholarly publishing practice: the ALPSP report on academic
journal publishers: policies and practices in online publishing. United Kingdom: John
Cox Associates, 2003. Disponvel em: <http://www.arl.org/sparc/IR/ie.html>. Acesso
em: 25 out. 2006.


CROW, R. The case for institutional repositories: a SPARC position paper.
Washington, D.C.: Scholarly Publishing & Academic Resources Coalition. 2002.
DIsponvel em: <http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf>. Acesso
em: 2 set. 2008.


CROWE, R. The case for institutional repositories: a SPARC position paper.
Washington: The Scholarly Publishing & Academic Resources Coalition, 2002.
Disponvel em: <http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf>. Acesso
em: 14 jul. 2008.


CULYBA, R. J.; HEIMER, C. A.; Petty, J. C. The ethnographic turn: fact, fashion, or
fiction? Journal Qualitative Sociology, v. 27, n. 4, p. 365-389, Dec. 2004.


296
CUNHA, M. B. Desafios na construo de uma biblioteca digital. Cincia da
Informao, Braslia, v. 28, n. 3, set./dez. 1999. Disponvel em:
<http://www.ibict.br/cienciadainformacao/rst/viewarticle.php?id=323>. Acesso em: 28
jul. 2004.


DAY, M. E-print services and long-term access to the record of scholarly and
scientific research. Ariadne, n. 28, June 2001. Disponvel em:
<http://www.ariadne.ac.uk/issue28/metadata/>. Acesso em: 11 ago. 2006.


______. The Final Cedars Workshop: a report from Manchester, RLG DigiNews, v.
6, n. 2, Apr., 2002. Disponvel em: <http://www.rlg.org/preserv/diginews/diginews6-
2.html#conference>. Acesso em: 18 jul. 2006.


______. Metadata for digital preservation: an update. Ariadne, n. 22, Dec. 1999.
Disponvel em: <http://www.ariadne.ac.uk/issue22/metadata/intro.html>. Acesso em:
18 ago. 2006.


______. Preservation metadata. In: GORMAN, G. E.; DORNER D. G. (Ed.).
Metadata applications and management. London: Facet Publishing, 2004, p. 253-
273.


DEFENSE TECHNICAL INFORMATION CENTER. Technical metadata for the
long-term management of digital materials: preliminary guidelines. 2002.
Disponvel em:
<http://dvl.dtic.mil/metadata_guidelines/TechMetadata_26Mar02_1400.pdf.>. Acesso
em: 27 jan. 2006.


DENZIN, N. K.; LINCOLN, Y. S. (Ed.). Handbook of qualitative research. 2. ed.
Housand Oaks, CA: Sage, 2005.


DEPARTMENT OF THE PREMIER AND CABINET (DPC). A security management
framework for online services. [Perth, W. A.]: CAMS and Department of
Commerce and Trade, 2000. Disponvel em:
<http://www.egov.dpc.wa.gov.au/documents/security_management.doc>. Acesso
em: 6 dez. 2006.


DESCOMBE, M. The good research guide: for small-scale social research projects.
2nd ed. Maidenhead, Gran Bretaa: Open University Press, 2003.


DIAS, J. L. M. FINEP: trinta anos de projetos para o Brasil. Rio de Janeiro: FGV,
2002.


297
DIGITAL PRESERVATION COALITION. Dpc Forum on Web Archiving. Disponvel
em: <http://www.dpconline.org/graphics/events/060612web-archiving.html>. Acesso
em: 1 set. 2006.


______; DIGITAL PRESERVATION EUROPE. Digital Repository Audit Method
Based on Risk Assessment (DRAMBORA). Disponvel em:
<http://www.repositoryaudit.eu/download/>. Acesso em: 20 out. 2007.


DOBRATZ, S.; SCHOGER A.; STRATHMANN, S. The nestor catalogue of criteria for
trusted digital repository evaluation and certification. JoDI, v. 8, n. 2, 2007.
Disponvel em: <http://journal.tdl.org/jodi/issue/view/34>. Acesso em: 14 maio 2005.


DOLLAR, C. M. O impacto das tecnologias de informao sobre os princpios e
prticas de arquivos: algumas consideraes. Revista do Arquivo Nacional, v. 7, n.
1/2, p. 3-38, jan./dez. 1994.


DSPACE. Format Support. [S. l.]: MIT Libraries & Hewlett-Packard Company, 2002.


DUKART, J. R. Electronic document archival dilemma. E-doc, v.16, n. 5, p. 43,
2002.


ERPANET/CODATA INTERNATIONAL ARCHIVING WORKSHOP ON THE
SELECTION, APPRAISAL AND RETENTION OF DIGITAL SCIENTIFIC DATA,
2003, Lisbon, Portugal. Atas Lisbon, Portugal: Biblioteca Nacional de Portugal,
2003.


EWING, G. et al. Role and experience determine decision support interface
requirements in a neonatal intensive care environment. Journal of Biomedical
Informatics, v. 36, p. 240, 2003.


FALK, H. Digital archive developments. The Electronic Library,
v. 21, n. 4, p. 375-379, 2003.


FEATHER, J. (Ed.). Managing preservation for libraries and archives. Aldershot,
Hants: Ashgate, 2004.


FEENEY, M. Towards a national strategy for archiving digital materials. Alexandria,
v. 11, n. 2, p. 107-121, 1999.


298
______. (Ed.). The digital culture: maximising the nation's investment: a synthesis
of JISC/NPO studies on the preservation of electronic materials. London: British
Library Board, National Preservation Office, 1999.


FENTON, E; SCHONFELD, R. Digital preservation library periodicals expenses:
variance between non-subscription costs for print and electronic formats on a life
cycle basis. In: TASK FORCE MEETING, Portland, OR, 2003. Proceedings...
Portland, OR: CNI, 2003.


FERREIRA, M. CRIB: a service oriented architecture for digital preservation
outsourcing. Portalegre, Portugal: University of Minho, 2006.


______. Introduo preservao digital: conceitos, estratgias e actuais
consensos. Portalegre, Portugal: Universidade do Minho, 2006. Disponvel em:
<https://repositorium.sdum.uminho.pt/bitstream/1822/5820/1/livro.pdf>. Acesso em:
20 jan. 2007.


______.; BAPTISTA, A. A.; RAMALHO, J. C. A foundation for automatic digital
preservation. Ariadne, n. 48, Aug. 2006.


FERREIRA, S.; SOUTO, L. Dos sistemas de informao federados federao de
bibliotecas digitais. Revista Brasileira de Biblioteconomia e Documentao, v. 2,
n. 1, 2006. Disponvel em: <http://www.febab.org.br/rbbd/ojs-
2.1.1/index.php/rbbd/article/view/3/20>. Acesso em: 25 jan. 2005.


FINK, F; KOSECOFF, J. How to conduct surveys: a step-by-step guide. [S. l.]:
SAGE Publications, 1985.


FOOT, M. M. Building blocks for a preservation policy. London: National
Preservation Office London, 2001. Disponvel em:
<www.bl.uk/services/preservation/upos.pdf>. Acesso em: 17 mar. 2006.


______. Towards a preservation policy for European research libraries. Liber
Quarterly, v. 9, n. 3, p. 323-328, 1999.


FRESKO, M. Digital Preservation Guidelines: The State of the Art in Libraries,
Museums and Archives, 1998. Disponvel em:
<ftp://ftp.cordis.lu/pub/ist/docs/digicult/study1.doc> Acesso em: 15 fev. 2008.




299
FRIEDLANDER, A. The national information infrastructure preservation program:
expectations, realities, choices and progress to date. D-Lib Magazine, v. 8, n. 3, Apr.
2002. Disponvel em: <http://www.dlib.org/delib/september95/04friedlander.html>.
Acesso em: 14 abr. 2005.


FUNARI, P. P. A. Os Arquivos no Sculo XXI: polticas e prticas de acesso s
informaes. In: CONGRESSO NACIONAL DE ARQUIVOLOGIA, 1., 2004, Braslia,.
Anais... Braslia: Universidade de Braslia, 2004.


______. A diversidade cultural e a gesto, preservao e acesso a documentos
digitais. Campinas, SP: Siarq Unicamp, 2005. Fruns Permanentes da UNICAMP:
conhecimento e tecnologia da informao, gesto e preservao de documentos
digitais.


GANDELMAN, H. De Gutemberg Internet: direitos autorais na era digital. Rio de
Janeiro: Record, 1997.


GEERTZ, C. Works and lives: the anthropologist as author. Stanford, CA: Stanford
University Press, 1988.


GILLELAND-SWETLAND, A. Setting the stage. In: BACA, M. (Ed.). Introduction to
metadata: pathways to digital information, 2000. Disponvel em:
<http://www.getty.edu/research/institute/standards/intrometadata/2_articles/index.htm
>. Acesso em: 28 jul. 2006.


______. Enduring paradigm, new opportunities: the value of the archival
perspective in the digital environment. Washington: Council on Library and
Information Resources, 2000. Disponvel em:
<http://www.clir.org/pubs/reports/pub89/pub89.pdf>. Acesso em: 25 jun. 2006.


______.; EPPARD, P. B. Preserving the authenticity of contingent digital objects: the
InterPARES Project. D-Lib Magazine, v. 6, July/Aug. 2000. Disponvel em:
<www.dlib.org/dlib/july00/eppard/07eppard.html>. Acesso em: 15 ago. 2006.


GLADNEY, H. M. Critique: attributes of a trusted digital repository. Saratoga, CA:
HMG Consulting, 2001. Disponvel em:
<http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.18.6694>. Acesso em: 12
abr. 2006.


______. Principles for digital preservation. Communications of the ACM, v. 49, p.
111-116, Feb. 2006.


300
GLASER, B. G. Theoretical sensitivity: advances in the methodology of grounded
theory. Mill Valley: Sociology Press, 1978.


GORMAN, G. E.; CLAYTON, P. Qualitative research for the information
professional: a practical handbook. London: Library Association Publishing, 1997.


GRAHAM, P. S. Long-term intellectual preservation. In: ELKINGTON, N. E. (Ed.).
Digital imaging technology for preservation. Mountain View, California: Research
Libraries Group, 1998. p. 41-57.


GRANGER, S. Emulation as a digital preservation strategy. D-Lib Magazine, v. 6, n.
10, Oct. 2000. Disponvel em:
<http://www.dlib.org/dlib/october00/granger/10granger.html>. Acesso em: 5 ago.
2006.


______. Digital preservation and deep infrastructure. D-Lib Magazine, v. 8, n. 2,
Feb. 2002. Disponvel em:
<http://www.dlib.org/dlib/february02/granger/02granger.html>. Acesso em: 28
set. 2006.


GRAY, J. Cachorros de palha: reflexes sobre humanos e outros animais.
Rio de Janeiro: Record, 2005.


GREENAN, M. ERPANET OAIS: Training Seminar Report. Glasgow, United
Kingdom: Erpanet, 2003. Disponvel em:
<http://www.erpanet.org/www/products/copenhagen/ERPANET%20OAIS%20Traini
ng%20Seminar%20Report_final.pdf>. Acesso em: 14 jul. 2006.


GREENSTEIN, D.; GEORGE, G. Digital reproduction quality: benchmark
recommendations. RLG DigiNews, v. 5, n. 4, 1998. Disponvel em:
<http://www.rlg.org/preserv/diginews/diginews5-4.html#featured>. Acesso em: 28 jul.
2006.


______. Managing digital collections: part II: in search of guidance. AHDS
Publications, 1998. Disponvel em:
<http://www.ahds.ac.uk/about/publications/index.htm> Acesso em: 12 jun. 2005.


GREENSTEIN, S. M. Lock-in and the costs of switching mainframe computer
vendors: what do buyers see? Oxford: Industrial and Corporate Change, 1997.



301
______. Universal service in the digital age: the commercialization and geography
of U.S. internet access. Cambridge, MA: National Bureau of Economic Research,
2008. Disponvel em: <http://ideas.repec.org/p/nbr/nberwo/6453.html>. Acesso em:
14 out. 2007.


GWATNEY, M. C. Reality versus the ideal: a case study of three elementary school
library media specialists performing their jobs. Knowledge Quest, v. 29 n. 5, p. 36-
42, May/June 2001.


HAHN, K. The state of the large publisher bundle: findings from an ARL Member
Survey. ARL Bimonthly Report, n. 245, Apr. 2006. Disponvel em:
<http://www.arl.org/newsltr/245/bundle.html>. Acesso em: 5 jun. 2007.


HANNA, M. Born digital: live digital? maybe. Quarterly Newsletter of the
Interactive council for Scientific and Technical Information, v. 38, June 2001.
Disponvel em: <http://www.icsti/forum/38/>. Acesso em: 21 jan. 2006.


HARNAD, S. Acesso Livre: por qu? Belm, PA: SBPC, 2007. Disponvel
em: <http://users.ecs.soton.ac.uk/harnad/Temp/brazilb.ppt#626>. Acesso em
1 nov. 2008.


______. Free at last: the future of peer-reviewed journals. D-Lib Magazine, v. 5, n.
12, Dec. 1999. Disponvel em: <http://www.dlib.org/dlib/december99/12harnad.html>.
Acesso em: 19 maio 2005.


______. Comunicao pessoal. Belm, PA. 9 jul. 2007


______. [Mensagem para lista de discusso]. 2003. Disponvel em:
<http://users.ecs.soton.ac.uk/harnad/Hypermail/Amsci>. Acesso em: 18 set. 2007.


______. Online, continuous, metrics-based research assessment. Technical
Report, ECS, University of Southampton [Unpublished]. Disponvel em:
<http://eprints.ecs.soton.ac.uk/12130/>. Acesso em: 4 ago. 2006.


______. The self-archiving initiative: freeing the refereed research literature online.
Nature, v. 10, Apr. 2001. Disponvel em:
<http://www.ecs.soton.ac.uk/~harnad/Tp/nature4.htm>. Acesso em: 16 jan.
2006.




302
HARVARD UNIVERSITY LIBRARY. Proposal for a study of electronic journal
archiving. 2000. Disponvel em: <http://www.diglib.org/preserve/ejp.htm> Acesso
em: 18 jun. 2006.


HAYNES, D. Responsibility for digital archiving and long term access to digital
data: a JISC/NPO. London: Library Information Technology Centre, London, 1997.
(Study with the Electronic Libraries (eLib) Programme on the Preservation of
Electronic Materials)


HEDSTROM, M. Digital preservation: a time bomb for digital libraries. 1996.
Disponvel em: <www.uky.edu/~kiernsm/DL/hedstrom.html>. Acesso em: 19 jul.
2006.


______; MONTGOMERY, S. Digital preservation needs and requirements in RLG
members institutions. Mountain View, CA: RLG, 1998.


HENDLEY, T. Comparison of methods e costs of digital preservation: British
Library research and innovation report. London: British Library and Innovation
Centre, 1998. Disponvel em:
<http://www.ukoln.ac.uk/services/elib/papers/tavistock/hendley/hendley.html>.
Acesso em: 18 set. 2006.


HILDRETH, C.R. Preserving what we really want to access, the message, not the
medium: challenges and opportunities in the digital age. In: HELAL, A. H.; Weiss, J.
W. (Ed.). INTERNATIONAL ESSEN SYMPOSIUM, 18., 1995, Essen. Proceeding
Essen: Germany University library, 1996. p. 76-95.


HIRTLE, P. Editorial: OAI and OAIS: whats in a name? D-Lib Magazine, v. 7, n. 4,
Apr. 2001. Disponvel em: <http://www.dlib.org/dlib/april01/04editorial.html>. Acesso
em: 25 ago. 2007.


HITCHCOCK, S. Metalist of open access e-print archives: the genesis of
institutional archives and independent services. ARL Bimonthly Report, n. 227, p.
4-11, Oct. 2003.


______; et. al. Digital preservation service provider models for institutional
repositories. D-lib Magazine, v. 13, n. 5/6, May/June 2007. Disponvel em:
<http://wwwdlib.org/dlib/may07/hitchcock/05hitchcock.html>. Acesso em: 13 fev.
2006.



303
HODGE, G. M. Best practices in digital archiving: a life cycle approach. D-Lib
Magazine, v. 6, n. 1, Jan. 2000. Disponvel em:
<http://www.dlib.org/dlib/january00/01hodge.html>. Acesso em: 18 jun. 2006.


______; CARROLL, B. C. Digital electronic archiving: the state of the art and the
state of the practice. [S. l.]: International Council for Scientific and Technical
Information Information Policy Committee and CENDI, 1999. Disponvel em:
<http://www.icsti.org/Dig_Archiving_Report_1999.pdf>. Acesso em: 18 mar. 2005.


______; FRANGAKIS, E. Digital preservation and permanent access to scientific
information: the state of the practice. [S. l.]: International Council for Scientific and
Technical Information and CENDI, 2004. Disponvel em:
<http://www.dtic.mil/cendi/publications/04-3dig_preserv.html.>. Acesso em: 14 maio
2006.


IBM. Digital Information Archiving System. 1996. Disponvel em: <http://www-
5.ibm.com/nl/dias/>. Acesso em: 19 fev. 2007.


______. IBM/KB long-term preservation study. 2003. Disponvel em:
<http://www.5.ibm.com/nl/dias/preservation.html>. Acesso em: 3 out. 2005.


IKPAAHINDLI, L. An overview of bibliometrics: its measurements, laws and their
applications. Libri, v. 35, n. 2, p. 163-177, June 1985.


INERA Incorporated. E-journal archive DTD feasibility study. [Prepared for the]
Harvard University Library, Office of Information Systems, E-Journal Archiving
Project, 2002. Disponvel em: <http://www.diglib.org/preserve/hadtdfs.pdf>. Acesso
em: 15 set. 2006.


INSTITUTO BRASILEIRO DE INFORMAO CIENTFICA E TECNOLGICA.
Contribuio para polticas de ICT. Braslia: IBICT, 2001.


______. Ordem Interna n. 009/02, de 13 de novembro de 2002. Braslia, DF, 2002.


______. PresDigi: sistema brasileiro de preservao de documentos em arquivos
digitais. Braslia, DF, 2003. (proposta preliminar para discusso [por] Miguel ngel
Mrdero Arellano e Piotr Trzesniak).


INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS. Resoluo n 204.01.
Caracteriza a Poltica de Editorao e Preservao da Produo Intelectual do INPE.


304
JAMES, H. et al. Feasibility and requirements study on preservation of e-prints.
2003. Report Commissioned by the Joint Information Systems Committee (JISC).


JISC. Open access briefing paper, joint information systems committee. 2005.
Disponvel em: <www.jisc.ac.uk/index.cfm?name5pub_openaccess>. Acesso em: 6
ago. 2007.


JONES, M. Digital preservation activities in the U.K: building the infrastructure. In:
WORLD LIBRARY AND INFORMATION CONGRESS: General Conference and
Council, 69., 2003, Berlin. Proceedings Berlin: IFLA, 2003.


KACZMAREK, J. et al. Using the audit checklist for the certification of a trusted digital
repository: as a framework for evaluating repository software applications: a progress
report. D-lib Magazine, v. 12, n. 12, Dec. 2006. Disponvel em:
<http://www.dlib.org/dlib/december06/kaczmarek/12kaczmarek. html>. Acesso em: 9
set. 2005.


KUNZE, J. Towards electronic persistence using ARK identifiers. Oakland, CA:
University of Califrnia, 2003. Disponvel em:
<http://bibnum.bnf.fr/ecdl/2003/proceedings.php?f=kunze>. Aceso em: 27 jan. 2004.


LAKATOS, E. M.; MARCONI, M. A. Fundamentos de metodologia cientfica. 3.
ed. So Paulo: Atlas, 1991.


LAVOIE, B. Implementing metadata in digital preservation systems: the PREMIS
activity. D-Lib Magazine, v. 10, n. 4, Apr. 2004. Disponvel em:
<http://www.dlib.org/dlib/april04/lavoie/04lavoie.html>. Acesso em: 28 ago. 2005.


______. The incentives to preserve digital materials: roles, scenarios and
economic decision-making. Columbus, OH: OCLC, 2003.


______. Meeting the challenges of digital preservation: the OAIS reference model.
OCLC-Newsletter, n. 243, p. 26-30, Jan./Feb. 2000.


______. The open archival information system reference model: introductory
guide. Dublin, USA: Office of Research OCLC, 2004. Disponvel em:
<http://www.dpconline.org/docs/lavoie_OAIS.pdf>. Acesso em: 24 abr. 2006.


______. PREMIS with a fresh coat of paint: highlights from the revision of the
PREMIS data dictionary for preservation metadata. D-Lib Magazine, v. 14, n. 5/6,


305
May/June 2008. Disponvel em:
<http://www.dlib.org/dlib/may08/lavoie/05lavoie.html.>. Acesso em: 3 fev. 2006.


______; DEMPSEY, L. Thirteen ways of looking at - digital preservation. D-Lib
Magazine, v. 10, n. 7/8, jul./ago., 2004. Disponvel em:
<http://www.dlib.org/dlib/july04/lavoie/07lavoie.html>. Acesso em: 28 abr. 2005.


______; GARTNER, R. Preservation metadata. Oxford: DPC Technology watch
report, 2005.


LAZORCHAK, W. M. The ghost in the machine: traditional archival practice in the
design of digital repositories for long-term preservation. Chapel Hill: University of
North Carolina, 2005. Disponvel em:
<http://etd.ils.unc.edu/dspace/bitstream/1901/93/1/butchlazorchak.pdf>. Acesso em:
28 mar. 2006.


LAWRENCE, G. W. et al. Risk management of digital information: a file format
investigation. Washington: Council on Library and Information Resources, 2000.


LEE, K. et al. The state of the art and practice in digital preservation. Journal of
Research of the National Institute of Standards and Technology, v. 107, n. 1, p.
93-106, Jan./Feb. 2002. Disponvel em:
<http://nvl.nist.gov/pub/nistpubs/jres/107/l/j71lee.pdf>. Acesso em: 16 jul. 2006.


LeFURGY, W. G. Building preservation partnerships: The Library of Congress National
digital information infrastructure and preservation program. Library Trends, Washington,
v. 54, n. 1, p. 163-172, 2005.


______. Levels of service for digital repositories. D-Lib Magazine, v. 8, n. 5, May
2002.


LESK, M. Practical digital libraries: books, bytes and bucks. San Francisco, CA:
Morgan Kaufmann Publishers, 1997.


LEVACOV, M. Bibliotecas virtuais: (r)evoluo? Cincia da Informao, Braslia, v.
26, n. 2, p. 125-135, maio/ago. 1997.


LEVY, D. M. Heroic measures: reflections on the possibility and
purpose of digital preservation. In: ACM


306
CONFERENCE ON DIGITAL LIBRARIES, 3., 1998, Pittsburgh, Pennsylvania.
Proceedings New York: ACM Press, 1998.


LOCKSS. Lots of copies keep stuff safe. 2003 Disponvel em:
<http://lockss.stanford.edu/index.html>. Acesso em: 28 maio 2005.


______. LOCKSS Alliance. 2007. Disponvel em:
<http://www.lockss.org/lockss/LOCKSS_Alliance>. Acesso em: 20 out. 2005.


LUPOVICI, C.; MASANS, J. Metadata for the long term preservation of
electronic publications. Den Haag: NEDLIB Consortium, 2000. Disponvel em:
<http://www.kb.nl/nedlib/results/preservationmetadata.pdf>. Acesso em: 25 set.
2005.


LYMAN, P. Archiving the world wide web: in building a national strategy for
preservation: issues in digital media archiving. Washington: Council on Library and
Information Resources, 2002. Disponvel em:
<www.clir.org/pubs/reports/pub106/web.html>. Acesso em: 14 mar. 2006.


LYNCH, C. Institutional repositories: essential infrastructure for scholarship in the
digital age. ARL Bimonthly Report, n. 226, Feb. 2003. Disponvel em:
<http://www.arl.org/resources/pubs/br/br226/br226ir.shtml> Acesso em 2/nov/2008.


MARCUM, D. B.; FRIEDLANDER, A. Keepers of the crumbling culture: what digital
preservation can learn from library history. D-Lib Magazine, v. 9, n. 5, May 2003.
Disponvel em: <http://www.dlib.org/dlib/may03/friedlander/05friedlander.html>.
Acesso em: 7 jul. 2006.


MRDERO ARELLANO, M. . Preservao de documentos digitais. Cincia da
Informao, Braslia, v. 33, n. 2, maio/ago 2004.


______. Preservao digital: uma preocupao dos editores de revistas cientficas
eletrnicas no Brasil. In: ENCONTRO NACIONAL DE EDITORES CIENTFICOS, 9.,
2007, Ouro Preto, MG. Proceedings... Ouro Preto, MG: [s. n], 2007.


______. Publicao cientfica e arquivos abertos. In: SEMINRIO NACIONAL DE
BIBLIOTECAS UNIVERSITRIAS, 13., 2004, Natal. Anais... Natal: UFRN, 2004.


______; ANDRADE, R. S. Preservao digital e os profissionais da informao.
DataGramaZero, v. 7, n. 5, out. 2006.


307
MARTIN, J.; COLEMAN, D. Change the metaphor: the archive as an ecosystem. The
Journal of Electronic Publishing, Michigan, v. 7, n. 3, Abr. 2002. Disponvel em:
<http://www.press.umich.edu/jep/07-03/martin.html>. Acesso em: 28 nov. 2005.


MAYRING, P. Introduo pesquisa social qualitativa: uma introduo para
pensar qualitativamente. 5. ed. Weinheim: Beltz, 2002


MELLOR, P. CAMILEON: Emulation and BBC Domesday. RLG DigiNews, v. 7, n. 2,
Apr. 2003.


______; WHEATLEY, P.; SERGEANT, D. M. Migration on request: a practical
technique for preservation. In: ECDL: EUROPEAN CONFERENCE ON RESEARCH
AND ADVANCED TECHNOLOGY FOR DIGITAL LIBRARIES, 6, 2002, London.
Proceedings London: University of Leeds, 2002. Disponvel em:
<http://www.si.umich.edu/CAMILEON/reports/migreq.pdf>. Acesso em: 14 jul. 2005.


MESSERSCHMITT, D. Opportunities for Libraries in the NSF
Cyberinfrastructure Program. 2003. Disponvel em:
<http://www.loc.org/standards/mets/>. Acesso em: 14 out. 2006.


MCGOVERN, N. Y. A digital decade: where have we been and where are we going
in digital preservation? RLG DigiNews, v. 11, n. 1, Apr. 2007. Disponvel em:
<http://digitalarchive.oclc.org/da/ViewObject.jsp?objid=0000070519&reqid=8514>.
Acesso em: 28 ago. 2005.


MINAYO, M. C. S. O desafio do conhecimento. So Paulo: Hucitec; Rio de
Janeiro: Abrasco, 1992.


MOEN, W. The Metadata approach to accessing government information.
Government Information Quarterly, v. 18, n. 3, p. 155-165, 2001.


MOORE, R. W.; SMITH, M. Assessment of RLG trusted digital repository
requirements. 2005


______; ______. Automated validation of trusted digital repository assessment
criteria. JoDI, v. 8, n. 2, 2007. Disponvel em:
<http://journal.tdl.org/jodi/issue/view/34>. Acesso em: 21 ago. 2006.
MORGAN, C. Metadata and deposit protocols. 2000. Disponvel em:
<http://bic.org.uk/Cliff%20Mrgan>. Acesso em: 28 ago. 2005.




308
MOREQ2. Cornell Management Consultants plc. 2007. Disponvel em:
<http://www.moreq2.eu/>. Acesso em: 20 jun. 2008.


MORRIS, S. Open access: how are publishers reacting? Serials Review, v. 30, n. 4,
p. 304-307, Nov. 2004.


MUELLER, E., et al. The DiVA Project: development of an electronic publishing
system. D-Lib Magazine, v. 9, n. 1, Nov. 2003. Disponvel em:
<http://www.dlib/november03/muller/11muller.html>. Acesso em: 14 set. 2006.


MUIR, A. Digital preservation: awareness, responsibility
and rights issues. Journal of information science, v. 30, n. 1, p. 73-92, 2004.


MULLEN, A. GILS metadata initiative at the state level. Government Information
Quarterly, v. 18, n. 3, p. 167-180, Autumn 2001.


MUSEU DE ASTRONOMIA E CINCIAS AFINS. 5 curso de segurana de
acervos culturais: de 7 a 11 de maio de 2007, Coordenao de Documentao em
Histria da Cincia, Rio de Janeiro, 2007. 1 folder.


NATIONAL ARCHIVES OF AUSTRALIA. Recordkeeping metadata standard for
commonwealth agencies. Version 1.0. 1999. Disponvel em:
<http://www.naa.gov.au/recordkeeping/control/rkms/rkms_pt1_2.pdf>. Acesso em: 16
jul. 2005.


NATIONAL LIBRARY OF AUSTRALIA. Digital preservation policy. 2002.
Disponvel em: <http://www.nla.gov.au/policy/digpres.html>. Acesso em: 16 nov.
2005.


_______. Guidelines for the preservation of digital heritage. Paris: UNESCO,
2003. Disponvel em:
<http://unesdoc.unesco.org/images/0013/001300/130071e.pdf>. Acesso em: 25 nov.
2006.


______. Archiving web resources: issues for cultural heritage institutions. 2004.
Disponvel em: <http://www.nla.gov.au/webarchiving/program.html>. Acesso em: 27
ago. 2005.
NATIONAL LIBRARY OF NEW ZEALAND. Initiative. 2007. Disponvel em:
<http://www.natlib.govt.nz/en/whatsnew/4initiatives.html#extraction>. Acesso em: 20
fev. 2007.



309
______. Metadata standards framework: preservation metadata schema. 2003.
Disponvel em: <http://www.natlib.govt.nz/en/whatsnew/4initiatives.html#meta>.
Acesso em: 28 jul. 2007.


NATIONAL SCIENCE FOUNDATION. Revolutionizing science and engineering
through cyberinfrastructure: report of the National Science Foundation Blue-Ribbon
Advisoty Panel on Cyberinfrastructure. Washington: National Science Goundation, 2005.
Disponvel em: <http://www.communitytechnology.org/nsf_ci_report/>. Acesso em: 24
fev. 2006.


NESTOR WORKING GROUP ON TRUSTED REPOSITORIES CERTIFICATION.
Catalogue of criteria for trusted digital repositories. 2006. Disponvel em:
<http://edoc.hu-berlin.de/series/nestor-materialien/8en/PDF/8enpdf>. Acesso em: 6
nov. 2006.


NIXON, W. The evolution of an institutional e-prints archive at the University of
Glasgow. Ariadne, n. 32, jul. 2002. Disponvel em:
<http://www.ariadne.ac.uk/issue32/eprint-archives/>. Acesso em: 14 abr. 2006.


OCLC. Digital archive. 2003. Disponvel em:
<http://www.oclc.org/digitalpreservation/>. Acesso em: 27 jan. 2006.


______. OCLC digital preservation resources. Disponvel em:
<http://www.oclc.org/digitalpreservation/about/co-op/>. Acesso em: 15 nov. 2003.


OCLC RESEARCH. Preservation metadata working group II: implementation
strategies. 2003. Disponvel em: <http://www.oclc.org/research/pmwg/>. Acesso em:
27 nov. 2004.


OCLC/RLG. Data dictionary for preservation metadata: final report of the PREMIS
Working Group. Dublin, OH: OCLC, 2005.


______. Preservation metadata for digital objects: a review of the state of the art.
2001. Disponvel em: <http://www.oclc.org/research/projects/pmwg/presmeta_wp.pdf>.
Acesso em: 28 jul. 2006.


______. Preservation metadata working group: a metadata framework to support the
preservation of digital objects. Dublin, Ohio: Online Library Computer Center, 2002.
Disponvel em: <http://www.oclc.org/research/pmwg/pm_framework.pdf.>.
Acesso em: 14 ago. 2006.



310
OCLC/RLG PREMIS WORKING GROUP. Implementing preservation repositories
for digital materials: current practice and emerging trends in the cultural heritage
community. Dublin, Ohio: Online Computer Library Center, 2004. Disponvel em:
<http://www.oclc.org/research/projects/pmwg/surveyreport.pdf>. Acesso em: 2 ago
2006.


OKUBO, Y. Bibliometric indicators and analysis of research systems: methods
and examples. Paris: OCDE/GD, 1997.


OLTMANS, E; KOL, N. A comparison between migration and emulation in terms of
costs. RLG DigiNews, v. 9, n. 2, 2005.


PADI. Legal deposit. 2003. Disponvel em:
<http://www.nla.gov.au/padi/topics/67.html>. Acesso em: 27 jan. 2004.


PEREIRA, J. C. R. Anlise de dados qualitativos: estratgias metodolgicas para
as cincias da sade, humanas e sociais. 3. ed. So Paulo: Universidade de So
Paulo, 2001.


PETERS, T. Digital repositories: individual, discipline-based, institutional, consortia,
or national? Journal of Academic Librarianship, v. 28, n. 6, p. 414-417, Nov. 2002.


PINFIELD, S. Creating institutional e-print repositories? Serials, v.15, n.3, p. 261-
264, nov. 2002, Disponvel em:
<http://eprints.nottingham.ac.uk/archive/00000064/00/serials2002.pdf>. Acesso em:
29 de jun. 2006.


______; GARDNER, M.; MACOLL, J. Setting up an institutional e-print archive.
Ariadne, n. 31, Mar./Apr. 2002. Disponvel em:
<http://www.ariadne.ac.uk/issue31/eprint-archives/intro.html>. Acesso em: 29 jun.
2006.


______; JAMES, H. The digital preservation of e-prints. D-Lib Magazine, v. 9, n. 9,
Aug. 2003. Disponvel em: <http:
www.dlib.org/dlib/september03/pinfield/09pinfield.html>. Acesso em: 4 fev. 2006.


PINHEIRO, L. V. R.; LOUREIRO, J. M. M. Traados e limites da cincia da
informao. Cincia da Informao, Braslia, v. 24, n. 1, p. 42-53, jan./abril 1995.




311
PLUMMER, K. Documents of life: an Introduction to the problems and literature of a
humanistic method. London: George Allen & Unwin, 1983.


POTHEN, P. Digital curation: digital archives, libraries and e-science. York, UK:
Digital Preservation Coalition and the British National Space Centre, 2001.
Disponvel em: <http://www.dpconline.org/graphics/events/richtext/digital-
seminarrepdg.html>. Acesso em: 4 dez. 2004.


PUBLIC RECORD OFFICE VICTORIA - PROV. Victorian Electronic Records
Strategy. Melbourne: 1999. Disponvel em:
<http://www.prov.vic.gov.au/vers/published/final/final.pdf>. Acesso em: 10/dez/2007.


POTTER, M. Researching long term digital preservation approaches
in the dutch digital preservation testbed (Testbed Digitale Bewaring).
RLG DigiNews, v. 6, n. 3, June 2002. Disponvel em:
<http://www.rlg.org/preserv/diginews/diginews6-3.html#feature2>. Acesso em: 5 fev.
2006.


PRITCHARD, A. Statistical bibliography or bibliometrics? Journal of
Documentation, London, v. 25, n. 4, p. 348-349, Dec. 1969.


QUENAULT, H. VERS: building a digital record heritage. In: BIENNIAL
CONFERENCE AND EXHIBITION OF THE VICTORIAN ASSOCIATION FOR
LIBRARY AUTOMATION, 12., 2004, Austrlia. Paper presented at VALA 2004:
breaking boundaries: integration and interoperability. Disponvel em:
<http://www.vala.org.au/vala2004/2004pdfs/13Quena.PDF>. Acesso em: 3 nov.
2007.


REICH, V. A. Diffused knoledge immortalizes itself: the LOCKSS Program. High
Energy Physics Libraries Webzine, n. 7, Jul. 2003. Disponvel em:
<http://library.istl.org/02-fall/article1.html>. Acesso em: 14 jun. 2006.


______; ROSENTHAL, D. S. H. LOCKSS: a permanent web publishing and access
system. D-Lib Magazine, v. 7, n.6, Jun. 2001.

RESEARCH LIBRARIES GROUP. Attributes of a trusted digital repository for
digital materials: meeting the Needs for research resources. Mountain View, CA:
RLG, 2001. Disponvel em: <http://www.rlg.org/longterm/attributes01.pdf>. Acesso
em: 17 jul. 2006.
______. Audit checklist for certifying digital repositories. 2006.
<http://www.rlg.org/en/page.php?Page_ID=20769>. Acesso em: 4 maio 2005.




312
______. Working group on preservation issues of metadata: final report, research
libraries group. Mountain View, CA: RLG, 1998. Disponvel em:
<www.rlg.org/preserv/presmeta.html>. Acesso em: 12 dez. 2005.


RIBEIRO, D. O processo civilizatrio. Rio de Janeiro: Civilizao Brasileira, 1975.


RICHARDSON, R. J. et al. Pesquisa social: mtodos e tcnicas. 3. ed.rev. e ampl.
So Paulo: Atlas, 1999.


RLG/OCLC. Trusted digital repositories: attributes and responsibilities. Montain
View, Canada: RLG-OCLC Report, 2002. Disponvel em:
<http://www.rlg.org/longterm/repositories.pdf>. Acesso em: 23 jun. 2005.


______. Open Archival Information System (OAIS). Resources. 2002. Disponvel em:
<http://www.rlg.org/longterm/oais.html>. Acesso em: 2 dez. 2005.


RLG-NARA. Audit checklist for certifying digital repositories. [S. l.]: RLG-NARA Task
Force on Digital Repository Certification, 2006. <http://www.rlg.org/en/pdfs/rlgnara-
repositorieschecklist.pdf>. Acesso em: 15 nov. 2005.


RLG/NARA TASK FORCE ON DIGITAL REPOSITORY CERTIFICATION.
Trustworthy repositories audit and certification. 2007. Disponvel em:
<http://www.crl.edu/PDF/trac.pdf>. Acesso em: 30 mar. 2007.


RODRIGUES, E. et. al. RepositriUM: criao e desenvolvimento do Repositrio
Institucional da Universidade do Minho. In: CONGRESSO NACIONAL DE
BIBLIOTECRIOS, ARQUIVISTAS E DOCUMENTALISTAS, 9., 2004., Estoril,
Portugal. Anais Estoril, Portugal: [s. n.], 2004.


RODRIGUES, M. L. T. S. Preservao digital de longo prazo: estado da arte e
boas prticas em repositrios digitais. 2003. Dissertao (Mestrado em Estudos de
Informao e Bibliotecas Digitais) - Departamento de Cincias e Tecnologias da
Informao, Lisboa, 2003.


RONDINELLI, R. C. Gerenciamento arquivsticos de documentos eletrnicos.
Rio de Janeiro: FGV, 2002. 160 p.


ROSENTHAL D. S. H. et. al. Requirements for digital preservation systems: a
bottom-up approach. D-Lib Magazine, v. 11, n. 11, Nov. 2005. Disponvel em:


313
<http://www.dlib.org/dlib/november05/rosenthal/11rosenthal.html>. Acesso em: 28
jul. 2005.


ROTHENBERG, J. Avoiding technological quicksand: finding a viable technical
foundation for digital preservation. Washington: Council on Library and Information
Resources, 1999. Disponvel em: <http://
www.clir.org/pubs/reports/rothenberg/contents.html>. Acesso em: 26 jul. 2006.


______. Digital preservation summary. 2003. Disponvel em:
<http://www.nationalarchives.gov.uk/documents/rothenberg.pdf>. Acesso em: 2 nov.
2008.


______. Ensuring the longevity of digital documents. 1995. Scientific American, 272
(1), pp. 24-29. Disponvel em: <http://www.clir.org/pubs/archives/ensuring.pdf>.
Acesso em: 16 nov. 2006.


______. An experiment in using emulation to preserve digital publications.
Netherlands: Koninklijke Bibliotheek Den Haag, 2000. Disponvel em:
<http://www.kb.nl/coop/nedlib/results/emulationpreservationreport.pdf.>. Acesso em:
9 jun. 2005.


______. Metadata to support data quality and longevity. In: IEEE METADATA
CONFERENCE, 1., 1996, Silver Spring, Md. Proceedings Silver Spring, Md.:
NOAA Complex, 1996. p. 16-18.
<http://www.computer.org/conferences/meta96/rothenberg_Paper/ieee.data-quality.
html>. Acesso em: 29 nov. 2005.


RUIZ, J. . Metodologia cientfica: guia para eficincia nos
estudos. So Paulo: Atlas, 1979.


RUSSELL, K; SERGEANT, D. The Cedars Project: implementing a model for
distributed archives. RLG DigiNews, v. 3, n. 3, June 1999.


SANNETT, S. Toward developing a framework of cost elements for preserving
authentic electronic records into perpetuity. College & Research Libraries, v. 63, p.
388-404, Sep. 2002.


______. The cost to preserve authentic electronic records in perpetuity: comparing
costs across cost models and cost frameworks. RLG DigiNews, v. 7, n. 4, Aug.
2003.


314
SANT'ANNA, M. L. Os desafios da preservao de documentos pblicos digitais.
Revista IP, ano 3, n. 2, dez. 2001. Disponvel em:
<http://www.informaticapublica.mg.gov.br/revista0302/ip0302santanna.pdf>. Acesso
em: 18 fev. 2006.


SARACEVIC, T. Information science: origin, evolution and relations. In: VAKKARI, P.,
CRONIN, B. (Ed.). Conceptions of library and information science. Los Angeles:
Taylor Grahan, 1992.


SAWYER, D. M. Framework for digital archiving: OAIS reference model. 2002.
Presentation delivered at the OCLC Steering by Standards Teleconference on the
OAIS Imperative: Enduring Record or Digital Dust? Columbus, Ohio, Apr. 19, 2002.


SAYO, L. F. Preservao digital no contexto das bibliotecas digitais: uma breve
introduo. In. MARCONDES, Carlos H. et al. (Org.). Bibliotecas digitais: saberes e
prticas. Salvador: EDUFBA; Braslia: IBICT, 2005. p. 115-146.


SEARLE, S.; THOMPSON, D. Preservation metadata. Pragmatic First Steps at the
National Library of New Zealand. D-Lib Magazine, v. 9, n. 4, Abr. 2003. Disponvel
em: <http://www.dlib.org/dlib/april03/thompson/04thompson.html>. Acesso em: 24
jan. 2006.


SELLTIZ, C. et al. Mtodos de pesquisa nas relaes sociais. So Paulo:
EDUSP, 1975.


SILVERMAN, D. Doing qualitative research: a practical handbook. London: Sage
Publications, 2000.


SIMPSON, D. Contracting out for digital preservation services: Information leaflet
and checklist. [S. l.]: Digital Preservation Coalition, 2004.


SINCLAIR, K. The VERS standards. 2003. Disponvel em:
<http://vers.imagineering.com.au/erecord_library/library.htm#voapstandard>. Acesso
em: 2 abr. 2006.


SMITH, A. Long term archiving of digital documents in physics. In: INTERNATIONAL
UNION OF PURE AND APPLIED PHYSICS, 2001, Lyon, France: American Physical
Society, 2001. Report of the Meeting sponsored by the Working Group on
Communication in Physics. Disponvel em:
<http://publish.aps.org/IUPAP/Itaddp_report.html>. Acesso em: 13 jul. 2005.



315
SMITH, K. Institutional repositories and e-journal archiving: what are we learning?
The Journal of Electronic Publishing, v. 11, n. 1, Winter 2008. Disponvel em:
<http://hdl.handle.net/2027/spo.3336451.0011.107>. Acesso em: 16 maio 2005.


SMITH, M. Practical preservation activities. In: WORKSHOP ON LONG-TERM
CURATION WHITIN DIGITAL REPOSITORIES, 2005. Resumos Cambridge, UK:
MIT Libraries, 2005.


STAPLES, T; WAYLAND, R; PAYETTE, S. The Fedora Project: an open source
digital repository management system. D-Lib Magazine, v. 9, n. 4, Apr. 2003.
Disponvel em: <http://www.dlib.org/dlib/april03/staples/04staples.html>. Acesso em:
14 nov. 2005.


STEENBAKKERS, J. F. Preserving electronic publications. Information Services &
Use, v. 22. p. 89-96, Jan. 2002.


______. Setting up a deposit system for electronic publications: the NEDLIB
guidelines. NEDLIB Report Series 5, 2000. Disponvel em:
<http://www.kb.nl/coop/nedlib/results/NEDLIBguidelines.pdf>. Acesso em: 14 set.
2005.


STEPHENS, D. O; WALLACE, R. C. Electronic records retention: new strategies
for data life cycle management. Lenexa, KS: ARMA International, 2003.


STINSON, D; AMELI, F; ZAINO, N. Lifetime of KODAK Writable CD and Photo CD
Media. Rochester, NY: Eastman Kodak Company, Digital & Applied Imaging, 1995.


SUBER, P. How should we define open access? 2003. SPARC Open Access
Newsletter. Disponvel em: <https://mx2.arl.org/Lists/SPARC-
OANews/Message/96.html> 2003. Acesso em: 18 de jun. de 2006.


SUTTON, S. Conceptual design and deployment of a metadata framework for
educational resources on the Internet. Journal of the American Society for
Information Science, v. 50, n. 13, p. 1182-1192, 1999.


SWADE, D. The problems of software conservation. History and Computing, v. 4,
n. 2, 1992. Disponvel em: <http://www.cs.man.ac.uk/CCS/simulate/sim_home.htm>.
Acesso em: 14 ago. 2006.




316
TANSLEY, R., et al. The Dspace Institutional digital repository system: current
functionality. In: CONFERENCE ON DIGITAL LIBRARIES, 2003, Los Alamitos, CA.
Proceeding Los Alamitos, CA: IEEE. p. 89-97.


TASK FORCE ON THE ARCHIVING OF DIGITAL INFORMATION. Preserving
digital information: report of the task force on archiving of digital information.
Washington: Commission on Preservation and Access, 1996. Disponvel em:
<http://www.rlg.org/ArchTF/>. Acesso em: 28 jul. 2004.


TEPER, T. H.; KRAMER, B. Long-term retention of electronic theses and
dissertations. College & Research Libraries, v. 63, n. 1 p. 61-72, 2002.


TERRIO, R. Electronic metaphors and paper realities. Progressive Librarian, v. 21,
p. 28-37, 2002.


THIBODEAU, K. Overview of technological approaches to digital preservation
and challenges in coming year: what does it mean to preserve digital objects?
Washington: Council on Library and Information Resources, 2002. Disponvel em:
<http://www.clir.org/pubs/reports/pub107/thibodeau.html>. Acesso em: 27 jan. 2004.


THOMAS, D. Digital preservation at the National Archives. London: The
National Archives, [2003?]. Disponvel em:
<http://www.nationalarchives.gov.uk/preservation/digitalarchive/pdf/dpattna.pdf>.
Acesso em: 7 ago. 2004.


THOMAZ, K. A preservao de documentos eletrnicos de carter arquivstico:
novos desafios, velhos problemas. 2004. 388 p. Tese (Doutorado em Cincia da
Informao) Escola de Cincia da Informao, Universidade Federal de Minas
Gerais, Belo Horizonte, 2004.


______. Repositrios digitais confiveis e certificao. Arquivistica.net, Rio de Janeiro,
v. 3, n. 1, jan./jun.2007. Disponvel em:
<http://www.arquivistica.net/ojs/viewarticle.php?id=118>. Acesso em: 5 mar. 2008.

______. TECH-IN. [mensagem pessoal]. Mensagem recebida por <miguel@ibict.br.
em 1 nov. 2008.


______; SOARES, A. J. A preservao digital e o modelo de referncia Open
Archival Information System (OAIS). Revista de Cincia da Informao, Braslia, v.
5, n. 1, fev. 2004. Disponvel em: <http://www.dgz.org.br/fev04/Art_01.htm>. Acesso
em: 7 jun. 2005.


317
UNESCO. Carta para la preservacin del patrimonio digital. [Paris?]: UNESCO,
2003. Disponvel em:
<http://www.arquivonacional.gov.br/conarq/cam_tec_doc_ele/preservacao/cartapres
ervacao.asp>. Acesso em: 23 jul. 2004.


______. The legal deposit of electronic publications, 1998. Disponvel em:
<http://www.unesco.org/webworld/memory/legaldep.htm>. Acesso em: 18 nov. 2006.


______. Recomendaes sobre Software Livre para Repositrio e Sistema de
Preservao. Paris: UNESCO, 2007.


VAN BOGART, J. W. Magnetic tape storage and handling: a guide for libraries and
archives. Washington: Commission on Preservation and Access, 1995.


VAN DE SOMPEL, H.; LAGOZE, C. The Santa Fe Convention of the Open Archives
Initiative. D-lib Magazine, v. 6, n. 2, Feb. 2000. Disponvel em: <http://www.dlib.org>.
Acesso em: 14 fev. 2006.


VAN NUYS, C. The Paradigma Project. RLG DigiNews, v. 7, n. 2, Apr. 2003.
Disponvel em:
http://worldcat.org/arcviewer/1/OCC/2007/08/08/0000070511/viewer/file3600.html#fe
ature2. Acesso em: 31 out. 2008.


WAIBEL, G. Produce, publish and preserve: a holistic approach to digital assets
management. Journal of the Museum Computer Network, Spectra, v. 26, n. 7,
2000. Disponvel em: <http://www.bampfa.berkeley.edu/moac/imaging/index.html>.
Acesso em: 7 ago. 2006.


WALKER, F. L.; THOMA, G. R. A web-based paradigm for file migration. In:
ARCHIVING CONFERENCE, 2004, San Antonio, Texas, USA. Proceedings San
Antonio, Texas, USA: IS&Ts, 2004.

WATERS, D.; GARRETT, J. Preserving digital information: report of the task force
on archiving of digital information commissioned. Washington, DC: Commission on
Preservation and Access. 1996.


WEBB, C. The role of preservation and the library of the future. [S. l.]: National
Library of Australia, 2000. Disponvel em:
<http://www.nla.gov.au/nla/staffpaper/cwebb9.html>. Acesso em: 17 nov. 2006.




318
WHEATLEY, P. Institutional repositories in the context of digital preservation.
Leeds: University of Leeds, 2004.


______. A way forward for developments in the digital preservation functions of
dspace: options, issues and recommendations. 2003. Disponvel em:
<http://dspace.org/news/articles/DpAndDSpace.pdf>. Acesso em: 14 jul. 2007.


______. Migration: a camileon discussion paper. Ariadne, 2001. Disponvel em:
<http://www.ariadne.ac.uk/issue29/camileon/>. Acesso em: 1 ago. 2006.


WIGGINS, Richard. Digital preservation: paradox and promise. Library Journal, p.
12-15, spring 2001.


WIPO COPYRIGHT TREATY. In: DIPLOMATIC CONFERENCE ON CERTAIN
COPYRIGHT AND NEIGHBORING RIGHTS QUESTIONS, 10., 1996, Geneva.
Anais Geneva: International Bureau of WIPO, 1996. Disponvel em:
<http://www.wipo.int/eng/diplconf/distrib/94dc.htm>. Acesso em: 10 mar. 2005.


WOODS, A. When preserving the past: think of the future. Multimedia Information
and Technology, v. 28, n. 3, p. 71-72, 1998.


ZENG, M. Metadata elements for object description and representation: a case report
from a digitized historical fashion collection project. Journal of the American
Society for Information Science, v. 50, p. 1193-1208, 1999.








319
APNDICE A Questionrio

Levantamento de dados

Instituio:
Endereo:
Site:
Responsvel pelo(a) Biblioteca/Centro de Informao/Arquivo


Nmero de servidores Biblioteca/Centro de Informao/Arquivo:
Tcnico (Bibliotecrios)

Auxiliares:


Situao administrativa da Biblioteca/Centro de Informao/Arquivo:
( ) Central ( ) Setorial
( ) especializada ( ) abrangncia geral

Informaes quanto ao tratamento dado aos seguintes tipos de materiais:

FORMA DE ACESSO AO
CONTEDO
TIPO DE MATERIAL
SISTEMA
ONLINE?
QUAL
SOFTWARE
UTILIZA?
SETOR
RESPONSVEL
UTILIZA
FERRAMENTA
INDEXAO?
QUAL?
BIBLIOGRFICO
TEXTO
COMPLETO
Monografias (livros/ anais/
teses/dissertaes )

Analticas (captulos de
livros)

Peridicos
Artigos revistas
Comunicaes em
eventos

Multimeios (filmes, CDs,
DVDs, fotografias etc.)

TCC/Trabalhos
experimentais

Produo docente
Outros .....

Obs.:
(1) sistema on-line => mencionar se os diversos tipos de materiais esto recebendo
algum tipo de tratamento e se este tratamento j est automatizado. Se sim, qual o
software utilizado.
(2) Setor responsvel => existncia de algum banco de dados interessante na rea e
que no necessariamente est na Biblioteca.
(3) Ferramenta de indexao => informar qual o vocabulrio e/ou tesauro est sendo
utilizado, e se h o desenvolvimento pela unidade de algum vocabulrio e/ou tesauro
especfico para o tratamento e controle da indexao.



320
Classificao, armazenamento e conservao da produo cientifica da
unidade
Igual a do acervo geral Especfico para a coleo
Classificao
Forma de armazenamento
Metodologia para conservao
(em qualquer suporte)


Caso utilize um tratamento especifico para a coleo, informe como feito:
Classificao
Forma de armazenamento
Metodologia para conservao
(em qualquer suporte)


Descrio do tratamento dado aos materiais digitais:
Sim No
Aplicao de metodologia de digitalizao
Aplicao de estratgia de preservao:
Participao em iniciativa nacional/internacional de preservao
digital:











321
APNDICE B Roteiros de entrevistas

Roteiros das entrevistas com representantes das unidades de pesquisa do
MCT

Primeiro Roteiro de Entrevista
(Aplicado em eventos cientficos)

Primeiro grupo: formao profissional e caractersticas socioespaciais das tarefas
realizadas pelo entrevistado:
f) profisso
g) titulao mxima
h) tempo de servio
i) cargo ocupado atualmente
j) tempo no cargo atual

Segundo grupo: descrio das atividades desenvolvidas pelos respondentes que envolvem
algum tipo de tratamento tcnico nos arquivos digitais da instituio:
g) Quais atividades cientficas so realizadas pela sua instituio?
h) Que tipo de produo cientfica j est em formato digital?
i) Quem so os usurios dessa produo cientfica?
j) Quais atividades de preservao de documentos digitais esto sendo realizadas
pela sua instituio?

Terceiro grupo: opinies sobre o material a ser preservado e seus responsveis:
k) Qual produo cientfica deve ser preservada pela sua instituio?
l) Quem so os responsveis por essas atividades de preservao?



Segundo Roteiro de Entrevista
(Aplicado nas sedes das UPs)

1. Conferindo a identificao individual
(Nome, faixa etria, profisso, titulao, cargo, tempo de trabalho na instituio, tempo no
cargo)

2. Conferindo a identificao da unidade
(Nome, localizao, histrico)

3. Conferindo as informaes institucionais
(Atividades cientficas, linhas de pesquisa, tipo de produo cientfica, publicaes)

4. Conferindo as informaes institucionais do setor da Biblioteca/Centro de
Informao e do Setor de Informtica
(Dados na descrio oficial, tipo de usurios, site)

5. Atualizao dos dados coletados no questionrio enviado em 2004
5.1 Funcionrios
5.2 Tipo de biblioteca
5.3 Tipo de material/ferramentas de software
5.4 Tipo de material/ setor responsvel
5.5 Tipo de material/Ferramenta de indexao
5.6 Tipo de material/Tipo de registro para acesso


322
5.7 Tratamento da produo cientfica (classificao, armazenamento e conservao)
5.8 Tratamento da produo cientfica em formato digital (digitalizao, estratgia de
preservao, participao em iniciativa)

6. Descrio do registro da produo cientfica da instituio (gerenciamento do registro
da produo)

7. Descrio do ciclo de vida da produo cientfica em formato digital na instituio
(tipo de documentos, tratamento)

8. Funcionrios do setor de informtica que atendem biblioteca
8.1 Tipo de atendimento
8.2 Tipo de software/infra-estrutura
8.3 Setor responsvel
8.4 Gerenciamento de sistemas
5.6 Segurana
5.7 Recuperao de desastres
5.8 Suporte preservao digital (Formatos de identificao, validao, extrao de
metadados, normalizao de entrada de dados; replicao de contedo; migrao de
verses; emulao).

9. Descrio do tratamento dos acervos digitais pelo setor de suporte tcnico da
instituio (atividades de armazenamento, segurana e preservao dos dados)

10. Viso pessoal sobre a preservao digital da produo tcnico-cientfica na unidade
(Opinio e plano de preservao digital para a instituio)







323
APNDICE C Lista de projetos e iniciativas de preservao digital


1. ArchiSig
URL: www.archisig.de/english/index.html

2. Archiving the Avant Garde
URL: http://www.bampfa.berkeley.edu/about/avantgarde

3. ARELDA Project
URL: http://www.bar.admin.ch/themen/00532/00536/index.html?lang=fr

4. ARTISTE
URL: http://www.it-innovation.soton.ac.uk/projects/artiste/

5. Assessment of UK Data Archive and The National Archives compliance with
OAIS/METS
URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/assetmanagement/oai
s.aspx

6. Auditing and Certification of Digital Archives
URL: http://digitalarchive.oclc.org/

7. Automatic metadata extraction
URL: http://www.springerlink.com/content/j75r8rw691664273/

8. BBC Domesday Rescue Project
URL:http://old.cs.ncl.ac.uk/research/events/colloquia/abstract.php?id=139

9. Biblioteca Universalis
URL:http://www1.bncf.firenze.sbn.it/progetti/Bib_Uni/prototipo/pag13_ns.htm

10. British Broadcasting Corporation (BBC)
URL: http://en.wikipedia.org/wiki/BBC

11. British Library DOM (Digital Object Management)
URL: http://www.bl.uk/aboutus/stratpolprog/digi/dom/index.html

12. Cairo (Complex Archive Ingest for Repository Objects)
URL: http://cairo.paradigm.ac.uk/

13. Camileon
URL: http://www.si.umich.edu/CAMILEON/

14. Canadian National Digital Inventory
URL: http://www.library.uiuc.edu/spx/inventory/projects.html

15. CEDARS - CURL Exemplars in Digital Archives
URL: http://www.leeds.ac.uk/cedars/

16. CENSA (Collaborative Electronic Notebook Systems Associations)
URL: http://www.censa.org/

17. CHIN: Creation and Managing Digital Content
URL: http://www.chin.gc.ca/English/About_Chin/chin.html


324

18. Clinical Data Interchange Standards Consortium (CDISC)
URL: http://www.cdisc.org/

19. CMS Metadata Interoperability Project: Ensuring Metadata Interoperability
Across Scottish Content Management Systems and Digital Repositories
URL: http://cms.cdlr.strath.ac.uk/

20. Conservation Online (CoOL)
URL: http://palimpsest.stanford.edu/

21. Council for the Central Laboratory of the Research Councils (CCLRC)
URL:http://www.hero.ac.uk/uk/reference_and_subject_resources/resources/opacs_in
_britain_and_ireland_obi/obi_council_for_the_central_la4756.cfm

22. DAAT: Digital Asset Assessment Tool
URL: ahds.ac.uk/about/projects/daat/

23. DELOS/NSF study on the digital preservation research agenda
URL: http://www.dpconline.org/graphics/whatsnew/issue12.html

24. Digicult
URL: http://www.digicult.info/pages/index.php

25. Digital Academic Repositories (DARE), 2003-2006
URL: http://digitalarchive.oclc.org/

26. Digital Curation Centre
URL: http://digitalarchive.oclc.org/

27. Digital Image Archive of Medieval Music (DIAMM)
URL: http://www.diamm.ac.uk/index.html

28. Digital Images Archiving Study
URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/imagesarchiving

29. Digital Information Archiving System (DIAS) Dutch National Library
URL: http://www-05.ibm.com/nl/dias/preservation2.html

30. Digital Preservation
URL: http://www.digitalpreservation.gov/

31. Digital Preservation Cluster, 2004-2006
URL: http://digitalarchive.oclc.org/

32. Digital Preservation Coalition
URL: http://www.dpconline.org/graphics/index.html

33. Digital Preservation Training Programme
URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/assetmanagement/dp
tp.aspx

34. DiVA Electronic Publishing Centre, Uppsala University Library
URL: DiVA Electronic Publishing Centre, Uppsala University Library



325
35. Dlib (D-Lib Forum)
URL: http://www.dlib.org/

36. Domain UK
URL: http://bibnum.bnf.fr/ecdl/2002/uk/uk.html

37. DOMEA: Dokumentenmanagement und elektronische Archivierung
URL: http://www.uni-koblenz.de/fvi/projekte/domea.html

38. DOMS (National Library of Scotland)
URL: http://en.wikipedia.org/wiki/National_Library_of_Scotland

39. Dorothy Dunnett Disks Project
URL: http://www.dpconline.org/graphics/join/projects.html

40. DSpace MIT
URL: http://dspace.mit.edu/

41. DSpace@ Cambridge
URL: http://www.lib.cam.ac.uk/dspace/

42. Dublin Core Metadata Initiative
URL: http://dublincore.org/

43. Earth Resources Observation Systems (EROS) Data Center
URL: http://edc.usgs.gov/

44. ECHO DEPository Project, 2004-2007
URL: http://www.ndiipp.uiuc.edu/

45. E-Journal Archiving Study
URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/ejournalarchiving.asp
x

46. E-Learning Project
URL: http://www.browsemystuff.com/browse/elearning/elearning-project/

47. ERA: Electronic Records Archive Program
URL: http://www.diglib.org/preserve/ERA2004.htm

48. EROS: Electronic Records in Office Systems
URL: http://www.nationalarchives.gov.uk/recordsmanagement/

49. ERPANET Project
URL: http://www.erpanet.org/

50. E-Science Data Curation Audit
URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/escience.aspx

51. European Museums Information Institute
URL: http://www.emii.org/map/

52. EVA project
URL: http://www.evaproject.it/



326
53. Feasibility Study On E-Prints
URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/eprints.aspx

54. FEDORA
URL: http://fedoraproject.org/

55. Fedora (Flexible Extensible Digital Object Repository Architecture) Cornell
University and the University of Virginia Library
URL: http://blog.eukhost.com/webhosting/flexible-extensible-digital-object-repository-
architecture/

56. File integrity and identification
URL: http://www.freepatentsonline.com/7043495.html

57. HEDS - Higher Education Digitisation Service
URL: http://heds.herts.ac.uk/

58. Hybrid Archives Project
URL: http://www.webarchive.org.uk/tep/15939.html

59. ICA work-book on ERM
URL: http://www.dpconline.org/graphics/join/projects.html

60. Incentives for Data Producers to Create Archive-Ready Data Sets,2005-2006
URL: http://digitalarchive.oclc.org/

61. International Internet Preservation Consortium (IIPC)
URL: http://www.netpreserve.org/about/index.php

62. International Research on permanent Records in Electronic Systems
URL:http://www.interpares.org/

63. InterPARES
URL: http://www.interpares.org/

64. IRI Scotland Project
URL:
http://www.jisc.ac.uk/whatwedo/programmes/digitalrepositories2005/iriscotland.aspx

65. JSTOR
URL: http://www.jstor.org/

66. MALIBU - Managing the hybrid library for the benefit of users
URL: http://cat.inist.fr/?aModele=afficheN&cpsidt=2000614

67. mandate: Managing Digital Assets in Tertiary Education
URL: http://www.jisc.ac.uk/publications/publications/mandatefinalreport.aspx

68. Metadata Generation Research (MGR)
URL: ils.unc.edu/mrc/mgr.html

69. Metadata Encoding & Transmission Standard (METS)
URL: http://www.loc.gov/standards/mets/

70. Metadata Watch (Forum for Metadata Schema Implementors)


327
URL: http://www.schemas-forum.org/metadata-watch/

71. METAe (The Metadata Engine Project)
URL: http://meta-e.aib.uni-linz.ac.at/

72. MetaNet
URL: http://www.epros.ed.ac.uk/metanet/

73. METS Awareness Training
URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/assetmanagement/m
ets.aspx

74. Models for Action Project
URL:
http://www.ctg.albany.edu/publications/journals/models_for_action?chapter=1&sectio
n=1

75. MoPark Metadata Options Appraisal
URL: http://eprints.rclis.org/archive/00002278/

76. Moving Pictures and Sound Archiving Study
URL: http://64.233.169.104/search?q=cache:JTo9N4775yIJ:www.jisc-
collections.ac.uk/uploaded_documents/MPS%2520vision.doc+Moving+Pictures+and
+Sound+Archiving+Study&hl=pt-BR&ct=clnk&cd=7&gl=br

77. National Archives (UK) Digital Archive
URL: http://www.nationalarchives.gov.uk/preservation/digital.htm

78. NDIIPP - National Digital Information Infrastructure and Preservation Program
URL: http://www.lib.ncsu.edu/ndiipp/

79. NSW Recordkeeping Metadata Standard
URL:http://www.records.nsw.gov.au/recordkeeping/nsw_recordkeeping_metadata_st
andard_4614.asp

80. OCLC Digital Archive
URL: http://www.oclc.org/digitalarchive/

81. OCLC Preservation Policy
URL: http://www.nla.gov.au/padi/topics/172.html

82. OCLC Preservation Resources
URL: http://www.oclc.org/preservation/default.htm

83. OCLC: Digital Preservation Education and Planning
URL: http://www.oclc.org/preservation/education/default.htm

84. OCLC: Incentives to Preserve Digital Materials
URL: http://jobfunctions.bnet.com/abstract.aspx?docid=161155

85. OCLC: Registry of Digital Masters
URL: http://www.oclc.org/digitalregistry/

86. Oxford Digital Library
URL: http://www.odl.ox.ac.uk/


328

87. PADI (Preservation Access to Digital Information)
URL: http://www.nla.gov.au/padi/

88. PANDORA - National Library of Australia
URL: http://www.nla.gov.au/policy/pandje97.html

89. PANDORA Archive (Preserving and Accessing Networked Documentary
Resources of Australia)
URL: http://pandora.nla.gov.au/

90. Persistent Identifiers
URL: http://www.nla.gov.au/initiatives/persistence.html

91. Personal Archives Accessible in Digital Media (paradigm)
URL: http://www.paradigm.ac.uk/

92. PREMIS
URL: http://www.oclc.org/research/projects/pmwg/

93. PRESERV (PREServation Eprint SERVices)
URL: http://preserv.eprints.org/

94. Preservating Digital Reformatting Program
URL: http://www.loc.gov/preserv/prd/presdig/presintro.html

95. Preservation Metadata Working Group
URL: http://www.oclc.org/research/projects/pmwg/wg1.htm

96. PRESTO Preservation Technologies
URL: http://www.it-innovation.soton.ac.uk/projects/prestospace/

97. Profiles in Science, National Library of Medicine
URL: http://www.encyclopedia.com/doc/1G1-83583418.html

98. Project Open Book
URL: http://openbookproject.net/

99. PRONOM
URL: http://www.nationalarchives.gov.uk/pronom/

100. PubMed Central
URL: http://www.pubmedcentral.nih.gov/

101. Records lifecycle
URL: http://www.city.ac.uk/ic/rm/recordslifecycle.html

102. Representation and Rendering Project (file formats)
URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/fileformat.aspx

103. Risk analysis of corporate-wide file types Rosetta Stone
URL: http://www.rosettastone.com/

104. Rosetta Stone
URL: http://www.rosettastone.com/


329

105. Runeberg
URL: http://runeberg.org/

106. Safeguarding European Photographic Images for Access (SEPIA)
URL: http://www.knaw.nl/ecpa/sepia/

107. Scottish Party Political Press Releases Preservation and Access pilot
URL: http://www.dpconline.org/graphics/join/projects.html

108. Server replication for back-ups
URL: http://www.onlamp.com/pub/a/onlamp/2005/06/16/MySQLian.html

109. SHERPA DP
URL: ahds.ac.uk/about/projects/sherpa-dp/index.html

110. Sound Archive acetate disks
URL: http://www.fonoteca.ch/yellow/SoundCarriers/acetate_en.htm

111. STARGATE
URL: http://www.imdb.com/title/tt0111282/ http://stargate.mgm.com/

112. Strategic Partnerships With Industry Research & Training SPIRT
Australian RecordKeeping Metadata Schema
URL: http://www.sims.monash.edu.au/research/rcrg/research/spirt/

113. UKDA
URL: http://www.data-archive.ac.uk/

114. UKWAC (UK Web Archiving Consortium)
URL: http://www.webarchive.org.uk/

115. ULCC
URL: http://www.ulcc.ac.uk/

116. Universal Virtual Com-puter (UVC)
URL: http://www.nla.gov.au/padi/topics/492.html

117. VERS: Victorian Electronic Records Strategy The Victorian Electronic
Records System (VERS)
URL: http://www.prov.vic.gov.au/vers/standard/advice_12/7-2.htm

118. Voluntary Deposit of Electronic Publications (VDEP)
URL: http://www.dpconline.org/graphics/join/life.html

119. Web Archiving: UK Central Government Web Archive
URL: http://www.nationalarchives.gov.uk/nowhere/

120. Web-archiving feasibility study
URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/webarchiving.aspx




330
APNDICE D Centros de informao e bibliotecas das unidades de pesquisa
do Ministrio da Cincia e Tecnologia

Nome:
Agncia Espacial Brasileira - AEB
Biblioteca: Diretoria Planejamento Oramento e Administrao - DPOA
Endereo: SPO - rea 5 - Quadra 3 Bloco A, 1 andar CEP 70610-200 Braslia DF
URL: http://www.aeb.gov.br
Descrio: Misso
Foi criada em 10 de fevereiro de 1994, pela Lei N 8.854.
Atendendo a uma antiga reivindicao da comunidade
cientfica e tecnolgica brasileira, a AEB nasceu com o objetivo
de promover o desenvolvimento das atividades espaciais
brasileiras de forma descentralizada.

Autarquia vinculada ao Ministrio da Cincia e Tecnologia

Unidade de documentao
No tem unidade de documentao.

Publicaes on-line

Permite acesso on-line aos seus relatrios de gesto e outras
publicaes.





Nome:
Centro Brasileiro de Pesquisa Fsica - CBPF
Biblioteca: Coordenao de Documentao e Informao Cientfica CDI
Biblioteca do CBPF
Endereo: Rua Dr. Xavier Sigaud, 150 Ed. Csar Lattes, Urca 22290.180 - Rio de Janeiro - RJ
URL: http://www.biblioteca.cbpf.br
Descrio: Misso
Realizar pesquisa bsica em Fsica e desenvolver suas
aplicaes, atuando como instituto nacional de Fsica do
Ministrio da Cincia e Tecnologia e plo de investigao
cientfica e de formao, treinamento e aperfeioamento de
pessoal cientfico.

Em 1976 recebeu recursos financeiros do governo federal para
a manuteno das linhas de pesquisa e implantao dos
laboratrios de clculo numrico e de instrumentao.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao
A Biblioteca do Centro Brasileiro de Pesquisas Fsicas, fundada
em 1949, uma das bibliotecas nacionais de referncia na rea
de Fsica, tendo atualmente um acervo de aproximadamente
21.000 livros e 850 ttulos de peridicos (240 correntes), em
Fsica e cincias afins.
Parcialmente destruda em 1959 por um incndio, foi
reconstruda graas solidariedade da comunidade nacional e
internacional.
Constam de seu acervo peridicos de grande importncia
histrica, como The Philosophical Magazine (1800), Comptes
Rendus des Sances de L'Acadmie des Sciences (1835),
Philosophical Transactions of the Royal Society of London
(1875), Proceedings of the Royal Society of London (1877),
entre outros.





331

Outras informaes
A rea de Informao Cientfica ( AIC ) tem por finalidade
promover o intercmbio da documentao e informao no
campo da Fsica, e desenvolver trabalhos cientficos e tcnicos
nesta rea de informao.
Para atingir esse objetivo a AIC coleta, organiza, atualiza e
divulga servios e produtos necessrios obteno de
informaes.
Dentre os seus servios e produtos destaca-se a Memria da
Produo Tcnico-Cientfica do CBPF cujo objetivo
registrar e disseminar todo trabalho produzido ou em
andamento, de forma escrita ou oral, dos pesquisadores,
tcnicos e alunos de ps-graduao do CBPF, isoladamente ou
em colaborao com pesquisadores brasileiros e estrangeiros
de outras instituies. Cada volume da Memria cobre o
perodo de um ano.
A AIC tambm disponibiliza os preprints recebidos de
instituies nacionais e estrangeiras atravs de exposio
organizada por instituio

Disponibiliza acesso on-line aos seus relatrios de gesto e
outras publicaes em sua pgina na web.

Publicaes on-line

Permite acesso on-line aos seus relatrios de gesto e outras
publicaes.

Equipe: Alberto Passos Guimares Filho Coordenador
Justina de Ftima Bacellar Couto Coordenadora Substituta

Nome:
Centro de Excelncia em Tecnologia Eletrnica Avanada -
CEITEC
Biblioteca:
Endereo: Estrada Joo de Oliveira Remio, 777, Porto Alegre - RS Brasil - Cep: 91550-000
URL: http://www.ceitecmicrossistemas.org.br/portal/home.php
Descrio: Misso

Desenvolver solues inovadoras em eletrnica e tecnologias
da informao, com alto padro de qualidade, atendendo s
necessidades do mercado.

Empresa vinculada ao Ministrio da Cincia e Tecnologia

Unidade de documentao

No possui unidade de documentao.

Publicaes on-line

Permite acesso on-line a artigos e trabalhos apresentados em
seminrios, worshop etc.











332
Nome:
Centro de Tecnologia da Informao Renato Archer CTI
(antigo CENPRA)
Biblioteca: Biblioteca Sede
Endereo: Rodovia D. Pedro I, km 143,6 Amarais CEP 13082-120 Campinas - SP
URL: http://www.cenpra.gov.br
Descrio: Misso

Gerar, aplicar e disseminar conhecimentos em Tecnologia
da Informao, em articulao com os agentes
socioeconmicos, promovendo inovaes que atendam s
necessidades da sociedade.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

Possui unidade de documentao, mas no disponibiliza
base de dados para acesso on-line.

Disponibiliza artigos e trabalhos em sua pginas na web.

Publicaes on-line

Permite acesso on-line a artigos e outros trabalhos, de
autoria dos seus colaboradores, publicados em revista
especializada.
Equipe: 1 Bibliotecria responsvel









Unidade:
Centro de Tecnologia Mineral - CETEM
Biblioteca: Servio de Informao - SEDIN
Endereo: Avenida Ip, no. 900 - Ilha da Cidade Universitria 21941-590 - Rio de Janeiro - RJ
URL: http://www.cetem.gov.br/biblioteca.htm
Descrio: Misso

Desenvolver tecnologia para o processamento do uso
sustentvel dos recursos minerais brasileiros.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

A biblioteca destina-se a dar apoio a todas as atividades de
pesquisa do CETEM. uma biblioteca de referncia,
especializada na rea de tecnologia mineral, processos
mnero-metalrgicos e tecnologia ambiental. A biblioteca
conta com um acervo de 9178 livros, mantm 97
assinaturas de peridicos cientficos especializados e rene
toda a produo tcnico-cientfica da organizao,
constituda de 5459 relatrios tcnicos. Tambm fazem
parte de seu acervo s teses dos colaboradores e os 221
volumes editados atravs das Sries Qualidades e
Produtividade, Estudos e Documentos, Tecnologia
Ambiental, Tecnologia Mineral, Rochas e Minerais
Industriais, Jornadas de Iniciao Cientfica e avulsos.

Publicaes on-line

Permite acesso on-line a publicaes editadas pelo
CETEM.


333

Equipe: Coordenao da Biblioteca - Jackson de Figueiredo Neto
Responsvel da Biblioteca - Ana Maria S de Oliveira
Processamento Tcnico - Snia Maria Mamede Loureno

Nome:
Centro de Excelncia em Tecnologia Eletrnica Avanada -
CETENE
Biblioteca:
Endereo: Av. Professor Lus Freire, 1 - Cidade Universitria CEP. 50740-540 - Recife - PE
URL: http://www.inpe.br
Descrio: Misso

Desenvolver, introduzir e aperfeioar inovaes tecnolgicas
que tenham carter estratgico para o desenvolvimento
econmico e social da regio Nordeste, promovendo
cooperaes baseadas em redes de conhecimento e nos
agentes da economia nordestina.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

No possui unidade de documentao.

Publicaes on-line

Permite acesso on-line a fotos, relatrio, vdeos e artigos
atravs da Biblioteca Virtual.




Nome:
Centro de Gesto e Estudos Estratgicos - CGEE
Biblioteca: Ncleo Centro de informaes
Endereo: SCN Quadra 2, Bloco A, Ed. Corporate Center Financial Center, 11 andar, Salas
1102 e 1103 CEP 70712-900 - Braslia-DF
URL: http://www.cgee.org.br
Descrio: Misso

Promover e realizar estudos e pesquisas prospectivas de alto
nvel na rea de cincia e tecnologia e suas relaes com
setores produtivos, bem como realizar atividades de avaliao
de estratgicas e de impactos econmicos e sociais das
polticas, programas e projetos cientficos e tecnolgicos, alm
de difundir informaes, experincias e projetos sociedade.

Organizao Social, vinculada ao Ministrio da Cincia e
Tecnologia.

Unidade de documentao

No possui unidade de documentao.

Publicaes on-line

Permite acesso on-line a publicaes editadas pelo CGEE.

Equipe: 1 Cientista da Informao
1 Analista
1 Bibliotecria
2 Tcnicos de informao






334

Nome:
Comisso Nacional de Energia Nuclear - CNEN
Biblioteca: Biblioteca Sede
Unidades subordinadas Comisso Nacional de Energia Nuclear em 2007:
CRCN-NE; CRCN-CO; CDTN ; IEN ; IPEN; IRD
At 2006 eram 14 unidades vinculadas ao CNEN.
Endereo: Rua General Severiano, 90 Botafogo CEP 22294-900 - Rio de Janeiro - RJ
URL: http://www.cnen.gov.br
Descrio: Misso

Garantir o uso seguro e pacfico a energia nuclear, desenvolver
e disponibilizar tecnologia nuclear e correlata, visando ao bem-
estar da populao.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao
Encontra-se em fase de implantao a Rede de Bibliotecas da
CNEN, cujo objetivo proporcionar um funcionamento
integrado, com otimizao dos processos tcnicos e
administrativos de gerenciamento das colees, ampliando a
abrangncia de consulta e servios de informaes
bibliogrficas especializadas prestadas comunidade cientfica.
A Rede composta por sete bibliotecas, sendo coordenada
pelo Centro de Informaes Nucleares - CIN.

Centro de Desenvolvimento da Tecnologia Nuclear CDTN
Belo Horizonte - MG biblio@cdtn.br
Centro Regional de Cincias Nucleares do Centro-Oeste -
CRCN-CO Goinia - GO elaine@cnen.gov.br
Centro Regional de Cincias Nucleares do Nordeste
CRCN-NE Recife - PE bibliotecacrcn@cnen.gov.br
Instituto de Engenharia Nuclear IEN Rio de Janeiro - RJ
biblioteca@ien.gov.br
Instituto de Pesquisas Energticas e Nucleares IPEN So
Paulo - SP bibli@ipen.br
Instituto de Radioproteo e Dosimetria - IRD Rio de Janeiro
- RJ bibli@ird.gov.br
Sede Rio de Janeiro - RJ btc@cnen.gov.br]

Disponibiliza
Outras informaes

ANAIS - CATLOGO COLETIVO DE ANAIS DE EVENTOS
Base de dados cooperativa, coordenada pelo CIN/CNEN e
aberta a participao de instituies que desejem compartilhar
seus acervos. Esta base de dados inclui dados bibliogrficos de
todo tipo de anais de eventos como conferncias, simpsios,
congressos, reunies e outros realizados no Brasil ou no
exterior e que se encontram disponveis nos acervos de
bibliotecas brasileiras e de algumas latino-americanas. As
informaes contidas nos registros so fornecidas pelas
bibliotecas cooperantes e padronizadas pelo CIN.
Perodo: Ilimitado - inclui informaes a partir de qualquer data.
Atualizao: mensal

CATLOGO COLETIVO DE NORMAS TCNICAS
Base de dados cooperativa, coordenada pelo CIN/CNEN e
aberta a participao de instituies que desejem compartilhar
seus acervos. Arrola informaes sobre normas tcnicas






335
nacionais e estrangeiras existentes nos acervos de bibliotecas
brasileiras. As informaes contidas nos registros so
fornecidas pelas bibliotecas cooperantes e padronizadas pelo
CIN.
Perodo: Ilimitado: inclui informaes a partir de qualquer data.
Atualizao: mensal

Base INIS - Energia Nuclear
Sistema cooperativo com a participao de mais de 120 pases
e organizaes internacionais. O principal produto do sistema
base de dados bibliogrficos INIS. Esta base tem a mais
completa cobertura sobre aplicaes pacficas da cincia e
tecnologia nucleares. Atualmente, a base contem mais de 2,9
milhes de registros sendo a fonte mundial mais completa
sobre literatura tcnico-cientfica na rea nuclear. Atravs do
CIN, Centro de Informaes Nucleares, servios de informao
tcnico-cientfica com a base de dados INIS esto disponveis
gratuitamente no Brasil.

Base Energy - Tecnologias de Energia
A participao da Comisso Nacional de Energia Nuclear
(CNEN) no Energy Technology Data Exchange (ETDE) tornou
disponvel no Brasil a base de dados ENERGY, formada por
este sistema e abrangendo todas as tecnologias de energia. A
CNEN, atravs do CIN - Centro de Informaes Nucleares
incorpora a literatura brasileira base de dados ENERGY,
divulgando, no pas e no exterior a produo cientfica
brasileira. O acesso base de dados via Internet, gratuito no
Brasil para os usurios cadastrados. Os demais pases que
participam do ETDE, incluindo sua literatura nacional na base
Energy, so Alemanha, Canad, Coria, Dinamarca, Espanha,
Estados Unidos, Finlndia, Frana, Holanda, Inglaterra, Mxico,
Noruega, Portugal, Sucia e Sua.
LivRe! - Revistas na Web
Relaciona peridicos eletrnicos de acesso livre na Internet.

PERIDICOS - SEDE
Contm os ttulos das revistas e os fascculos existentes na
biblioteca da Sede. Tambm esto includos nesta base as
sries da IAEA como Safety Series e Technical Report Series e
a coleo de relatrios anuais de instituies nacionais e
estrangeiras.
Atualizao: mensal

RELATRIOS
Contm informaes sobre os relatrios tcnico-cientficos e as
normas tcnicas pertencentes ao acervo da Biblioteca da
CNEN/CIN.
Perodo: Ilimitado - inclui informaes a partir de qualquer data.
Atualizao: mensal

Equipe: Maria Emilia Frade de Mello

Nome:
Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico
- CNPq
Biblioteca: Biblioteca Lygia Portocarrero Velloso
Endereo: SEPN 507, Bloco "B", Ed. Sede CNPq CEP 70.740-901 - Braslia - DF
URL: http://www.cnpq.br/
Descrio: Misso






336
Promover e fomentar o desenvolvimento cientfico e tecnolgico
do Pas e contribuir na formulao das polticas nacionais de
cincia e tecnologia.

Fundao vinculada ao Ministrio da Cincia e Tecnologia

Unidade de documentao

Inicialmente, o acervo do CPO constitui-se a partir do acervo do
Centro de Documentao - CDO - criado em 1977 e extinto em
1980, e, sobretudo da biblioteca trazida da antiga SUP -
Superintendncia de Planejamento, que funcionava no Rio de
Janeiro. O acervo tambm era formado de publicaes do
Conselho, mesmo as anteriores a criao do CPO, e de
doaes pessoais. (Perspicillum, 1987).
Aps a extino arbitraria do CPO, seu acervo foi transferido
para o IBICT e teve parte de seus peridicos incorporados a
Biblioteca deste. Posteriormente o acervo foi transferido para a
Biblioteca do Ministrio da Cincia e Tecnologia - MCT, para
finalmente retornar ao CNPq em abril de 2004.
Na sua configurao atual a Biblioteca Lygia Portocarrero
Velloso possui um recorte temtico com obras especializadas
em polticas e histria da cincia e tecnologia, com cerca de
30.000 volumes, como por exemplo, livros nacionais e
estrangeiros, peridicos especializados, publicaes de
tcnicos do CNPq, relatrios, obras de referncia, entre outros.
Em 2001 foi criado o Centro de Memria Institucional do CNPq,
vinculado vice-presidncia.

Publicaes on-line

Permite acesso on-line a publicaes editadas pelo CNPq

Equipe: Roberto Muniz Barretto de Carvalho - Chefe do Servio de
Documentao e Acervo SEDOC
Maria Aliette Peixoto Wanderley Responsvel pela Biblioteca
Patrcia Simas de Andrade - Bibliotecria


Nome:
Financiadora de Estudos e Projetos - FINEP
Biblioteca: Biblioteca Servio de Informao
Endereo: Praia do Flamengo, n 200 CEP 20210-030 Rio de Janeiro RJ
URL: http://www.finep.gov.br/
Descrio: Misso

Promover e financiar a inovao e pesquisa cientfica e
tecnolgica em empresas, universidades, institutos
tecnolgicos, centros de pesquisa e outras instituies pblicas
ou privadas, mobilizando recursos financeiros e integrando
instrumentos para o desenvolvimento econmico e social do
Pas.

Empresa pblica vinculada ao Ministrio da Cincia e
Tecnologia

Unidade de documentao

A Biblioteca foi criada em 1973 e tem como objetivo assessorar
e apoiar as atividades desenvolvidas pela FINEP na busca,
acesso e disseminao do seu acervo, contribuindo para
gerao de novos conhecimentos. Desde 1997, a Biblioteca





337
utiliza o Sistema SYSBIBLI, que permite a apresentao do
catlogo on line disponvel na internet. A coleo est orientada
para o desenvolvimento de temas relacionados Cincia e
Tecnologia e o acervo de aproximadamente 20.000
documentos composto de livros, peridicos, artigos e material
multimdia.

Outras informaes

Biblioteca Virtual de Inovao Tecnolgica
resultado de uma ao conjunta envolvendo a FINEP e o
Programa Prossiga/CNPq. Renem de forma estruturada e
seletiva, sites brasileiros e estrangeiros contendo informaes
relevantes sobre inovao tecnolgica, em seus mltiplos
aspectos.

Portal Capital de Risco Brasil
Tem como objetivo a construo de um ambiente institucional
que favorea o desenvolvimento do capital de risco, de forma a
estimular o fortalecimento das empresas nascentes e
emergentes de base tecnolgica brasileiras, contribuindo, em
ltima instncia, para o desenvolvimento tecnolgico nacional,
bem como para a gerao de emprego e renda.

Publicaes on-line

Permite acesso on-line a publicaes editadas pelo FINEP

Equipe: 2 Bibliotecrias

Nome:
Instituto Brasileiro de Informao em Cincia e Tecnologia -
IBICT
Biblioteca: Biblioteca
Endereo: SAS Quadra 5, Lote 6, Bloco H 70070.912 - Braslia - DF
URL: http://www.ibict.br
Descrio: Misso

Promover a competncia e o desenvolvimento de recursos e
infra-estrutura de informao em Cincia e Tecnologia para a
produo, a socializao e a integrao do conhecimento
cientfico-tecnolgico.

Unidade de pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

Criada no mesmo ano da inaugurao do Instituto 1954. Atuar
como biblioteca especializada em cincia da informao e
biblioteconomia, tendo em seu acervo monografias, peridicos,
anais de eventos, normas tcnicas, materiais alternativos, obras
de referncia, teses e dissertaes em cincia da informao,
memria tcnica. Em 23 de fevereiro de 2005, a Biblioteca do
Ibict automatizou seus produtos e servios com a aquisio do
software PHL (Personal Home Library), incorporando a base
Literatura em Cincia da Informao (LICI).

Publicaes on-line

Permite acesso on-line as revistas: Cincia da Informao;
Incluso Social e Liinc





338

Equipe: Priscilla Mara Bermudes Arajo - Chefe do Setor da Biblioteca
Suzelayne Eustquio de Azevedo - Atendimento
Walter Alves Nascimento Junior - Atendimento

Nome:
Instituto de Desenvolvimento Sustentvel Mamirau - IDSM
Biblioteca: Biblioteca Sede
Endereo: UFPA Campus do Guam Departamento de Antropologia (CFCH) Caixa Postal:
531 66073.250 - Belm - PA
URL: http://www.mamiraua.org.br/
Descrio: Misso

Promover pesquisa cientfica para a conservao da
biodiversidade por meio de manejo participativo e sustentvel
dos recursos naturais na Amaznia.

Organizao Social vinculada ao Ministrio da Cincia e
Tecnologia

Unidade de documentao

No possua biblioteca at 2007

Publicaes on-line

Permite acesso on-line a artigos e outros trabalhos, de autoria
dos seus colaboradores, publicados em revista especializada.

Equipe: Josivaldo Ferreira Modesto
1 Bibliotecria
1 Tcnico auxiliar



Nome:
Associao Instituto de Matemtica Pura e Aplicada - IMPA
Biblioteca: Biblioteca Sede
Endereo: Estrada Dona Castorina, 110 Ed. Llio Gama, Jardim Botnico 22460.320 - Rio de
Janeiro - RJ
URL: http://www.impa.br/
Descrio: Misso

Realizar pesquisas em cincias matemticas e afins, formar
pesquisadores, disseminar o conhecimento matemtico em
todos os seus nveis e integr-lo com outras reas da Cincia,
Cultura, Educao e do setor produtivo.

Organizao Social vinculada ao Ministrio da Cincia e
Tecnologia

Unidade de documentao

Especializada em Matemtica Pura e Aplicada, possui um
notvel acervo de cerca de 30.000 volumes em livros clssicos
e modernos, alm de cerca de 30.000 volumes em peridicos,
correspondendo a 670 ttulos dos mais importantes em
Matemtica e reas cientficas mais afins. considerada de
excelente nvel em padro internacional.

Publicaes on-line

Permite acesso on-line a publicaes editadas pelo FINEP






339

Equipe: Maria da Graa Arajo Penna Duarte
1 Bibliotecrias
2 Tcnicos auxiliares
1 Analista

Nome:
Indstrias Nucleares do Brasil - INB
Biblioteca:
Endereo: Rua Mena Barreto, 161 Botafogo - 22271-100 - Rio de Janeiro - RJ - Brasil
URL: http://www.inb.gov.br/
Descrio: Misso

Explorao do urnio, desde a minerao e o beneficiamento
primrio at a produo e montagem dos elementos
combustveis que acionam os reatores de usinas nucleares. O
conjunto dessas atividades constitui o Ciclo do Combustvel
Nuclear. Atua tambm na rea de tratamento fsico dos
minerais pesados com a prospeco e pesquisa, lavra,
industrializao e comercializao das areias monazticas e
obteno de terras-raras.

Empresa de economia mista, vinculada Comisso Nacional
de Energia Nuclear - (CNEN) e subordinada ao Ministrio da
Cincia e Tecnologia.

Unidade de documentao

O acervo da biblioteca constitudo basicamente de normas
tcnicas nacionais e estrangeiras para atender s necessidades
das duas fbricas de combustvel nuclear.

Publicaes on-line

No possui publicaes para acesso on-line.

Equipe: Gilda Menezes




Nome:
Instituto Nacional de Pesquisa da Amaznia - INPA
Biblioteca: Biblioteca
Endereo: Avenida Andr Arajo, 2936, Petrpolis Manaus, Amazonas CEP 69083-000
Manaus - AM
URL: http://www.biblioteca.inpa.gov.br
Descrio: Misso

Gerar e disseminar conhecimentos e tecnologias e capacitar
recursos humanos para o desenvolvimento da Amaznia.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia


Unidade de documentao

Criada em julho de 1954, possui um acervo com mais de 199
mil ttulos voltados s Cincias Puras e Aplicadas com nfase
s Cincias Biolgicas e rene uma das maiores bibliografias
nacionais sobre a Amaznia. A biblioteca constituiu-se a partir
do acervo particular do eminente botnico Joo Barbosa
Rodrigues (1842-1909), fundador do Museu Botnico do
Amazonas e diretor do Museu Nacional do Rio de Janeiro.






340
A Diviso de Publicaes Seriadas rene no acervo 7.472 mil
ttulos de publicaes peridicas, tcnica cientfica. Dentre
esses ttulos encontra-se a coleo completa do peridico Acta
Amaznica, que divulga os trabalhos dos pesquisadores do
INPA e de outras instituies.
Possui uma coleo de Obras Raras e Especiais que se
destaca por sua importncia cientfica e institucional. O acervo
de aproximadamente 3 mil exemplares rene raridades dos
sculos XVII, XVIII e XIX. Encontram-se obras clssicas de
Wallace, Bates e Darwi.

Publicaes on-line

Permite acesso on-line a publicaes editadas pelo INPA, em
destaque a revista Acta Amazonica
Equipe: 1 Bibliotecria responsvel

Nome:
Instituto Nacional de Pesquisas Espaciais - INPE
Biblioteca: Servio de Informao e Documentao - SID
Endereo: Av. dos Astronautas,1.758 12227.010 - So Jos dos Campos - SP
URL: http://www.inpe.br/biblioteca/
Descrio: Misso

Promover e executar estudos, pesquisas cientficas,
desenvolvimento tecnolgico e capacitao de recursos
humanos nos campos da Cincia Espacial e da Atmosfera, das
Aplicaes Espaciais, da Meteorologia e da Engenharia e
Tecnologia Espacial, bem como em domnios correlatos.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao
Criada em 1965, com a misso especfica de promover
informao especializada para a comunidade tcnico-cientfica
do instituto, o acervo fsico dispe atualmente de mais de
73.000 volumes entre livros, teses, relatrios e mapas, e mais
de 160.000 fascculos de peridicos. Possui ainda uma
Mapoteca composta por aproximadamente 4.800 mapas, entre
cartas topogrficas, imagens de radar e de satlite, cartas
nuticas, mapas polticos, hidrogrficos, geolgicos, Projeto
RADAM, e outras publicaes como atlas, enciclopdias,
estudo de guas subterrneas e aptido agrcola dos solos.
Possui acervo digital, oferecendo acesso a mais de 6000
documentos eletrnicos, como por exemplo: e-prints, livros on-
line, teses e dissertaes

Outras informaes




Biblioteca Digital

Atualmente o acervo oferece acesso a mais de 6000
documentos eletrnicos como, por exemplo: e-prints, livros on-
line, teses e dissertaes. Alm disso foi desenvolvida uma
nova interface de busca para a Biblioteca Digital, adaptada ao
novo padro do portal, com opes de busca rpida e busca
combinada.
Desde 2003, a Biblioteca Digital tornou-se um provedor de






341
dados, conforme o padro internacional OAI-PMH ("Open
Archives Initiative Protocol for Metadata Harvesting"), fazendo
com que os trabalhos armazenados no acervo estejam
acessveis a partir dos provedores de servios OAI espalhados
pelo mundo. Assim, os trabalhos do INPE constam, por
exemplo, na base de dados da Universidade de Michigan -
OAIster (com mais de 9 milhes de referncias) e na base de
dados da Biblioteca Digital de Teses e Dissertaes (BDTD) do
IBICT.
A Biblioteca Digital tambm tem fornecido ao INPE os
Indicadores da sua produo tcnico-cientfica para os anos de
2006, 2005, 2004, 2003 e 2002.

Equipe: Marciana Leite Ribeiro Chefe de Servio de Informao e
Documentao
Tcnicos bibliotecrios, auxiliares e analistas - 10

Nome:
Instituto Nacional do Semi-rido - INSA
Biblioteca:
Endereo: Av. Floriano Peixoto, n 715 - Centro / Campina Grande PB - CEP 58.100-001 /
Fone (83) 2101-6400
URL: http://www.insa.gov.br/
Descrio: Misso

Promover a realizao de estudos e pesquisas cientficas e
tecnolgicas sobre a regio do semi-rido brasileiro, em estreita
cooperao com outras entidades locais, bem como sua
divulgao e difuso, visando integrao dos plos
socioeconmicos e ecossistemas estratgicos e o
desenvolvimento sustentvel da regio.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

No tem unidade de documentao.

Publicaes on-line

Possui publicaes para acesso on-line.









Nome:
Instituto Nacional de Tecnologia - INT
Biblioteca: Diviso de Informao e Prospeco Tecnolgica
Endereo: Av. Venezuela, 82 -Sade, 8 andar 20081.310 Rio de Janeiro - RJ
URL: http://www.int.gov.br/sol_tec_info_main.html#1
Descrio: Misso

Desenvolver e transferir tecnologias e executar servios
tcnicos para o desenvolvimento sustentvel do Pas, norteado
pelo avano do conhecimento e em consonncia com as
polticas e estratgias nacionais de Cincia, Tecnologia e
Inovao.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

A Biblioteca do INT tem por objetivo oferecer produtos e







342
servios que atendam s expectativas do corpo funcional da
Instituio e da comunidade de C&T em geral, alm de atender
empresas, empreendedores, pesquisadores e estudantes.
O acervo composto de cerca de 20.000 livros, peridicos,
teses, cadastros, manuais, guias e folhetos, alm de
aproximadamente 12.000 normas tcnicas, nas reas de
qumica industrial, orgnica, inorgnica, tecnologia de materiais
metlicos, cermicos e polimricos, corroso e proteo,
desenho industrial, gesto da produo, gesto do
conhecimento e informao tecnolgica, alm de obras de
referncia em engenharia, cincias bsicas e administrao.

Outras informaes

Disponibiliza, em verso online, a Biblioteca Virtual do Gs
Natural, desenvolvida no mbito do Ncleo de Tecnologias de
Uso do Gs Natural. A BVGN rene, de forma estruturada,
informaes atualizadas sobre sites no Brasil e no mundo
relacionado ao tema.

Publicaes on-line

No possui publicaes para acesso on-line.


Equipe: Vera Lcia Maia Lellis - Diviso de Informao e Prospeco
Tecnolgica

Nome:
Laboratrio Nacional de Astrofsica - LNA
Biblioteca: Biblioteca Sede
Endereo: Rua Estados Unidos,154 - Bairro das Naes 37500.000 - Itajub - MG
URL: http://www.lna.br
Descrio: Misso

Planejar, desenvolver, prover, operar e coordenar os meios e a
infra-estrutura para fomentar, de forma cooperada, a
Astronomia Observacional brasileira.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

Possui biblioteca especializada na rea de astrofsica e reas
afins com aproximadamente 1800 livros, proceedings de
simpsios e colquios. Destaca-se a coleo de peridicos em
astronomia e astrofsica, que representa uma das mais
completas no pas. Possuiu ainda, peridicos na rea de
cincias computacionais, ptica, eletro-eletrnica, difuso
cientfica, tanto quanto preprints e boletins de outros
observatrios e associaes de amadores.
No possui base de dados online

Publicaes on-line
No possui publicaes para acesso on-line


Equipe: 1 Tcnico auxiliar









343
Nome:
Laboratrio Nacional de Computao Cientfica - LNCC
Biblioteca: Servio de Biblioteca - SBI
Endereo: Av. Getlio Vargas, 333 Quitandinha 25651.070 - Petrpolis - RJ
URL: http://www.lncc.br
Descrio: Misso

Realizar pesquisa e desenvolvimento em computao cientfica,
em especial a criao e aplicao de modelos e mtodos
matemticos e computacionais na soluo de problemas
cientficos e tecnolgicos; desenvolver e gerenciar ambiente
computacional de alto desempenho que atenda s
necessidades do Pas; formar recursos humanos, promovendo
transferncia de tecnologia e inovao.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

Com um acervo especializado nas reas de Matemtica
Aplicada e Computacional, Mecnica dos Slidos e Fluidos,
Teoria dos Sistemas e Controle, Mtodos e Anlise Numrica
em Cincias e Engenharia, a rea de Biblioteca e
Documentao tem como objetivo fornecer o apoio bibliogrfico
necessrio ao desenvolvimento das atividades desenvolvidas
no LNCC bem como pela disseminao deste acervo para a
comunidade tcnico-cientfica.
A Biblioteca do LNCC possui um acervo especializado nas
reas de interesse do Laboratrio, tais como: Computao
Cientfica, Matemtica Aplicada, Mecnica Aplicada, Teoria dos
Sistemas e Controle, Cincia da Computao, Estatstica e
Biomatemtica. Conta com cerca de 10.000 livros.

Publicaes on-line
Possui publicaes para acesso on-line e participa da BDTD


Equipe: Maria Cristina Albuquerque de Almeida Chefe
Total de servidores - 5















Nome:
Laboratrio Nacional de Luz Sncrotron / ABTLus - LNLS
Biblioteca: Departamento Cientfico
Endereo: Rua Giuseppe Mximo Scolfaro, 10.000 - 13083.970 - Campinas - SP
URL: http://www.lnls.br/
Descrio: Misso

Atuar como laboratrio nacional, aberto, multiusurio, multi e
interdisciplinar, capaz de criar e prover solues integradas
para problemas cientficos e tecnolgicos complexos nas reas
de materiais avanados, nanotecnologia, biotecnologia,
aceleredores e tecnologias relacionadas e instrumentao
cientfica.

Organizao Social vinculado ao Ministrio da Cincia e
Tecnologia

Unidade de documentao

Biblioteca do LNLS tem como objetivo d suporte s atividades
tcnico-cientficas, localizando textos, obras completas,







344
peridicos e outros materiais documentais.
As atividades da Biblioteca tiveram incio em 1987, logo que o
LNLS comeou a ser implantado e sempre foi vinculada ao
Departamento Cientfico.
Alm de atender ao quadro de funcionrios do LNLS, a
Biblioteca tambm atende pesquisadores de inmeras outras
instituies brasileiras e do exterior, em especial os que utilizam
a infra-estrutura de pesquisa e desenvolvimento existente no
LNLS.
Mantm intercmbio com outras bibliotecas e integra os
sistemas COMUT e o British Library (BL) que permite solicitar e
receber cpias de artigos de peridicos, teses e captulos de
livros.

LNCC: foi primeira instituio a conectar o pas a uma rede
internacional acadmica de computadores.

Publicaes on-line
Possui publicaes para acesso on-line


Equipe: Margarida M. S. Abreu de Lima

Nome:
Museu de Astronomia e Cincias Afins - MAST
Biblioteca: Servio de Biblioteca
Endereo: Rua General Bruce, 586, So Cristvo 20921.030 - Rio de Janeiro - RJ
URL: http://www.mast.br/
Descrio: Misso

Ampliar o acesso da sociedade ao conhecimento cientfico e
tecnolgico por meio da pesquisa, preservao de acervos e
divulgao da Histria da Cincia e da Tecnologia no Brasil.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

Biblioteca especializada em histria da cincia, educao em
cincias e divulgao cientfica. Possui tanto obras do interesse
de pesquisadores, como direcionadas para estudantes dos
nveis fundamentais e mdios, e tambm para o pblico em
geral. Seu acervo compe-se de aproximadamente 7000
volumes, incluindo clssicos da cincia, livros, teses de ps-
graduao e um amplo sistema de referncia sobre fontes de
consulta no pas e no exterior. O acervo se encontra totalmente
informatizado. O acervo de peridicos um dos mais completos
do pas nas reas de histria da cincia e divulgao cientfica,
alm de possuir assinaturas nas reas de museologia,
documentao e ensino em cincias. A coleo tambm est
disponvel para consulta no Catlogo Coletivo Nacional, e a
biblioteca do MAST participa do programa de emprstimo entre
bibliotecas.
A biblioteca do MAST publica mensalmente os Sumrios
Correntes, que rene os ndices das revistas cientficas
recebidas durante o ms.

Publicaes on-line
No possui publicaes para acesso on-line

Equipe: Lcia Alves da Silva






345
1 Bibliotecria
1 Arquivista
1 Tcnico auxiliar

Nome:
Museu Paraense Emlio Goeldi - MPEG
Biblioteca: Biblioteca Domingos Soares Ferreira Penna
Endereo: Av. Perimetral, 1901 - Terra Firme CEP: 66077-530 - Belm - PA
URL: http://www.museu-goeldi.br/
Descrio: Misso

Realizar pesquisas, promover a inovao cientfica, formar
recursos humanos, conservar acervos e comunicar
conhecimentos nas reas de cincias naturais e humanas
relacionadas Amaznia.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

O acervo da Biblioteca Domingos Soares Ferreira Penna
especializado em antropologia, arqueologia, botnica, cincias
da terra, ecologia, lingstica, zoologia e em assuntos
amaznicos, reunindo documentos adquiridos ao longo dos
anos, atravs de compra, doao e permuta. Seu acervo
composto por livros, peridicos, folhetos, separatas, mapas,
CDs, fotografias, filmes, fitas e microfilmes. A Coleo
Especial, com edies desde o sculo XVI, apresenta um
valioso acervo de livros raros, antigos e valiosos, de grande
importncia para a Amaznia.

Publicaes on-line
Possui publicaes para acesso on-line

Equipe: Doralice Romeiro - Coordenao de Informao e
Documentao
Ftima Guedes - Bibliotecria


Nome:
Nuclebrs Equipamentos Pesados - NUCLEP
Biblioteca:
Endereo: Rod. Rio Santos, Km 18 BR 101 Itagua - RJ
URL: http://www.nuclep.br
Descrio: Misso

Fundada em 1975

Empresa Estatal vinculada ao Ministrio da Cincia e
Tecnologia

Unidade de documentao



No tem unidade de documentao.

Publicaes on-line
No possui publicaes para acesso on-line









346



Nome:
Observatrio Nacional - ON
Biblioteca: Diviso de Documentao - DID
Endereo: Rua General Jos Cristino, 77 So Cristvo 20921.400 Rio de Janeiro - RJ
URL: http://www.on.br/
Descrio: Misso

Realizar pesquisa e desenvolvimento em Astronomia, Geofsica
e Metrologia em Tempo e Freqncia, formar pesquisadores
em seus cursos de ps-graduao, capacitar profissionais,
coordenar projetos e atividades nacionais nestas reas e gerar,
manter e disseminar a Hora Legal Brasileira.

Unidade de Pesquisa do Ministrio da Cincia e Tecnologia

Unidade de documentao

considerada uma das melhores bibliotecas especializadas do
pas, com um acervo de valor inestimvel nas reas de
Astronomia, Geofsica, Metrologia e cincias correlatas. A
seo de obras raras inclui livros, fotografias e negativos em
vidro. Grande parte desse material remonta ao sculo XIX,
encontrando-se, no entanto, livros do sculo anterior. Desde
2004 disponibiliza na pgina oficial do ON a Biblioteca Digital
de Obras Raras e Especiais do Observatrio Nacional, que
consiste na reproduo em meio eletrnico do acervo raro,
visando a sua preservao e disseminao.

Publicaes on-line
Possui publicaes para acesso on-line


Equipe: 1 Bibliotecria






Nome:
Associao Rede Nacional de Ensino e Pesquisa - RNP
Biblioteca: Diretoria de Gesto da Informao - DGI
Endereo: Rua Lauro Muller, 116 sala 3.902 CEP 22290-160 Rio de Janeiro - RJ
URL: http://www.rnp.br/
Descrio: Misso

Promover o uso inovador de redes avanadas no Brasil.

Organizao Social vinculada ao Ministrio da Cincia e
Tecnologia.

Unidade de documentao
No tem unidade de documentao. Conta com um pequeno
acervo dentro da Biblioteca da Embrapa em Campinas





Publicaes on-line
Possui publicaes para acesso on-line

Equipe: 1 Cientista da Informao






347
APNDICE E Produo bibliogrfica de servidores do Ministrio da Cincia e
Tecnologia sobre preservao digital


Banon, G. J. F. Hiperdocumentos versus URLib. 2002. Disponvel em:
<dpi.inpe.br/banon/2002/10.10.08.39>. Acesso em: 25 fev. 2004.


______. Uniform repositories for a digital library (URLib). 1998. Disponvel em:
<dpi.inpe.br/banon/1997/08.14.12.32>. Acesso em: 25 fev. 2004.


______; Banon, L. C. Creating persistent citation links. 2001. Disponvel em:
<iconet.com.br/banon/2001/07.27.00.56>. Acesso em: 25 fev. 2004.


______; RIBEIRO, M. L.; BANON, L. C. Contribuio ao livre acesso da literatura
cientfica em cincia espacial: implementao da poltica de auto-arquivamento na
biblioteca digital do INPE. In: SEMINRIO INTERNACIONAL DE BIBLIOTECAS
DIGITAIS BRASIL, 1., 2007, So Paulo. Proceedings... So Paulo: INPE, 2007.


______; ______; ______. Preservao digital da memria tcnico-cientfica do INPE.
In: SIMPSIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS, 2., 2004, Campinas.
Anais eletrnicos... Campinas: INPE, 2004. Disponvel em:
<http://libdigi.unicamp.br/document/?view=8264>. Acesso em: 19 set. 2005.


______; ______; SILVA, M. D. Preservao, enriquecimento e disseminao das
Memrias Tcnico-Cientfica e Documental do INPE. So Jos dos Campos:
INPE, 2003. Disponvel em: <http://urlib.net/sid.inpe.br/marciana/2003/10.21.16.25>.
Acesso em: 15 fev. 2004.


BARBEDO, S. A. D.; RIBEIRO, M. L. Estudo de padronizao de metadados para
preservao da memria documental da biblioteca digital do INPE. In: SIMPSIO
INTERNACIONAL DE BIBLIOTECAS DIGITAIS, 3., 2005, So Paulo. Anais... So
Paulo: INPE, 2005. Disponvel em: <http://ePrint.sid.inpe.br:80/rep-
/sid.inpe.br/ePrint@80/2005/12.02.12.25>. Acesso em: 16 fev. 2006.


BERGAMINI, E. W. et al. CCSDS Standards: a reference model for an Open Archival
Information System (OAIS). In: SIMPSIO SPACEOPS, 98., 1998, Tokio. Anais...
Tkio: [s.n.], 1998. Disponvel em:
<http://iris.sid.inpe.br:1905/col/sid.inpe.br/banon/2001/04.03.15.36.19/doc/mirror.cgi:I
ISarau na Biblioteca>. Acesso em: 12 jan. 2006.


BOERES, S. A. A.; MRDERO ARELLANO, M. A. Polticas e estratgias de
preservao de documentos digitais. In: CINFORM, 4., 2005, Salvador, BA.


348
Proceedings... Salvador, BA: Dilogo Cientfico, 2005. Disponvel em:
<http://dici.ibict.br/archive/00000263>. Acesso em: 16 fev. 2007.


MRDERO ARELLANO, M. . As colees de obras raras na biblioteca digital.
93 f. 1998. Dissertao (Mestrado em Cincia da Informao)- Departamento de
Cincia da Informao e Documentao, Universidade de Braslia. Braslia: [s.n],
1998.


______. Digital preservation of scientific information in Brazil: an initial approach of
existing models. In: INTERNATIONAL CONFERENCE ON ELETRONIC
PUBLISHING, 8., 2004, Braslia. Proceedings Braslia: Universidade de Braslia,
2004.


______ Preservao de documentos digitais. Cincia da Informao, v. 33, n. 2, p.
15-27, 2004.


______; ANDRADE, R. S. Preservao digital e os profissionais da informao.
DataGramaZero, v. 7, n. 5, out. 2006.


______. Preservao digital: uma preocupao dos editores de revistas cientficas
eletrnicas no Brasil. In: ENCONTRO NACIONAL DE EDITORES CIENTFICOS, 9.,
2007, Ouro Preto, MG. Proceedings... Ouro Preto, MG: [s. n], 2007.


RIBEIRO, M. L. Aspectos da memria cientfica do Instituto Nacional de
Pesquisas Espaciais (INPE). So Jos dos Campos: INPE, 2007. Disponvel em:
<http://urlib.net/sid.inpe.br/mtc-m17@80/2007/07.10.18.17>. Acesso em: 21 out.
2008.


______. Reflexes sobre o resguardo da memria cientfica do INPE. In:
SEMINRIO NACIONAL DE BIBLIOTECAS UNIVERSITRIAS, 14., 2006, Salvador,
BA. Anais... Salvador, BA: INPE, 2006. Disponvel em:
<http://urlib.net/sid.inpe.br/mtc-m16@80/2006/10.31.16.16>. Acesso em: 21 out.
2008.


SAYO, L. F. O modelo de referncia ISO/OAIS: Open Archival Information System.
In: SIMPSIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS, 2., 2004, Campinas.
Anais... Campinas: Unicamp, 2004.


______. Padres para bibliotecas digitais abertas e interoperveis. Revista
Brasileira de Biblioteconomia e Documentao, So Paulo, v. 4, n.1, p. 101-130,
jan./jun. 2008.


349


______. Preservao digital no contexto das bibliotecas digitais: uma breve
introduo. In. MARCONDES, Carlos H. et al. (Org.). Bibliotecas digitais: saberes e
prticas. Salvador: EDUFBA; Braslia: IBICT, 2005. p. 115-149.


______. Preservao Digital: uma brevssima introduo. Rio de Janeiro: [s. n.],
2003. Disponvel em:
<http://www.arquivonacional.gov.br/conarq/cam_tec_doc_ele/preservacao/preservac
ao.asp>. Acesso em: 03 dez. 2003.


TOLMASQUIM, A. T. Preservao de objetos tridimensionais para a histria da
cincia e tecnologia. In: SEMANA NACIONAL DO LIVRO E DA BIBLIOTECA, 2.,
2005, So Jos dos Campos. Atas... So Jos dos Campos: INPE, 2005.


350
APNDICE F - Glossrio de termos tcnicos


Acessibilidade de longo prazo: acessibilidade do sistema de preservao digital
que permite medir as facilidades de uso que ele proporciona aos usurios, a
dimenso das tarefas realizadas e o grau de conhecimento que eles tm
das funes do sistema; depende da sua capacidade de ser interopervel;
usa de ferramentas de softwares livres, possibilitando a alterao de
qualquer parte do sistema sem nenhuma conseqncia nas suas
funcionalidades. Como um critrio pode ser medido por meio de indicadores
de desempenho que proporcionam os dados sobre a eficincia do sistema
no atendimento de usurios e suas expectativas de tempo e tipo de
resposta.

Acesso Livre: disponibilizao livre e pblica na Internet, de forma a permitir a
qualquer usurio a leitura, download, cpia, impresso, distribuio, busca
ou link com o contedo completo de artigos, bem como a indexao ou o
uso para qualquer outro propsito legal.

Anlise Etnogrfica de Contedo: tcnica de anlise qualitativa de dados, usada
para o estudo da origem e uso de conceitos formulados nas mdias.
Diferentemente da anlise de contedo tradicional, a AEC interage com as
informaes sem ficar restrita a amostras; tratar o processo de amostragem
como uma comparao constante, cujas descobertas so usadas para
delinear categorias especficas e narrativas descritivas.

Arqueologia digital: uso de material obsoleto para pesquisa da histria dos incios
da arquitetura computacional, aplicativos perifricos, sistemas operacionais,
linguagens de programao, ferramentas e sistemas de gesto eletrnica de
documentos.

Arquivos Abertos (Open archives): arquivos eletrnicos conectados por meio do
protocolo Open Archives Initiative Protocol for Metadata Harvesting (OAI-
PMH), permitindo a interoperabilidade entre bibliotecas e repositrios
digitais.

Atributo: caracterstica inerente ou qualidade associada a um elemento j
mencionado.

Atualizao (refreshment): migrao de dados digitais que procura substituir uma
mdia com uma cpia que seja suficientemente exata, para que a infra-
estrutura de hardware e software continue a funcionar como antes.

Auditoria: permite que os desenvolvedores dos repositrios analisem e respondam
de forma sistemtica s carncias e acertos na criao dos sistemas.

Autenticidade: comprovao de autoria do documento por meio de mecanismos de
verificao como o layout, tipologia de fontes, vocabulrios controlados da
poca e assinatura digital.



351
Autodepsito: que possibilita ao prprio autor a publicao de seu trabalho
cientfico diretamente na Rede, sem necessidade de intermedirios.

Biblioteca digital: biblioteca com textos completos em formatos digitais,
armazenados e disponveis via Internet.

Bit (binary bit): dgito binrio, menor unidade de informao armazenada em um
computador. Um bit tem um valor nico, 0 ou 1.

Bitstream: a camada mais elementar para dotar de significado um objeto digital,
emprega a leitura bit por bit em vez do mtodo convencional de 16 bits por
vez.

Bundles: agrupamento ou pacotes de bitstreams. A possibilidade de um documento
incluir vrios bundles significa que ele pode pertencer a uma ou mais
colees e uma coleo a uma ou mais comunidades. Essa funo dos
bundles pode ser compreendida na seqncia de duas funcionalidades j
disponveis na verso 1.3 do DSpace.

Byte: grupo de dgitos binrios que so armazenados e operados como se fossem
uma unidade.

Certificao: envolve mais do que a aplicao de critrios resultantes de normas e
requisitos bsicos. Ela deve prover ferramentas para o planejamento da
auto-avaliao e formas de auditorias internas e externas. O contexto de
ambas geopoltico, mas o processo no varia significativamente.

Confiabilidade: garantir o armazenamento e acesso da informao por longo prazo

Cpia de segurana (backup): cpia de dados de um dispositivo de
armazenamento a outro para que possam ser restaurados em caso da
perda dos dados originais.

Critrios de preservao digital: conjunto de atividades que determinam a
manuteno de colees digitais; a maioria das propostas de critrios que
vem surgindo menciona a influncia do modelo de referncia OAIS/SAAI,
elas definem as funes dos repositrios, os processos e procedimentos, a
comunidade alvo a usabilidade da informao e as tecnologias e a infra-
estrutura tcnica. Usados em procedimentos de auditoria e modelos de
certificao.

Digitalizao: transformao de informao analgica para formato digital, por meio
de dispositivo adequado e seguindo requisito de qualidade no seu processo
de produtividade.

Documento digital: documento codificado em linguagem binria digital ou
convertido para formato digital, legvel por mquinas, independente do
suporte fsico e de sua mensagem original, sendo que a digitalizao pode
chegar a produzir mudanas no se registro.



352
Documento eletrnico: um registro que foi criado (elaborado ou recebido) de forma
eletrnica.

DOI (Digital Object Identifier): sistema de identificador de objetos digitais on-line
para gerenciar a propriedade intelectual e o uso comercial dos objetos
materiais digitais.

Dublin Core: esquema de descrio de metadados para descoberta de recursos on-
line.

Emulao: criao de um novo software que imita o funcionamento do antigo
hardware e/ou software, com o objetivo de reproduzir seu comportamento.

Encapsulamento: preservao da informao necessria para o desenvolvimento
de conversores, emuladores e visualizadores de objetos digitais.

Espelhamento ou redundncia (Mirroring or Redundancy): manter uma cpia
exata de um arquivo em diversos lugares; muito usado na cpia de
segurana de grandes bases de dados.

Estratgia de preservao digital: tipo de abordagem que permite o acesso
contnuo informao em formato digital. Esquemas tcnicos e conceituais
que permitem identificar as partes integrantes do processo de preservao
digital, assim como sua padronizao em modelos de referncia.

Formato: estrutura do arquivo que define o modo como armazenado ou
apresentado na tela ou impresso; organizao seqencial de dados em
termos de seus componentes, tambm chamado de extenso. Formatos
abertos de arquivo so aqueles em que os usurios tm acesso aos
detalhes tcnicos e ao significado de sua estrutura de bits.

Handle System

: um exemplo de identificador persistente, desenvolvido pela


Corporation for National Research Initiatives.

Harvesting: busca automtica de endereos web, com o resgate das referncias
para outros documentos, links e informaes relevantes.

Identificador: um caractere ou conjunto de caracteres designados para identificar
inequivocamente um documento. Alguns exemplos de identificadores so o
URN (Uniform Resource Name), o DOI

, o ISBM (International Standard


Book Number) e o SICI (Serial Item and Contribution Identifier).

Identificador persistente: um nico identificador permanentemente associado a um
objeto digital, quando gerenciado, sempre prover acesso permanente a um
objeto independentemente de qualquer mudana de local.

Informao digital: dados organizados e com significados, codificados em dgitos
binrios, bits, produzidos e armazenados em computador.



353
Interoperabilidade: interao de documentos digitais entre diferentes sistemas
tecnolgicos; configurao de todos os arquivos, padronizando-os de forma
global.

Metadado: informaes estruturadas e codificadas que descrevem e permitem
gerenciar, compreender, preservar e acessar os documentos digitais ao
longo do tempo.

Metadados administrativos: tipo de metadados que permite o gerenciamento de
uma coleo digital.

Metadados de preservao: atributos especiais de dados ou documentos,
geralmente descritivos; so aqueles relacionados com o contedo do
documento, seu contexto e estrutura no momento da sua criao, assim
como das mudanas acontecidas em todo seu ciclo de vida.

Migrao: conjunto de atividades para copiar, converter ou transferir a informao
digital de uma tecnologia antiga ou obsoleta para uma tecnologia nova;
transferncia peridica de dados de uma gerao tecnolgica para outra.

Modelo de Referncia: estrutura para o entendimento de relaes significativas
entre entidades de um ambiente e para o desenvolvimento de padres
consistente ou especificaes que lhe do suporte. Um modelo de
referncia esta baseado em um nmero pequeno de conceitos unificados.

OAIS (Open Archival Information System): esquema conceitual que disciplina e
orienta um sistema para a preservao e manuteno de acesso
informao digital por longo prazo; contm o termo archival para distingi-lo
de outros usos do termo arquivo. Arquivo no OAIS consiste em uma
organizao de pessoas e sistemas que aceitam a responsabilidade de
preservar informao e torna-la disponvel.

Objeto digital: tipos de arquivos encontrados em meio digital, compostos de
conjuntos de seqncias de bits sobre contedos informacionais.
metadados e identificadores.

Pacote de Arquivamento de Informao (PAI): informao de contedo e sua
descrio de preservao necessria para preservar-la dentro de um pacote
de informao por longo prazo.

Pacote de Disseminao de Informao (PDI): pacote de informao que contm
partes de um PAI que so distribudas a um Cliente/Usurio quando
solicitado.

Pacote de Submisso de Informao (PSI): pacote de informao identificado pelo
produtor no acordo de submisso na estrutura conceitual do OAIS.

Preservao digital de longo prazo: o ato de manter informao, de forma correta
e independente por longo prazo. Informao armazenada
independentemente que possui documentao suficiente para permitir que


354
seja interpretada e usada por uma comunidade sem necessidade de
recursos especiais obsoletos. Requer procedimentos especficos e tcnicas
apropriadas para cada tipo de formato e mdia. Com ela pretende-se
garantir a inalterabilidade dos registros digitais

Preservation Master File: o objeto derivado do original que ser preservado,
gerenciado e disseminado por longo prazo.

Protocolo: padres que controlam a transferncia de informao entre
computadores. Desenvolvidos para melhorar a confiabilidade e a velocidade
de dados transferidos.

Repositrio digital: sistema de informao on-line encarregado de gerar e
armazenar objetos digitais para seus subseqentes acessos e
recuperaes.

Repositrio digital confivel: resultado da associao de repositrios institucionais
servios de preservao e arquivos por rea de conhecimento; tem como
misso prover acesso de longo prazo confivel a recursos digitais
gerenciados para suas comunidades alvo, hoje e no futuro.
Repositrio Institucional: repositrio digital que incluem no s artigos submetidos
ao processo tradicional de reviso dos pares (pos-print), como tambm
verses eletrnicas preliminares de documentos cientficos (pr-prints),
teses, manuais, materiais de ensino ou qualquer outro tipo de material que
os autores ou sua instituio desejem que se torne disponvel para o
pblico. Eles devem estar respaldados por poltica de gerenciamento que os
reconheam como vitais para a instituio.

SGML (Standard Generalized Markup Language): Linguagem de Marcao
Generalizada Padro que a base para a criao de todas as linguagens
de marcao, definido pela norma ISO 8879:1986.

Software: programa de computador. So instrues que o computador capaz de
entender e executar.

Software livre: programa de computador em que se tem liberdade de executar,
copiar, distribuir, modificar e aperfeioar, de acordo com interesses pessoais
ou comerciais. Apresenta um cdigo-fonte aberto.

URL (Uniform Resource Locator): padronizao da localizao ou dos detalhes de
endereamento dos recursos da Internet.

XML (Extensible Markup Language): linguagem para descrio de documentos
eletrnicos; estrutura sinttica para descrio de dados entre aplicaes de
informtica, em formato de texto; um formato padro para publicao,
armazenamento e transferncia de documentos por via eletrnica,
independente dos fabricantes de software, facilmente interpretvel por
mltiplas aplicaes e, em certa forma, auto-explicativo.

Você também pode gostar