Faculdade de Economia, Administrao, Contabilidade e Cincia da
Informao e Documentao Departamento de Cincia da Informao e Documentao
Miguel ngel Mrdero Arellano
CRITRIOS PARA A PRESERVAO DIGITAL DA INFORMAO CIENTFICA
Braslia DF 2008
Universidade de Braslia Faculdade de Economia, Administrao, Contabilidade e Cincia da Informao e Documentao Departamento de Cincia da Informao e Documentao
CRITRIOS PARA A PRESERVAO DIGITAL DA INFORMAO CIENTFICA
Miguel ngel Mrdero Arellano
Tese apresentada ao Programa de Ps-Graduao em Cincia da Informao, do Departamento de Cincia da Informao e Documentao da Universidade de Braslia como requisito parcial para obteno do grau de Doutor em Cincia da Informao.
Orientador: Prof. Dr. Murilo Bastos da Cunha
rea de concentrao: Transferncia da Informao Linha de pesquisa: Gesto da Informao e do Conhecimento
Braslia DF 2008
Mrdero Arellano, Miguel ngel.
Critrios para a preservao digital da informao cientfica / Miguel ngel Mrdero Arellano. Braslia: Universidade de Braslia, 2008. xix, 354 f. : il.
Tese (Doutorado em Cincia da Informao) Universidade de Braslia. Possui grficos, tabelas e referncias.
Ao meu orientador, professor Murilo Bastos da Cunha Aos professores e funcionrios do CID-UnB A minha amiga, bibliotecria e proofreader, Tereza Walter A minha amiga, colega e revisora, Margaret de Palermo A minha amiga, colega e bibliotecria da BPCT, Elise do Nascimento Aos colegas e chefes do Ibict Aos colegas das unidades de pesquisa do MCT
Aos amigos de longe e de perto Aos humanos e animais que gostam de mim...
Confiana - o senhor sabe - no se tira das coisas feitas ou perfeitas; ela rodeia o quente da pessoa
Joo Guimares Rosa GRANDE SERTO: VEREDAS (pg. 49)
iv RESUMO O presente trabalho tentou responder ao desafio de identificar um conjunto de critrios de preservao digital essenciais para os sistemas de informao cientfica nas unidades de pesquisa do Ministrio da Cincia e Tecnologia do Brasil. Para a elaborao da proposta de critrios, formularam-se quatro objetivos especficos: a) caracterizar o estado atual das prticas de preservao digital; b) identificar na literatura cientfica os critrios usados na construo dos sistemas de preservao digital em funcionamento; c) identificar as necessidades de preservao digital do grupo de instituies selecionadas para o estudo, e d) identificar os conceitos e aplicaes usados que podem interferir ou no na implementao de procedimentos padronizados de preservao digital da informao cientfica. Constatou-se, por meio da reviso da literatura, a inexistncia de avaliaes dos fundamentos tericos dos critrios e requisitos de preservao digital adotados em projetos internacionais, e que so poucos os estudos que calculam os benefcios observados em sua aplicao. Tanto a arquivologia quanto a cincia da informao tm na preservao digital um objeto de estudo que engloba todas as tarefas envolvidas no fluxo informacional, mas so reas que esto comeando a propor padres, normas, polticas e procedimentos para o arquivamento digital. Um critrio que se destaca no desenvolvimento das prticas de preservao digital citadas na literatura o da confiabilidade, determinante na formao do conjunto de critrios aqui propostos. A metodologia adotada baseou-se no uso das tcnicas de questionrio, entrevista, observao e anlise etnogrfica de contedo, sob a perspectiva de David Altheide. Para poder conhecer as abordagens tericas e metodolgicas que tm sido publicadas, realizou-se um estudo bibliomtrico descritivo, coletando dados de referncias bibliogrficas sobre o tema da preservao digital do perodo de 1996 at 2007. A anlise dessa produo cientfica utilizou o Statistical Package for the Social Sciences-SPSS. A anlise dos dados qualitativos coletados na pesquisa de campo mostrou que a maioria dos responsveis pelos centros de informao e bibliotecas do Ministrio da Cincia e Tecnologia percebe a preservao digital como os procedimentos relacionados com a capacidade de armazenamento, migrao e disseminao de contedos que, em sua maioria, so administrados de forma centralizada. Apenas os representantes de uma instituio reconheceram a importncia das polticas institucionais na definio das funes de insero e gerenciamento dos contedos arquivados na sua biblioteca digital. Os critrios de preservao digital propostos esto relacionados aos aspectos institucionais (Confiabilidade, Responsabilidade Poltica e Sustentabilidade Econmica) e aos aspectos gerenciais (Incluso em repositrios digitais, Transparncia e Acessibilidade de longo prazo). Estes critrios so considerados elementos determinantes das propriedades relativas aos sistemas de gerenciamento de informao cientfica. Entre as sugestes para estudos futuros, recomenda-se o desenvolvimento de pesquisas sobre a aprendizagem e aplicao de normas e padres pelos integrantes das equipes que gerenciam os sistemas de informao cientfica do governo, a incluso de uma discusso detalhada sobre metadados de preservao para informao cientfica e sobre o gerenciamento de longo prazo dos direitos autorais no ambiente digital.
Palavras-chave: Preservao digital. Critrios de preservao digital. Repositrio digital. Modelo de referncia OAIS. Informao cientfica. Ministrio da Cincia e Tecnologia.
v ABSTRACT This thesis aims to propose a Digital Preservation Criteria Set which is crucial for scientific information systems in the research units of the Science and Technology Ministry of Brazil. Four objectives were formulated in proposing the criteria: a) describe the digital preservation procedures currently being used; b) identify in scientific literature the key criteria used in building digital preservation systems; c) identify the digital preservation demands from the sampled research units; and d) identify both concepts and procedures that might interfere with standard digital preservation procedures of scientific information. A literature review has highlighted that a theoretical evaluation of both digital preservation criteria and requirements from international projects is nonexistent. It also highlighted that there are a very limited number of studies assessing the benefits produced by the application of this criteria and these requirements. Within the context of digital preservation both Archivistic and Information Science systems deal with tasks related to information flow. Only recently, are these areas proposing patterns, norms, policies and procedures directed to digital archiving. Trustworthy is a criteria for digital preservation procedures that stands out in the Scientific literature and is critical in identifying the digital preservation criteria set for scientific information. The proposed digital preservation criteria set is related to institutional aspects (Trustworthy, Political Responsibility and Economic Sustainability) and management aspects (Digital Repository Inclusion, Transparency, and Long-term Accessibility). These criteria are considered determinant elements in the management proprieties of administration systems for scientific information. The methodology in data collection included surveys, interviews, observation, and ethnographic content analysis according to David Altheide's approach. A descriptive bibliometric study was conducted in order to identify both the theoretical and methodological approaches in digital preservation literature from 1996 to 2007. Data analysis was performed using the Statistical Package for the Social Sciences-SPSS. Qualitative data from field research indicated that most of the information unit managers consider digital preservation as procedures related to storage capacity, migration and content dissemination. They also realize that these procedures are administered in a centralized manner. Only one research unit's participants recognized the importance of institutional policies in defining data ingest functions and management of contents archived in the institutional digital library. Suggestions for future studies include investigating the acquisition and application of Norms and Standards by government staff responsible for the administration of scientific information systems and extensive discussions both on Preservation Metadata relating to scientific information and Long-term management of propriety rights within the digital environment.
Key-words: Digital preservation. Digital preservation criteria. Digital repository. OAIS reference model. Scientific Information. Ministrio da Cincia e Tecnologia.
vi Lista de Figuras
Figura 1 - Contexto das necessidades de preservao digital da .............. informao cientfica 53 Figura 2 - Expectativa de vida de vrias mdias para armazenamento de informao 55 Figura 3 - Modelos do processamento nas perspectivas de preservao digital 60 Figura 4 - Diferenas entre estratgias de preservao ............................. 62 Figura 5 - Um documento digital encapsulado ........................................... 69 Figura 6 - Esquema de metadados da NZNL ............................................. 79 Figura 7- Estrutura de metadados de preservao das UNT Libraries ...... 82 Figura 8 - Registro de metadados da Victorian Electronic Records ........... Strategy 84 Figura 9 - Ferramenta para extrao de metadados de preservao da .. NLNZ 86 Figura 10 - Modelo de referncia Open Archival Information System ........ (OAIS) ou Sistema Aberto para Arquivamento de Informao (SAAI) 90 Figura 11 - Modelo funcional OAIS ............................................................. 91 Figura 12 - Exemplo de monitoramento de caixas LOCKSS ...................... 116 Figura 13 - Pgina do OJS/SEER opo Arquivamento da Revista no ..... LOCKSS 119 Figura 14 - Crescimento dos arquivos/repositrios .................................... 126 Figura 15 - Primeira interface do DSpace da Cornell University ................. 139 Figura 16 - Interface da Biblioteca Digital Memria do INPE ...................... 146 Figura 17 - Ciclo de vida dos objetos digitais ............................................ 151 Figura 18 - Modelo de Repositrio Digital Confivel (TDR) da RLG e OCLC 180 Figura 19 - Diagrama da integrao dos dois pilares da preservao ....... digital baseado no modelo TDR da RLG-OCLC 181 Figura 20 - Modelo funcional OAIS no projeto SHERPA ............................ 183 Figura 21 - Subtemas e locais das publicaes ......................................... 216 Figura 22 - Contribuio dos Subtemas no perodo 1996 a 2007 .............. 217 Figura 23 - Freqncia do tipo de autoria em funo do ano de ................ publicao 218 Figura 24 - Tipos de propostas apresentadas no perodo 1996 a 2007 ..... 219 Figura 25 - Tipologia de documentos ......................................................... 223 Figura 26 - Tendncia da produo de documentos no perodo 1996 a .... 2007 223 Figura 27 - Tipo de produo em funo do ano de produo ................... 224
vii Lista de Quadros
Quadro 1 - Relevncia dos requisitos de preservao ............................... 45 Quadro 2 - Expectativa de vida de algumas mdias para fins de ............... preservao digital 56 Quadro 3 - Mtodos de preservao digital ................................................ 61 Quadro 4 - Ferramentas para editorao eletrnica de revistas ................ 118 Quadro 5 - Estratgias de preservao no fluxo dos objetos digitais na .... biblioteca digital 123 Quadro 6 - Gerenciamento dos dados preservao digital ........................ 149 Quadro 7 - Estratgias de preservao adotadas pelos 21 sistemas ........ operacionais 159 Quadro 8 - Classificao das unidades de pesquisa do Ministrio da ....... Cincia e Tecnologia 198 Quadro 9 - Local de preservao e acesso da informao cientfica em formato digital produzida nas unidades de pesquisa do MCT 200 Quadro 10 - Listagem de respondentes das unidades de pesquisa do MCT entrevistados na fase exploratria e de pesquisa de campo 207 Quadro 11 - Plano de procedimento de observao .................................. 208 Quadro 12 - Questes debatidas em cada ano do perodo ........................ 221 Quadro 13 - Tipo de material segundo e setor responsvel no centro de .. informao e biblioteca 231 Quadro 14 - Bases de dados usadas nos centros de informao e ........... bibliotecas para o registro .. dos materiais bibliogrficos 233 Quadro 15 - Ferramenta de indexao utilizada segundo o tipo de ........... material 235 Quadro 16 - Tipo de acesso disponibilizado pelas unidades de pesquisa do MCT segundo o tipo de material 237 Quadro 17 - Formas de tratamento da produo cientfica da unidade de pesquisa 238 Quadro 18 - Mtodos de preservao aplicados aos materiais ................. bibliogrficos nas unidades de pesquisa 240 Quadro 19 - Listagem de entrevistados das unidades de pesquisa do ...... MCT 249 Quadro 20 - Entrevistados por setor das unidades de pesquisa do MCT .. 252 Quadro 21 - Funo dos entrevistados nas unidades de pesquisa ............ 253 Quadro 22 - Contedo dos documentos produzidos por servidores do ..... MCT sobre preservao digital 272
viii Lista de Tabelas
Tabela 1 - Produo dos autores em funo dos subtemas de interesse .. 215 Tabela 2 - Freqncia de publicaes e autoria em funo do subtema ... 216 Tabela 3 - Tipos de propostas para preservao digital ............................ 219 Tabela 4 - Questes debatidas no perodo 1996-2007 .............................. 220 Tabela 5 - Propostas e questes debatidas ao longo do perodo 1996- 2007 222 Tabela 6 - Distribuio de freqncia da rea do conhecimento ............... 225 Tabela 7 - Tipos de Publicao em funo da rea de conhecimento ....... 225 Tabela 8 - Ttulo e pas de origem dos peridicos com artigos sobre ........ preservao digital 226 Tabela 9 - Servidores nas bibliotecas das unidades de pesquisa do MCT 245 Tabela 10 - Produo bibliogrfica sobre preservao digital no MCT ...... (1998-2007) 270
ix Lista de Abreviaturas e Siglas
ABEC Associao Brasileira de Editores Cientficas ACII American Standard Code for Information Exchange AEB Agncia Espacial Brasileira AEC Anlise Etnogrfica de Contedo AHDS Arts and Humanities Data Service AIA Aerospace Industries Association/Boing Co. AINFO-NTIA AINFO/National Telecommunications and Information Administration AIP American Institute of Physics AQD Anlise Qualitativa de Documentos Arc Australian Research Council ARK Archival Resource Key ASCII American Standard Code for Information Interchange ASP Active Server Pages BDJur Biblioteca Digital Jurdica BDTD Biblioteca Digital de Teses e Dissertaes BIREME Centro Latino-Americano e do Caribe de Informao em Cincias da Sade BL British Library BMC BioMed Central BOAI Budapest Open Archive Initiative BPCT Biblioteca de Poltica em Cincia e Tecnologia C&T Cincia e Tecnologia CAPES Coordenao de Aperfeioamento do Ensino Superior CBPF Centro Brasileiro de Pesquisas Fsicas CCSDS Consultative Committee for Space Data Systems CDI Coordenao de Documentao e Informao Cientfica CDPP Centre de Donnes de la Physique des Plasmas CD-R Compact Disk - Recordable CD-ROM Compact Disk Read Only Memory CDU Classificao Universal Decimal CEDAR Consortium of University Research Libraries (CURL) Exemplars in Digital Archives
x CEITEC Centro de Excelncia em Tecnologia Eletrnica Avanada CENDI U.S. Federal Information Managers Group CENPRA Centro de Pesquisas Renato Archer CERN European Organization for Nuclear Research CETEM Centro de Tecnologia Mineral CGEE Centro de Gesto e Estudos Estratgicos CGGI Coordenao-Geral de Gesto e Inovao cgi Computer Graphic Interface CLIR Council of Library Information Research CNEN Comisso Nacional de Energia Nuclear CNPq Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico CNRI Corporation for National Research Iniciatives Conarq Conselho Nacional de Arquivos CORDIS Community Research & Development Information Service CPA Commission on Preservation and Access CRiB Conversion and Recommendation of Digital Object Formats CSDGM Content Standard for Digital Geospatial Metadata DARPA Defense Advanced Research Projects Agency DBMS Database Management System DCC Digital Curation Centre DIAS Digital Information Archiving Systems Dutch National Library DICI Dilogo Cientfico (IBICT) DIOnAS Data Ingest and Online Access Sub-System DIP Dissemination Information Package DiVA Electronic Publishing Centre, Uppsala University Library DOI Digital Object Identifier DPC Digital Preservation Coalition DROID Digital Record Object Identification DRS Digital Rosetta Stone DTD Document Type Definition DTIC Defense Technical Information Center DTS Data Time Stamping DVD Digital Video Disk
xi EAD Encoding Archives Description EBSCO Elton B. Stephens Company ECPA European Commission on Preservation and Access EMBRAPA Empresa Brasileira de Pesquisa Agropecuria ERA Electronic Record Archives EROS Earth Resources Observation Systems Data Center ERPANET Electronic Resource Preservation and Access Network ESD Elsevier Science Direct also part of the Dutch National Library FAPESP Fundao de Apoio Pesquisa do Estado de So Paulo Fedora Flexible Extensible Digital Object Repository Architecture FINEP Financiadora de Estudos e Projetos do Estado de So Paulo GIF Graphics Interchange Format GILS Government Information Locator Service GPO U.S. Government Printing Office HD-ROM High-Density - Read Only Memory HP Hewlett-Packard Co. HTML Hyper Text Markup Language HTTP Chat & Hyper Text Transfer Protocol NGO Non Government Organization Ibict Instituto Brasileiro de Informao em Cincia e Tecnologia IBM International Business Machines ICSTI International Council for Scientific and Technical Information ICT Informao em Cincia e Tecnologia IDSM Instituto de Desenvolvimento Sustentvel Mamirau IES Instituio de Ensino Superior IFLA International Federation of Libraries Association IMAGE Imager for Magnetopause-to-Aurora Global Exploration IMLS Institute of Museum and Library Services IMPA Associao Instituto Nacional de Matemtica Pura e Aplicada INB Indstrias Nucleares do Brasil INIST-CNRS Institut de lInformation Scientifique et Technique INPA Instituto Nacional de Pesquisas da Amaznia INPE Instituto Nacional de Pesquisas Espaciais
xii INSA Instituto Nacional do Semi-rido INT Instituto Nacional de Tecnologia InterPARES The International Research on Permanent Authentic Records in Electronic Systems IPR Intellectual Propriety Rights ISBN Internation Standard Book Number ISO International Organization for Standadization IUCR International Union of Crystallography JISC Joint Information Systems Committee JPG Joint Photographic Experts JSTOR Electronic-Archiving Initiative KB National Library of the Netherlands KB Koninklijke Bibliotheek LATEX LAmport Tex LC Library of Congress LNA Laboratrio Nacional de Astrofisica LNCC Laboratrio Nacional de Computao Cientfica LNLS Laboratrio Nacional de Luz Sncrotron / ABTLus LOCKSS Lots of Copies Keep Stuff Safe LOTAR Long Term Archiving and Retrieval and Product Data Within the Aerospace Industry LSDA Life Science Data Archive MAST Museu de Astronomia e Cincias Afins MCT Ministrio de Cincia e Tecnologia MD5 Message-Digest algorithm 5 (para criptografar) METS Metadata Encoding & Transmission Standard MIME Multipurpose Internet Mail Extensions MIT Massachussetts Institute of Technology MITCET Council on Educational Technology MIX Metadata for Image in XML MKA Meta Knowledge Archive MoReq Model Requirements for the Management of Electronic Records MPEG Museu Paraense Emlio Goeldi MS DOS Microsoft Disk Operating System N2T Name-to-thing
xiii NARA National Archives and Records Administration NASA Goddard Space Flight Center Library NDIIP National Digital Information Infrastructure for Preservation Program NEDLIB Network European Deposit Library NEH The National Endowment for the Humanities NESTOR Network of expertise in Long-Term Storage of Digital Resources NHPRC National Historical Publications and Records Commission NISO National Information Standards Organization NLA National Library of Australia NLM Profiles in Science, National Library of Medicine NLNZ National Library of New Zealand NMM National Motor Museum NPO National Preservation Office NSF National Science Foundation Nuclep Nuclebrs Equipamentos Pesados NZLS New Zeland Locator Service OAI Open Archives Initiative OAI-PMH Open Archive Initiative Protocol Metadata Harvesting OAIS Open Archive Information System OARINZ Open Access Repositories in New Zealand OCLC Online Computer Library Center OCW Open Courseware OE Objetivo Especfico OhioLINK Ohio Library and Information Network OJS Open Journal Systems ON Observatrio Nacional OpenDOAR Directory of Open Access Reposiories P&D Pesquisa e Desenvolvimento PAI Pacote de Arquivamento de Informao PADI Preserving Access to Digital Information PANDORA Australias Web Archive PDF Portable Document Format PDI Pacote de Disseminao de Informao
xiv PKP Public Knowledge Project PLANETS Preservation and Long-term Access through Networked Services PLEDGE PoLicy Enforcement in Data Grid Environments PPS Photographic Preservation Society PREMIS Preservation Metadata: Implementation Strategies PRO Public Record Office PSI Pacote de Submisso de Informao PubMed Central National Library of Medicine PURL Persistent Uniform Resource Locators RDF Resource Description Framework RI Repositrio Institucional RIDI Repositrio Institucional Digital do IBICT RLG Research Library Group RNP Associao Rede Nacional de Ensino e Pesquisa ROAR Registry of Open Access Repositories SAAI Sistema de Arquivamento Aberto de Informao SBPC Sociedade Brasileira para o Progresso da Cincia SciELO Scientific Electronic Library Online SDSC San Diego Supercomputer Center SEER Sistema Eletrnico de Editorao de Revistas SGML Standard Generalized Markup Language SHERPA Securing a Hybrid Environment for Research Preservation and Access SIP Pacote de Submisso de Informao SNBU Seminrio Nacional de Bibliotecas Universitrias SOA Arquitetura de Servio Orientado SPSS Statistical Package for Social Sciences TCC Trabalho de Concluso de Curso TCI Tesauro da Cincia da Informao TCL Tool Command Language TDR Trust Digital Repository TOM Typed Object Model TRAC Trustworthy Respository Audit & Certification: Criteria and Checklist
xv UNESCO United Nations Educational, Scientific and Cultural Organization UPS Universal Preprint Service URL Uniform Resources Location URLib Uniform Repository for a Library URN Uniform Resource Name USP Universidade de So Paulo VERS Victorian Electronic Records Strategy Austrlia VHS Video Home System VRA Visual Resources Association WEB Sinnimo de World Wide Web WIPO World Intellectual Property Organization XING Instituto de Desenvolvimento Cientfico e Tecnolgico Xing XML Extensible Markup Language
xvi SUMRIO
AGRADECIMENTOS...................................................................................... iii RESUMO......................................................................................................... iv ABSTRACT.................................................................................................... v LISTA DE FIGURAS...................................................................................... vi LISTA DE QUADROS.................................................................................... vii LISTA DE TABELAS...................................................................................... viii LISTA DE ABREVIATURAS E SIGLAS......................................................... ix
1 INTRODUO ............................................................................... 20 1.1 APRESENTAO DO TEMA ........................................................ 21
1.2 DEFINIO DO PROBLEMA ........................................................ 26
2 REVISO DE LITERATURA ......................................................... 30 2.1 CINCIA E PRESERVAO DIGITAL .......................................... 31 2.1.1 Tecnologia e evoluo dos documentos ................................... 36 2.1.2 Arquivologia e preservao digital ............................................ 38 2.1.3 Cincia da informao e preservao digital ............................ 41
2.2 PRESERVAO DIGITAL ............................................................. 43 2.2.1 Preservao da informao em objetos digitais ....................... 43 2.2.2 Necessidades de preservao digital ........................................ 50 2.2.3 Estratgias para a preservao digital ...................................... 54 2.2.3.1 Preservao da seqncia de bits ................................................. 59 2.2.3.2 Preservao da tecnologia e do objeto digital ............................... 61 2.2.3.3 Migrao ........................................................................................ 62 2.2.3.4 Emulao e encapsulamento ......................................................... 68 2.2.3.5 Conservao de hardware e software ........................................... 71 2.2.4 Metadados de preservao ......................................................... 72 2.2.4.1 Iniciativas de implementao de metadados de preservao ....... 82
xvii 2.2.4.2 A norma OAIS ................................................................................ 87
2.3 PRESERVAO DIGITAL DA PRODUO CIENTFICA ............ 99 2.3.1 Preservao digital e acesso livre .............................................. 99 2.3.1.1 OAI e a preservao do acesso de longo prazo ............................ 100 2.3.1.2 Acesso livre e a comunidade cientfica .......................................... 102 2.3.1.3 Autodepsito e preservao digital ................................................ 105 2.3.1.4 Preservao e preservao ...................................................... 107 2.3.1.5 Tecnologias para o acesso livre ..................................................... 109 2.3.2 Preservao de peridicos eletrnicos ..................................... 110 2.3.2.1 Arquivamento de peridicos eletrnicos ........................................ 113 2.3.2.2 LOCKSS ......................................................................................... 114 2.3.2.3 Gerenciamento editorial e preservao digital ............................... 117 2.3.3 Preservao em repositrios digitais ........................................ 120 2.3.3.1 Bibliotecas digitais .......................................................................... 122 2.3.3.2 Repositrios digitais ....................................................................... 124 2.3.3.3 Repositrios institucionais .............................................................. 127 2.3.3.4 Repositrios institucionais nas bibliotecas ..................................... 131 2.3.3.5 Softwares para repositrios institucionais ...................................... 133 2.3.3.6 Repositrios DSpace ..................................................................... 138 2.3.3.7 Repositrios e identificadores persistentes .................................... 143 2.3.3.8 Repositrio uniforme do Inpe ......................................................... 146
2.4 GERENCIAMENTO DA PRESERVAO DIGTAL ....................... 147 2.4.1 Infra-estrutura tecnolgica .......................................................... 153 2.4.2 Infra-estrutura organizacional .................................................... 155 2.4.3 Consolidao das iniciativas de preservao digital ............... 157
2.5 SUSTENTABILIDADE DA PRESERVAO DIGITAL .................. 162 2.5.1 Sustentabilidade comercial ......................................................... 166
2.6 POLTICAS DE PRESERVAO DIGITAL ................................... 169 2.6.1 Permisses para preservar ......................................................... 171
xviii
2.6.2 Gerenciamento dos direitos de propriedade ............................. 174
2.7 MAPEAMENTO DOS CRITRIOS DE PRESERVAO DIGITAL 177 2.7.1 Atributos de repositrios digitais ............................................... 184 2.7.2 Certificao de repositrios digitais .......................................... 185
2.8 CONCLUSES DA REVISO DE LITERATURA .......................... 189
3 METODOLOGIA ............................................................................ 193 3.1 PROBLEMA INVESTIGADO .......................................................... 196
3.2 UNIVERSO DE PESQUISA E AMOSTRA ..................................... 196
3.3 INSTRUMENTOS DE COLETA DE DADOS ................................. 201 3.3.1 Estudo bibliomtrico ................................................................... 201 3.3.2 Questionrios ............................................................................... 202 3.3.3 Pesquisa de campo ...................................................................... 203 3.3.4 Entrevistas .................................................................................... 204 3.3.5 Observaes de curta durao ................................................... 208
4 ANLISE DOS DADOS ................................................................. 210 4.1 ANLISE BIBLIOMTRICA ........................................................... 210 4.1.1 Bibliometria descritiva da preservao digital .......................... 211 4.1.2 Avaliao da produtividade ........................................................ 214 4.1.3 Temticas e questes discutidas ............................................... 228
4.2 ANLISE DOS DADOS DOS QUESTIONRIOS .......................... 229 4.2.1 Caractersticas dos centros de informao .............................. 230 4.2.2 Perfil profissional das equipes ................................................... 243 4.3 ANLISE DOS DADOS DAS ENTREVISTAS ............................... 246 4.3.1 Perfil profissional dos entrevistados ......................................... 250 4.3.2 Anlise dos contedos das entrevistas ..................................... 253 4.3.2.1 Sobre as prprias funes e atividades de preservao ............... 254 4.3.2.2 Sobre o tratamento dos objetos digitais na instituio ................... 258
4.4 ANLISE ETNOGRFICA DE CONTEDO ................................. 262 4.4.1 Observaes de campo .............................................................. 264 4.4.2 Os documentos ............................................................................ 267 4.4.2.1 Materiais de divulgao ................................................................. 268
APNDICE A Questionrio ....................................................................... 319 APNDICE B Roteiros de entrevistas ..................................................... 321 APNDICE C Lista de projetos e iniciativas de preservao digital .... 323 APNDICE D Centros de informao e bibliotecas das unidades de pesquisa do Ministrio da Cincia e Tecnologia 330 APNDICE E Produo bibliogrfica dos servidores do Ministrio da Cincia e Tecnologia sobre a preservao digital 347 APNDICE F Glossrio de termos tcnicos ........................................... 350
20 1 INTRODUO
O propsito desta investigao foi identificar os critrios de preservao digital estabelecidos nas polticas, programas e projetos internacionais e as recomendaes que instituies no exterior e no Brasil esto oferecendo para a preservao da informao cientfica e tecnolgica em formato digital. Apresentar-se- um trabalho terico sobre o estado-da-arte e sero aglutinados os critrios de preservao digital, dentro da proposta de um conjunto mnimo de critrios que possam ser aplicados nas unidades de pesquisa do Ministrio da Cincia e Tecnologia (MCT). A proposio inicial apresentar o tema da preservao digital, as definies conceituais mais utilizadas e sua aplicao na realidade em um tipo especfico de instituies de pesquisa. A preservao digital uma preocupao dos profissionais da informao, devido principalmente ao uso extensivo que tem sido feito das tecnologias digitais e do registro de informaes em solues cada vez mais sofisticadas e complexas. Os antecedentes considerados significativos so, especificamente, a ausncia de trabalhos cientficos que tratem sobre o contexto desses registros e a falta de padronizao que possa ajudar no tratamento desses dados. A pesquisa a ser relatada pretende contribuir para as investigaes das transformaes que os sistemas de informao vm enfrentando. Para realizar o trabalho, foram selecionados alguns mtodos a serem empregadas em diferentes momentos da investigao. Em primeiro lugar foram feitos levantamentos bibliogrficos, principalmente em textos que abrangem os anos de 1996 ao final de 2007. Identificados os principais autores e instituies dedicadas pesquisa na rea, foram realizadas anlises bibliomtricas para se chegar aos produtores das normas e padres que poderiam ser usados na construo do conjunto de critrios adequados a um sistema de preservao digital no Brasil. Nesse sentido, foi preciso conhecer a atuao de um grupo de instituies cientficas brasileiras, representadas por rgos pblicos as unidades de pesquisa do Ministrio da Cincia e Tecnologia. Para chegar compreenso de sua realidade, foram enviados questionrios e realizadas visitas maioria dessas
21 instituies, observando atividades que a equipe responsvel identificou como relacionadas preservao digital; e, por ltimo, fez-se um registro sonoro das entrevistas com as pessoas envolvidas com o tratamento dos dados digitais nessas unidades. Na anlise dos dados foi mencionada a definio de documento dentro da tcnica de Anlise Etnogrfica de Contedo (AEC), na qual ele uma representao simblica que pode ser registrada e recuperada. Essa tcnica utilizada na anlise de padres de surgimento e uso de conceitos na divulgao de notcias e eventos ligados a situaes complexas. Nesta pesquisa, a AEC foi usada para conseguir identificar os padres que levam construo de conceitos relacionados com a preservao digital, que servem para configurar a noo que as instituies empregam para justificar as atividades que tm sido aplicadas no tratamento dos registros digitais. Este trabalho no pretendeu fazer um levantamento de todos os sistemas de preservao digital existentes, mas reconhecer, dentre os mais citados na literatura, os critrios que possam interessar s organizaes que lidam com informao cientfica em formato digital, os desafios que elas enfrentam na preservao do acesso e no gerenciamento dos repositrios digitais de registros da cincia. Espera-se que esses critrios possam contribuir para o desenvolvimento de sistemas de gerenciamento de preservao e na implementao de polticas, programas e projetos dedicados ao tema.
1.1 APRESENTAO DO TEMA
O tema desta pesquisa a preservao da informao cientfica em documentos digitais, para poder formular o conjunto de critrios que caracterizam sua implementao e funcionamento em instituies de pesquisa do governo brasileiro. A proposio surge da necessidade de produzir uma estrutura terica e uma abordagem metodolgica adequada ao problema da preservao da informao cientfica em formato digital. A investigao procurou ordenar uma linha de pensamento terica e conceitual para produzir conhecimentos e instrumentos apropriados para tratar uma
22 parte fundamental do fluxo interno da gesto da informao digital que o planejamento das atividades de preservao de longo prazo. Com base em resolues da United Nations Educational, Scientific and Cultural Organization (UNESCO), como a Carta sobre a Preservao Digital (2003) e Recomendaes sobre Software Livre para Repositrio e Sistema de Preservao (2007), pode-se afirmar que existe necessidade urgente de salvar o patrimnio cultural e cientfico digital, para garantir o acesso a esses recursos s funcionalidades dos registros eletrnicos autnticos. Os documentos digitais so frgeis e no existe segurana suficiente nos sistemas eletrnicos para garantir sua preservao digital de longo prazo. Essa fragilidade pode estar em sua rpida degradao fsica, na obsolescncia tecnolgica, na complexidade e nos custos. Tambm deve ser mencionada a necessidade da formao de profissionais especializados em todas as reas envolvidas no processo de preservao digital que inclui bibliotecrios, arquivistas, muselogos e o pessoal de tecnologia da informao. A dependncia social na informao digital vai alm do simples acesso rpido aos dados, mas se expressa no uso desses dados como provas das funes e atividades de pessoas, grupos e instituies. O problema da preservao digital est no contedo dos objetos digitais, nas informaes armazenadas e na maneira como foram armazenadas. No so apenas seqncias de zeros e uns ou cadeias de bits (bitstream) 1 , mas o conjunto de decises que definiram a formao bsica do objeto informacional como um objeto nico. Isso envolve a descrio de documentos que podem ser representados de diferentes formas, mas o seu contedo ser sempre interpretado do mesmo modo, no momento da sua recuperao, ou seja, ser a mesma cadeia de bits com seu significado original. A maioria dos bibliotecrios e arquivistas aceita que a preservao digital depende de modo geral da migrao de material digital que permite que ele seja compatvel com novas tecnologias. Mas a migrao muito mais complexa do que apenas transferir o bitstream de uma mdia para outra. A estrutura interna e o contedo do material devem ser preservados e transferidos igualmente, para que, dessa forma, o novo objeto seja uma representao fiel do original.
1 NA: o bit ou dgito binrio a menor unidade de informao utilizada nas reas de computao e informtica, o bitstream a camada mais elementar para dotar de significado um objeto digital.
23 Os objetos digitais, freqentemente complexos, so compostos de tipos heterogneos fechados e sem possibilidade de modificao depois de criados. O que os cientistas apreciam nesses objetos ou formatos pode estar em conflito com os mtodos de preservao. Isso produz tenso entre cientistas que desejam ter uma mdia digital viva e respirando e os preservacionistas que apenas querem que o objeto seja estvel para seu uso infinito. Os arquivos digitais com informaes cientficas podem ter seu significado expresso pelos softwares no qual foram criados, j que eles so dependentes desses programas, mas a sua preservao no apenas salvar o programa que interpreta o arquivo. Os documentos digitais precisam tambm da mquina na qual so lidos, complicando ainda mais sua reteno e recuperao. A dificuldade da preservao digital deve-se principalmente necessidade de reteno do objeto digital e do seu significado. A carncia maior est na definio de tcnicas de preservao digital capazes de compreender e reproduzir a forma e a funo original do objeto, para garantir sua autenticidade e acessibilidade, pois eles no so apenas objetos fsicos. Como respostas a esse desafio, surgem estratgias de preservao digital que procuram incorporar todos os aspectos relacionados ao problema tecnolgico: custos, legislao, gesto, acesso, polticas e critrios. So formas de reunir solues parciais ante um problema complexo no qual esto envolvidos, entre outros itens, a migrao, emulao, arqueologia digital, criptografia, metadados, formatos- padro e software livre. O tema da preservao dos documentos digitais est cada vez mais presente entre os criadores e gerenciadores de colees digitais. Para aqueles que comeam a enfrentar a possibilidade de no poder recuperar informaes produzidas h 5 ou 10 anos, vital contar com estratgias que garantam a persistncia desses dados. No caso especfico das informaes cientficas, a importncia do registro e arquivamento dos dados produzidos durante a pesquisa fundamental. Desde que a internet se estabeleceu como uma plataforma de comunicao entre cientistas e para a localizao de informaes relevantes para o desenvolvimento da cincia tm surgido novas formas de organizao de informao digital, contando com o respaldo de instituies de ensino e pesquisa para sua manuteno e uso permanente.
24 As tcnicas de preservao que eram conhecidas pelas bibliotecas e pelos centros de informao se modificaram e encontraram novas prticas num contexto de rede de computadores, em que a informao no fica apenas num s lugar. A preservao da informao em formato digital precisa de um conjunto de prticas tcnicas e de gerenciamento que mudam constantemente. Com o surgimento de pacotes de software, pode-se afirmar que a rea de preservao digital est chegando maturidade. Algumas dessas solues saram das reas da computao e da cincia da informao, como ferramentas e servios para bibliotecas e arquivos. Entre os sistemas mais citados esto o DSpace, o Fedora, o LOCKSS (Lots of Copies Keep Stuff Safe), o PANDAS, o OCLC Digital Archive, e o DIAS (Digital Information Archive System) 2 da IBM. Todos eles procedem de organizaes de diferentes perfis: provedores de servio para biblioteca, grupos de pesquisa de bibliotecas especializadas, equipes de repositrios universitrios e bibliotecas nacionais trabalhando em parceria com empresas terceirizadas, mostrando a necessidade de integrao entre todos os interessados no assunto. Para a informao cientfica, a preservao dos documentos nascidos digitais ou que so verses de documentos analgicos tem carter de dependncia das tecnologias existentes, mas tambm, a necessidade de reformulao das prticas tradicionais de aquisio, armazenamento e acesso. Pretende-se mostrar neste estudo os aspectos da preservao da informao cientfica, que tm trazido um conjunto inovador de prticas e de decises gerenciais que no eram contempladas no passado. A cincia precisa da preservao dos resultados das pesquisas desenvolvidas por instrumentos confiveis para que esses resultados possam ser utilizados futuramente por outros cientistas. Os subsdios para esta pesquisa vieram da literatura sobre o item preservao, que destaca alguns temas tratados com freqncia durante o desenvolvimento das principais iniciativas internacionais. Apesar da crescente relevncia que os meios e tcnicas digitais de gerenciamento da informao digital vm assumindo no mundo, existe pouca
2 Muitas Cpias Deixam as Coisas Seguras; Arquivo Digital; Sistema Digital de Arquivamento da Informao.
25 avaliao dos fundamentos tericos e metodolgicos das estratgias de preservao digital. A literatura da rea, em sua ampla maioria, tem sido produzida por pesquisadores preocupados com a herana cultural e artstica da humanidade. H necessidade de um corpo de conhecimentos ligado preservao de materiais digitais, compreendendo o fluxo da informao, o processamento, o acesso e o uso otimizado. A carncia de trabalhos cientficos avaliando as tecnologias de preservao de colees importantes de Cincia e Tecnologia (C&T) tem sido apontada por raros profissionais da informao (GLADNEY, 2006). Estudos realizados enfocam alguns mtodos de preservao de objetos digitais e mostram a sua limitao ante o enorme crescimento desses registros. Tanto nas reas da arquivstica, quanto da cincia da informao, existe ainda o desafio de estabelecer padres, polticas e estratgias para as melhores prticas de arquivamento digital. Atualmente, vrios estudos vm centrando-se no modelo de preservao digital das bibliotecas e repositrios digitais, enfocando a necessidade de futuros usurios disporem de materiais autnticos e certificados por instituies reconhecidas. A descrio em metadados de todos os detalhes que expressem a histria de criao de um objeto digital est sendo considerada uma metodologia que pode garantir a autenticidade de um registro eletrnico. No mbito nacional, a definio das polticas, obrigaes e metodologias mais apropriadas preservao dos documentos eletrnicos deve levar em considerao a implementao de modelos, a fim de verificar se eles atendem s expectativas dos usurios de instituies nacionais de pesquisa. Recomenda-se, tambm, comprovar se eles esto em concordncia com os padres internacionais j testados, que promovem a longo prazo o arquivamento digital da produo cientfica. Tal discusso no pode ficar isolada ou postergada. Ela parte de um tema de debate internacional que, certamente, deve incluir o Brasil. Nesta pesquisa pretende-se identificar o conjunto de critrios de preservao digital a serem propostos s instituies ligadas ao MCT. Esse conjunto no foi testado nessas organizaes, mas analisaram-se as percepes dos responsveis pelos acervos digitais nessas instituies, bem como o estado das colees digitais dessas unidades de pesquisa.
26
1.2 DEFINIO DO PROBLEMA
O problema de investigao do qual parte a presente pesquisa : verificar quais critrios de preservao digital, usados na construo sistemas de gesto da informao cientfica e tecnolgica e reconhecidos internacionalmente, podem ser adotados pelas instituies de pesquisa do Ministrio da Cincia e Tecnologia do Brasil. Levar-se- em conta a compreenso da necessidade de preservao dos responsveis pelos acervos digitais nas unidades de pesquisa governamentais, identificando os riscos da ausncia de solues adequadas para a possibilidade de perda dos registros em formato digital. Na construo dos princpios e prticas relacionadas com o gerenciamento da informao, as pesquisas na rea de cincia da informao esto sempre procurando conhecer as novas tendncias nos espaos de informao e assinalando particularidades sociais e culturais. A cincia da informao tem nas prticas de preservao de documentos digitais um objeto de estudo que engloba todas as tarefas envolvidas no fluxo informacional que, aps serem analisadas pelos pesquisadores, podem chegar a ser pontos focais de originalidade da rea. A preservao de documentos em formato eletrnico uma das principais preocupaes de arquivistas e bibliotecrios. A prpria definio do que seria a preservao digital no tem sido amplamente disseminada (ver item 2.2.1). Isso obriga qualquer tentativa de trabalho sobre o tema a ter de identificar o que realmente um objeto digital e o tipo de processo gerencial que ele sofre. A complexidade do assunto leva consigo o tratamento de temas ligados a ele, como so os aspectos tecnolgicos, organizacionais e gerenciais. A heterogeneidade do tema inclui as formas que o objeto digital pode chegar a apresentar, provocando uma mudana no gerenciamento de acervos tradicionalmente identificados como estticos, para uma realidade multimdia, dinmica e interativa. O futuro parece no vislumbrar ainda uma definio de como esses documentos viro a ser acessados. Fala-se na preservao digital como um problema complexo, porque existem muitas variveis a ser consideradas. Entre essas ramificaes, estariam as
27 de ordem conceitual, as normativas, as jurdicas, as administrativas, as operacionais e as de segurana e integridade. Especificamente as operacionais envolveriam as relacionadas com o preparo do pessoal tcnico e as tecnologias aplicadas, sem deixar de lado os usurios (SAYO, 2005). Segundo Lyman (2002), 93% da informao que est sendo criada nos anos recentes j se encontra em forma digital ou nasceu digital. O contexto dessa informao est definido pela natureza do suporte: ele inerentemente frgil, fcil de corromper ou alterar, requer para seu acesso tecnologias que mudam constantemente e tem o mesmo valor na preservao que os materiais tradicionais. No ltimo aspecto, o tempo dedicado preservao menor. Segundo Hanna (2001) e Wiggins (2001), existem vrias maneiras de perder os registros digitais, entre elas, reorganizar o contedo (no usar identificadores de pginas da Internet permanentes), no valorizao da histria pelos responsveis; manter uma mdia ultrapassada e com sistemas e hardware obsoletos; esquecer os softwares e os manuais; perder os metadados importantes com suas formas de indexao e dependncias; no proteger a autenticidade; e ignorar os custos da preservao. Os bibliotecrios e arquivistas sentem a necessidade de preservar esses registros ao longo do tempo, mas eles se encontram indecisos em relao ao tipo de estratgia a adotar. O questionamento inicial de como preservar os documentos digitais e seu contedo continua vigente. No caso especfico deste trabalho, o contedo a informao cientfica e tecnolgica. Pretende-se identificar as abordagens com relao preservao digital, discutir suas propostas, documentar as perspectivas publicadas e reunir as opinies dos responsveis por acervos dessa natureza no Brasil. Propor critrios para implementao de sistemas de gesto de preservao digital da produo tcnico-cientfica no Brasil significa tentar responder s seguintes questes:
1. Como uma percepo da preservao digital se transforma em critrio para um modelo/sistema de referncia? 2. Como podem ser avaliados os benefcios conseguidos na aplicao dos critrios de preservao digital num sistema de gesto da informao cientfica e tecnolgica?
28 3. Qual o estado atual das atividades de preservao dos documentos em arquivos digitais no Brasil? 4. Como podem ser analisadas as percepes e as aes relacionadas s necessidades de preservao digital da informao cientfica? 5. Quais so as necessidades e expectativas dos responsveis pelos acervos digitais de informao em cincia e tecnologia (IC&T)? 6. Quais seriam os critrios constituintes e o modelo de implementao de um sistema de preservao digital de informao tcnico-cientfica?
Ao enfocar na implementao das prticas de preservao digital, esta pesquisa objetiva apresentar os critrios que identificam as percepes e as aes relacionadas com a sua implementao, assim como avaliar a arquitetura das solues propostas, com as quais se tenta assegurar que os objetos digitais considerados relevantes para a C&T estejam armazenados de forma a garantir a perenidade dos seus contedos. Uma avaliao dos benefcios conseguidos pelas principais iniciativas internacionais de preservao digital servir na formulao dos critrios que sustentem a implantao de um sistema, identificando as variveis que caracterizam este processo. Constituem interesse desta pesquisa as iniciativas nacionais e a viso de seus responsveis que podem interferir ou no no entendimento do significado e propsito da preservao digital, assim como no efeito e extenso das metodologias adotadas e nas aes das instituies. Com este estudo, objetiva-se mostrar o alcance das estratgias e propor os critrios apropriados para a preservao de objetos digitais, gerando, assim, subsdios para as iniciativas nacionais relacionadas manuteno e controle dos acervos digitais que sejam de importncia estratgica para o desenvolvimento cientfico e tecnolgico do pas. Para fins desta pesquisa, a ser efetuada no mbito da cincia da informao, o esforo investigativo a ser empreendido estar em reunir conhecimento sobre as necessidades de critrios de preservao digital no contexto do gerenciamento da informao cientfica e tecnolgica.
29 1.3 OBJETIVOS
1.3.1 Objetivo geral
O objetivo geral da pesquisa formular um conjunto de critrios necessrios implementao de sistemas de gesto da preservao de informao cientfica em documentos digitais. Pretende-se determinar as necessidades de preservao, as tecnologias mais adequadas, os processos de insero, manuteno, recuperao e acesso aos documentos eletrnicos. A proposta tem como base os critrios descritos na literatura especializada da rea da cincia da informao.
1.3.2 Objetivos especficos
A elaborao da proposta de critrios para a construo de um sistema de gesto de preservao digital da informao cientfica e tecnolgica envolve os seguintes objetivos especficos:
OE1) caracterizar o estado das prticas de preservao digital da informao tcnico-cientfica; OE2) identificar na literatura da rea os critrios para sistemas de gesto de preservao digital de informao cientfica e tecnolgica; OE3) identificar as necessidades de preservao digital da informao tcnico-cientfica das unidades de pesquisa do Ministrio da Cincia e Tecnologia; OE4) resgatar os conceitos e aplicaes usados nessas organizaes que caracterizam suas prticas de preservao, tendo por parmetro as condies locais que interfiram no entendimento do significado e propsito da implantao das metodologias de preservao de documentos digitais.
30 2 REVISO DE LITERATURA
Com o objetivo de caracterizar a preservao digital da informao tcnico-cientfica, sob a perspectiva da cincia da informao, procurou-se mapear os fundamentos tericos e metodolgicos das principais iniciativas empreendidas. A comunidade da cincia da informao vem realizando esforos para introduzir e definir as prticas e princpios arquivsticos que sustentem prticas consolidadas de preservao e acesso de longo prazo 3 a documentos em acervos digitais. A reviso da literatura apresenta uma anlise descritiva das principais concluses formuladas desde a segunda metade da dcada de 1990 sobre o tema preservao digital e o acesso informao cientfica em documentos digitais de longo prazo. So reflexes desenvolvidas por pesquisadores da cincia da informao e de outras reas, que levam em considerao algumas concepes que permitiro compreender a preservao digital dentro do ciclo de vida da informao, influenciadas por determinadas prticas sociais contextualizadas nas duas ltimas dcadas. O desenvolvimento dos trabalhos que foram publicados desde 1996 tem como caracterstica principal o fato de se ter como contexto a disponibilizao on- line dos acervos de diferentes tipos de instituies de ensino e pesquisa. A internet permitiu que as prticas de arquivamento eletrnico se expandissem de tal forma, que os bancos de dados e colees digitais ficassem acessveis a um nmero maior de pessoas e mtodos de arquivamento. A preservao digital comeou a ser chamada como tal a partir desse ano. A produo bibliogrfica consultada se derivou principalmente de projetos e iniciativas internacionais. Chegou-se assim a um conjunto de fontes de informao composto pelos seguintes itens: a) pginas web de projetos e iniciativas de instituies internacionais; b) catlogos de bibliotecas e repositrios digitais; c) bases de dados on-line de peridicos das cincias da informao e computao;
3 Considera-se preservao digital de longo prazo o armazenamento, a manuteno e o acesso dos recursos digitais, usualmente conseqncia da aplicao de uma ou mais estratgias de preservao digital, incluindo a migrao de dados ou a emulao tecnolgica (RUSSELL; SERGEANT, 1999).
31 d) referncias bibliogrficas de trabalhos em eventos que tratavam de assuntos relacionados com a preservao digital. Foram contemplados documentos oficiais tornados pblicos em forma de manuais e relatrios, assim como livros, captulos de livros, artigos avaliados pelos pares e trabalhos apresentados em eventos. Foi constatado que a produo cientfica sobre o tema no Brasil reduzida 4 . Especificamente neste captulo, as fontes citadas so algumas das analisadas no levantamento bibliomtrico da produo cientfica sobre o tema a ser descrito no captulo 4. Neste captulo sero mencionadas as principais definies usadas para se referir s atividades que envolvem os documentos, aps a digitalizao do objeto fsico ou com objetos nascidos j em formato digital; as estratgias adotadas para atender s necessidades dos responsveis pelos acervos digitais, aquelas que garantem o acesso constante e a preservao de materiais digitais; passando em seguida, a mencionar a variedade de sistemas e solues tecnolgicas que tm sido testados e que esto sendo considerados pela comunidade cientfica como padres de preservao digital. Por ltimo, sero citados os projetos e polticas que esto sendo implantados em instituies que trabalham com informao cientfica. Essa identificao das tendncias das atividades de preservao digital contribuir na estruturao do conjunto de critrios necessrios para a construo de sistemas de preservao digital aplicveis realidade brasileira.
2.1 CINCIA E PRESERVAO DIGITAL
O conhecimento cientfico pode ser obtido por meio de vrios mtodos. O objetivo de todos eles construir teorias que permitam a explicao, predio e controle dos eventos de seu domnio. o cruzamento entre conceitos tericos que pretendem explicar fatos conhecidos e, ocasionalmente, a descoberta de fatos novos e suas regularidades.
4 A anlise de alguns trabalhos que condensavam as idias gerais sobre o assunto deu como resultado a publicao de artigos do autor em algumas revistas da rea (MRDERO ARELLANO, 2004; MRDERO ARELLANO; ANDRADE, 2006), trabalhos em eventos (MRDERO ARELLANO; BOERES, 2005; MRDERO ARELLANO, 2007) e em trabalhos para disciplinas do programa de ps- graduao da UnB, entre 2004 e 2006.
32 O progresso tcnico-cientfico de uma sociedade pode ser experimentado nas atividades dirias e nas necessidades humanas s quais ele serve. A prtica cientfica unida ao avano tecnolgico confere s sociedades graus de controle sobre o ambiente. Assim como a tecnologia, a cincia se desenvolveu para atender s necessidades humanas (GRAY, 2005). A tecnologia tem estado presente na vida humana de vrias maneiras: ela transforma e materializa percepes do mundo e desejos individuais. No contexto atual, a tecnologia chega a nveis de ingovernabilidade, e novos conhecimentos so requeridos para solucionar os problemas decorrentes do seu uso. O antroplogo Darcy Ribeiro em sua obra O processo civilizatrio, menciona o conceito de revoluo tecnolgica para indicar que [...] certas transformaes prodigiosas no equipamento da ao humana sobre a natureza correspondem a alteraes qualitativas em todo o modo de ser das sociedades [...] (RIBEIRO, 1975, p. 34). As revolues tecnolgicas modelam um novo espao-tempo, estruturando inovadores conceitos culturais e sociais. Nesse avano vertiginoso da tecnologia, propiciado pelo crescente conhecimento cientfico, as sociedades contemporneas esperam contar com o domnio de recursos digitais para garantir o acesso de longo prazo a grandes estoques informacionais. A nossa dependncia da tecnologia moderna nos conduz ao risco da perda dos registros materiais da investigao racional. Tambm, esse avano tecnolgico e a produo do conhecimento cientfico na fase da industrializao da pesquisa, que se inicia na primeira metade do sculo XX, colocaram em evidncia as instituies encarregadas pela preservao e disseminao da informao cientfica e tecnolgica (IC&T) 5 . Com o advento da internet e o desenvolvimento de tecnologias para o acesso informao cientfica, comearam a ser testadas solues mais orientadas para o gerenciamento e armazenamento da informao em formato digital. Uma das questes que tm surgido em torno das novas tecnologias de informao e comunicao a preservao digital de longo prazo, tema que tem sido tratado sob
5 IC&T, Informao Cientfica e Tecnolgica: a informao que os cientistas e as organizaes de pesquisa e desenvolvimento (P&D) precisam para desenvolver suas atividades, sendo importante no estabelecimento de elos entre a gerao de conhecimentos, seu uso e absoro nas diferentes esferas da economia e da sociedade. Configura ainda as demandas pelas interfaces da produo cientfico-tecnolgica com o Estado e suas instncias decisrias, no planejamento e gesto de C&T, destinadas a ampliar a participao da cidadania e suas expresses organizadas nos processos de elaborao de polticas pblicas (IBICT, 2001).
33 diferentes enfoques. Os estudos sobre essa temtica tm avaliado os obstculos e benefcios conseguidos na manuteno de servios e controle de recursos de informao digitais. Para Chilvers (2000), a confiana que a sociedade acadmica tem depositado em certos recursos digitais reconhecidos e qualificados pelos pares leva a certa urgncia na busca por estratgias para desenvolver, gerenciar e preservar contedos digitais. Ignorar isso, segundo a autora, pode levar perda de dados nicos e criar grande dispndio financeiro, de tempo e recursos humanos para recriar tais dados, sem falar dos que j nasceram digitais, que podem tambm ser perdidos. A principal meta de quem deseja fazer com que os documentos da cincia consigam permanecer no tempo colocar os contedos em lugares com algum tipo de garantia de acesso de longo prazo. Essa premissa mais urgente no caso das verses eletrnicas da chamada cincia eletrnica (e-science). A cincia eletrnica tem como meta aproveitar a rapidez das redes computacionais permitindo o uso de laboratrios virtuais, novos mtodos de trabalho colaborativo em rede para permitir o avano da cincia. As atividades relacionadas com a cincia eletrnica requerem um gerenciamento digital de entrada e sada de dados via simulao de testes e grande volume de informaes sendo distribudas e usadas massivamente. Disponibilizar resultados de pesquisas cientficas na web tem levado criao de iniciativas de arquivamento financiadas por governos no Japo, Canad, Estados Unidos e Inglaterra (NATIONAL SCIENCE FOUNDATION, 2005). Especialistas em preservao digital esperam que, com a adeso a esse tipo de iniciativa, possa construir-se a base de um sistema distribudo de arquivamento e preservao de dados, chegando criao de servios de curadoria digital (POTHEN, 2001). O processo de conexo entre a e-science e a necessidade de preservao dos dados digitais estariam baseados nos repositrios institucionais, que proveriam o suporte para as atividades de preservao e curadoria (MESSERSCHMITT, 2003).
34 A criao de repositrios institucionais dentro dos princpios do Movimento do Acesso Livre 6 serve para facilitar o autodepsito das verses dos trabalhos (avaliados ou no) dos autores, permitindo um acesso rpido para aqueles que no possuem condies de pagar uma assinatura. O objetivo principal dos peridicos e repositrios de acesso livre aumentar o impacto e permitir o acesso imediato aos resultados de pesquisa. A indicao do Movimento do Acesso Livre no induzir os autores e instituies a construir repositrios com a finalidade de preservao de longo prazo dos originais, mas apenas para garantir o acesso atual e no breve futuro aos contedos das pesquisas. Aos editores e responsveis pelas bibliotecas assinantes ou depositrias, corresponderia a construo de revistas de acesso livre, com polticas claras de autodepsito para os autores, bem como dedicar-se preservao dos originais e construo de repositrios digitais confiveis. O Movimento do Acesso Livre informao cientfica prope que a preservao dos originais no est sob a responsabilidade dos autores nem das instituies de ensino e pesquisa. A nica opo que esses autores tm a de permitir que as verses dos seus originais sejam autodepositados nos seus repositrios institucionais, quer dizer, a sua preocupao de preservao o acesso de longo prazo, mas no a preservao dos documentos originais. Para os idealizadores do Movimento do Acesso Livre, os cientistas e as instituies a que eles pertencem precisam promulgar mandatos de autodepsito, para permitir o acesso imediato s verses e cpias dos originais aprovados e publicados em peridicos cientficos. Esse trabalho de autodepsito seria o resultado da conscincia da importncia do acesso livre informao cientfica imediata e sem fronteiras financeiras. Para Harnad (2003), o problema da preservao dos documentos da cincia tanto em papel como em outros formatos est nas mos dos editores e dos responsveis pelas bibliotecas depositrias, quem tm a guarda das verses originais. Os originais em PDF ou Extensible Markup Language (XML) so de propriedade das editoras e das bibliotecas que assinam as revistas ou que foram designadas como depositrias das publicaes cientficas. Similarmente, o problema
6 Movimento do Acesso Livre: surgiu no final da dcada com o propsito de derrubar barreiras de ordem econmica, devido ao elevado custo das assinaturas dos peridicos cientficos. Mais informaes podem ser obtidas por meio do blog http://kuramoto.wordpress.com
35 da preservao digital no inclui verses que os autores e leitores guardem em suas instituies e sites na Internet. Elas no tm o mesmo status das verses publicadas pelas revistas cientficas. No caso das bibliotecas, se elas assinaram uma dessas revistas, podem ser consideradas bibliotecas assinantes ou depositrias. A partir desse principio, o Movimento do Acesso Livre deixa clara a orientao de que a preservao digital deve estar dirigida aos originais dos autores publicados nas revistas cientficas. A preservao digital dos originais no um dever dos autores e das instituies, mas uma ao dos editores de peridicos cientficos. Temos assim a separao entre os propsitos do Movimento do Acesso Livre e os da preservao de longo prazo dos artigos publicados em peridicos cientficos. O Movimento do Acesso Livre preocupa-se com os materiais suplementares dos documentos publicados, auxiliando os pesquisadores a usar e citar as verses oficiais que so propriedade das editoras. Para os fundadores desse movimento seria um desservio induzir o autodepsito pelo argumento da preservao 7 . Em 2006, estatsticas mostraram que 85% dos pesquisadores ainda no depositavam nenhuma verso de seus trabalhos em repositrios institucionais. Isso poderia ser uma evidncia de que os autores no esto preocupados com o acesso de longo prazo aos seus resultados. Para muitos deles, as editoras e as bibliotecas continuam quase que implicitamente responsveis pela guarda desses documentos. Segundo Harnad (2006), esses pesquisadores no esto preocupados nem com o acesso de longo prazo nem com a preservao dos originais. Nos ltimos 10 anos, tem sido grande o desenvolvimento de softwares para a construo de repositrios digitais na preservao digital dos demais tipos de documentos produzidos por cientistas. Algumas dessas solues integram funcionalidades especficas para a preservao digital. Desde 2001 tm sido propostos atributos necessrios para que esses repositrios possam ser considerados confiveis na preservao da produo institucional (RESEARCH LIBRARIES GROUP, 2001; RLG/OCLC, 2002). Quem tradicionalmente tem assumido a responsabilidade de preservar dados cientficos em documentos textuais so os editores de peridicos,
7 Self-Archiving FAQ on Preservation: http://www.eprints.org/openaccess/self-faq/#1.Preservation
36 bibliotecrios e administradores de documentos cientficos, que possuem forte compromisso institucional e conhecimento tcnico, nas tomadas de decises gerenciais que envolvam a preservao da produo cientfica. Nas ltimas dcadas esses documentos no esto apenas em papel, encontram-se em forma de correspondncia eletrnica, arquivos elaborados em processadores de texto e arquivos multimdia. O material digital, seja aquele que foi criado em um computador ou digitalizado, est presente na maioria dos servios de informao (WEBB, 2000). A informao cientfica em documentos digitais pode ser perdida quando ela no recebe a ateno adequada, enquanto os hardware, software, as mdias e suportes continuam a se desenvolver. No caso da preservao dos documentos digitais autnticos, necessrio que seja mantido tambm o registro do conjunto de processos que garantem o seu acesso contnuo, confiabilidade e integridade.
2.1.1 Tecnologia e evoluo dos documentos
A cincia no ocorreria sem a documentao da sua prtica. No existiria nenhum acesso a essa informao sem a mediao documental. Obter informao significa ter acesso a uma entidade material ou suporte de armazenamento. Uma conquista inestimvel da humanidade foi a descoberta do papel, que considerado, at hoje, um dos suportes mais nobres do conhecimento humano. Depois da inveno do papel, o registro das descobertas sobre a realidade aumentou e permitiu um uso para fins que no eram os que motivaram sua criao. Os novos suportes possibilitaram a transferncia dos contedos informacionais para outras mdias totalmente diferentes da original. A dissoluo da relao entre a informao e o suporte cada vez mais acentuada. Essa separao facilita o desaparecimento da informao, que os suportes sejam reutilizados, proporcionando uma reproduo documental dos originais em inmeras cpias. Na prtica documental observa-se, tambm, uma ruptura cada vez maior entre a mensagem e o suporte original. Toda a parte de codificao da mensagem original exibe a capacidade de reordenamento a cada nova cpia.
37 A chegada das verses eletrnicas de textos publicados em peridicos cientficos alcanou a mesma faanha, dirigindo o desmembramento do documento em inmeras verses e formatos de apresentao. Os chamados e-prints foram definidos como sendo a duplicata digital de um trabalho de pesquisa cientfica, disponibilizados na internet (on-line) para aumentar o acesso ao documento. Os e- prints so cpias eletrnicas de trabalhos de pesquisa acadmica, teses ou dissertaes. Mas a caracterstica fundamental deles que mesmo sendo pr-prints ou ps-prints, eles foram avaliados pelos pares. Os e-prints esto disponibilizados, em sua maioria, no formato texto criado ou convertido por um software processador de textos fcil de usar; so documentos predominantemente armazenados em formatos PDF, HTML, MS Word, Postscript, Rich Text Format, ou Latex/Tex. As propriedades desses documentos esto determinadas pelas possibilidades que o formato digital permitir. No caso da informao tcnico-cientfica, as novas tecnologias de informao colocaram em evidncia o papel dos meios e tcnicas digitais de gerenciamento da informao digital. Os dados cientficos em formatos digitais so mutveis devido, principalmente, constante apario de novos softwares. Alguns dos desenvolvedores de software mudam sua arquitetura e perdem algum tipo de compatibilidade com verses anteriores. Seu efeito nas polticas de preservao, que exigem a manuteno de formatos digitais acessveis de longo prazo, influenciar as aes futuras de seus responsveis. Os problemas j comearam a ser enfrentados pelos responsveis por acervos digitais. So bibliotecrios e arquivistas que esto aplicando padres e normas, estratgias de migrao e converso. So os profissionais da informao que analisam a preservao a partir da necessidade de assegurar seu acesso e recuperao, como fundamento para a pesquisa acadmica. Dentro das prticas arquivstica e bibliotecria, a preservao digital um fenmeno do maior interesse. Na perspectiva da biblioteconomia, a preservao da informao uma atividade contnua, permitindo que o seu acesso seja permanente de longo prazo. J na perspectiva arquivstica, a informao retida segundo critrios de permanncia motivados pelas necessidades do uso para o qual ela foi criada. A diferena de abordagem tambm inclui uma discusso sobre a importncia de arquivar apenas parte da informao, mesmo que ela no tenha um valor de uso comprovado.
38 Apesar das diferenas metodolgicas de tratamento documental entre as subreas da cincia da Informao (arquivologia e biblioteconomia), muitos conceitos so convergentes, seja pelo fato de a informao ser o objeto tratado, ou pela mudana do ambiente (do fsico para o digital) e suporte informacional em questo. Trata-se de duas perspectivas profissionais diferentes, que determinam a forma como os especialistas so treinados para enfrentar problemas. Bibliotecrios pensam em termos de colees como uma reunio de objetos: um conjunto de livros que esto se deteriorando. A meta manter os livros ou o contedo dos livros disponveis no futuro. Os arquivistas procuram mais por atividades que agregam e processos que documentam a tomada de deciso de uma instituio. Suas preocupaes so menos lidar com o objeto individual e mais com a captura da agregao da documentao e contexto ao redor dos processos, no de documentos isolados, mas sim de um grupo de evidncias que provem insight das decises e aes. Particularmente no mundo digital, partes do contexto do arquivamento de longo prazo ficam escondidas nos sistemas burocrticos internos e na indefinio de polticas da infra-estrutura tcnica das instituies.
2.1.2 Arquivologia e preservao digital
Em 1997, Levacov estimava que apenas cerca de 1% da informao arquivada no mundo encontrava-se em formato digital. Com a digitalizao e a crescente produo de materiais eletrnicos, as instituies esto enfrentando as exigncias de manter a informao digital facilmente atualizada e sempre disponvel (ARMS, 2000). Verifica-se em todo o mundo crescente interesse por parte dos responsveis por sistemas de informao pelo problema da preservao dos arquivos eletrnicos. Segundo Santa'Anna (2001) os documentos digitais devem ser preservados pelo organismo que os criou ou por alguma instituio arquivstica responsvel pela sua guarda permanente. Para Hedstrom (1996), o planejamento
39 das organizaes deve alocar recursos e aplicar mtodos e tecnologias para garantir a preservao de seus arquivos. A perspectiva arquivstica da preservao digital parte da compreenso dos limites e significados dos documentos (autenticidade, capacidade probatria, integridade das informaes, contexto de produo e manuteno), dando nfase s tarefas que as organizaes e instituies arquivsticas que criam e so responsveis pela guarda permanente desses documentos devem observar para lidar com objetos digitais autnticos. Os arquivos administrativos requerem o desenvolvimento de parmetros de certificao da qualidade dos seus processos e servios. O chamado arquivamento relacionado com o gerenciamento do armazenamento de registros passou a estar unido ao termo mais comum arquivo, que atualmente se encontra mais identificado com o formato eletrnico de documentos (e-print, pre-print e pos- print). Para SantAnna (2001), responsabilidade dos arquivos adotar medidas preventivas e corretivas objetivando minimizar a ao do tempo sobre o suporte fsico da informao, assegurando sua disponibilidade. As primeiras consideraes sobre a preservao digital partiram da arquivologia. Fatores como tempo e custo de armazenamento de longo prazo foram adicionados a decises sobre o volume e formato do material a ser preservado. Tambm foram os arquivistas que propuseram algumas das caractersticas das ferramentas necessrias para a proteo, cuidado e manuteno de colees digitais. Com base no princpio arquivstico da custdia responsvel, essa comunidade foi a primeira a apoiar o desenvolvimento dos repositrios digitais como sendo aqueles que reproduzem os espaos fsicos dos arquivos tradicionais (LAZORCHAK, 2005). A informao arquivstica tem sido produzida, distribuda e acessada por meio da infra-estrutura de novas tecnologias de informao e comunicao, h algum tempo. A materializao (impresso) dessas informaes, quando textuais, d-se, na maioria das vezes, para que o documento se torne legalmente vlido ou para que sua leitura ocorra de forma facilitada para aqueles que se incomodam com longos perodos frente do monitor. A validade legal de documentos eletrnicos depende de sistemas que garantam a autenticidade e integridade das informaes neles contidos. Uma vez assegurada, os legisladores devero comear a regularizar esse aspecto. A leitura
40 ser mais confortvel, medida que a tecnologia se desenvolve, considerando que prottipos de papis inteligentes vez por outra so anunciados. Alguns aspectos diferenciam a preservao digital de documentos bibliogrficos dos documentos arquivsticos. Os arquivos no podem ser montados. So criados naturalmente pela prpria dinmica de atividades do seu produtor. As relaes existentes entre os documentos so, portanto, essenciais para a recuperao e entendimento das informaes que foram registradas e armazenadas. Em arquivos, a necessidade de preservar indefinidamente determinado tipo de documento est fortemente vinculada ao potencial de esse material ser utilizado posteriormente para uma pesquisa histrica e ou cultural. A arquivologia retomou o princpio de que nem tudo precisa ser preservado indefinidamente. Para Dollar (1994), o conceito de documento permanente relativo, quando os custos de preservao da vida til dos documentos digitais se sobrepem aos benefcios da sua reteno definitiva. Na arquivologia, quando se planeja o gerenciamento de um registro, importante considerar o contexto no qual ele foi criado: A perspectiva arquivstica traz um sistema de gerenciamento de conhecimentos registrados que se baseia em evidncia. O sistema fundamentalmente vinculado aos processos e contextos organizacionais e pessoais pelos quais registros e conhecimentos so criados, assim como as maneiras em que os registros refletem estes processos individualmente e coletivamente. (GILLILAND-SWETLAND, 2000, p. 5).
O que preservado deve ser uma amostra representativa do que foi produzido, de modo a ser possvel inferir de forma confivel o todo em relao parte. Em contrapartida, preservar documentos que ainda possuam valor corrente, isto , administrativo e ou jurdico, tambm uma necessidade de longo prazo baseada numa tabela de temporalidade. Alguns documentos que devem ser preservados por causa deste valor revelam-se destinados a estar disponveis por dcadas. Desde a dcada de 1990, alguns projetos de gerenciamento de documentos eletrnicos tm surgido na comunidade arquivstica internacional. Segundo Rondinelli (2002), essas iniciativas tm produzido conhecimento para o bom gerenciamento arquivstico no contexto das novas tecnologias da informao. Segundo esse autor, contribuies de projetos como os das Universidades de
41 Pittsburgh e da British Columbia tm proposto um conjunto de requisitos funcionais para o gerenciamento de documentos arquivsticos contemporneos, sem deixar de lado processos arquivsticos tradicionais, como a observncia da fidedignidade e da autenticidade. Na arquivologia, a gesto dos documentos eletrnicos constitui uma rea de pesquisa que tem produzido contribuies relevantes relacionadas com a preservao de documentos digitais de valor permanente para instituies pblicas. Alguns exemplos so a criao do padro 5015.2 do Departamento de Defesa dos Estados Unidos e o Australian Standard 4390-1996 do Arquivo Nacional da Austrlia, que evoluiria para o padro ISO 15489. A informao arquivstica, quando possui valor histrico, deve ser preservada por tempo indeterminado; idealmente deve receber uma ordenao baseada na estrutura organizacional que a produziu, criando fundos, que muito podem revelar sobre o funcionamento interno da instituio produtora (BELLOTTO, 2004). Essa organizao difere daquela aplicada aos documentos bibliogrficos. Por isso, h a necessidade de observncia da natureza da informao digitalizada para que no se cometam equvocos metodolgicos.
2.1.3 Cincia da informao e preservao digital
O desenvolvimento de atividades de preservao digital requer um conhecimento refinado das atividades gerenciais das bibliotecas, j que elas envolvem diversos processos, tais como: a) aquisio de objetos digitais, publicados ou no, em vrios formatos; b) armazenamento de muitos objetos digitais comprimidos em gigabytes ou terabytes de dados; c) processamento de grande volume de material, por exemplo, migrao de objetos mltiplos para evitar a obsolescncia dos formatos; d) disseminao de objetos digitais para usurios de forma fcil, segura e significativa. Nos ltimos anos esto sendo testados esquemas conceituais que permitem identificar as partes integrantes do processo de preservao digital, assim como sua
42 padronizao em modelos de referncia para iniciativas de repositrios e de bibliotecas digitais. A preservao digital assume diferentes significados, conforme o contexto. Para os profissionais da cincia da informao, por exemplo, ela se refere infra- estrutura e ao comprometimento institucional necessrio para proteger a informao representada digitalmente enquanto para os especialistas da cincia da computao ela seria uma maneira de atenuar a obsolescncia tecnolgica e aumentar a memria humana. A compreenso sobre os desafios associados a esse tipo de preservao parece comear a ser mais bem focalizada, mudando da estratgia tecnolgica para o tema do gerenciamento digital (LAVOIE; DEMPSEY, 2004). Novas questes surgem dessa atual viso, a qual no considera a preservao digital apenas como um processo isolado, mas tambm como componente de um conjunto agregado de servios, polticas e especialistas que constituem o contexto do ciclo de vida da informao digital. Na rea da cincia da informao, o uso da tecnologia digital que toma o lugar dos tradicionais meios de preservao, como a microfilmagem, trouxe consigo a preocupao com as normas para o uso das tcnicas digitais e sua prontido na tarefa da preservao de longo prazo (CHEPESUIK, 1997). A pesquisa sobre sistemas de preservao digital mais um campo de estudo da cincia da informao. Nele esto refletidas, mais uma vez, as ligaes interdisciplinares dessa cincia. Por se tratar de experincias iniciais, esses sistemas demandam abordagens e solues multidisciplinares. A cincia da informao como prottipo de uma nova cincia est sendo construda por abordagens estratgicas voltadas para a soluo ou trato de problemas (PINHEIRO; LOUREIRO, 1995). Ela trata da informao que transportada, conservada no tempo e afetada pelo imperativo tecnolgico (SARACEVIC, 1992). A informao que representada, transmitida e recuperada por meio de mecanismos de comunicao seletiva objeto da pesquisa aplicada na cincia da informao, assim como o , tambm, o tratamento dos problemas decorrentes do uso das novas tecnologias de informao e comunicao, nos contextos individual ou institucional. Foi Belkin (1978) quem afirmou que o objeto de investigao da cincia da informao exclusivamente a informao cientfica formalmente documentada.
43 Com o impacto da tecnologia no processamento da informao tcnico-cientfica, foram levantadas novas questes relacionadas com o gerenciamento, a perenidade dos registros do conhecimento cientfico e sua acessibilidade.
2.2 PRESERVAO DIGITAL
2.2.1 Preservao da informao em objetos digitais
A preservao um dos grandes desafios do sculo XXI. Durante os ltimos anos do sculo XX, as bibliotecas, os arquivos e os centros e institutos de pesquisa e organismos governamentais criavam contedo digital relevante. Segundo Cunha (1999, p. 266), duas das funes bsicas das bibliotecas esto sofrendo [...] perigo de extino: a proviso de acesso informao e a preservao do conhecimento para futuras geraes [...]. Muitas colees digitais importantes esto sendo construdas fora das bibliotecas e dos arquivos por diferentes organizaes, ou sendo publicadas diretamente na Internet. Com o aumento da produo de informao em formato digital, tem sido questionada cada vez mais a importncia de garantir a sua disponibilizao e preservao por grandes perodos de tempo. Os objetos digitais no podem ser deixados em formatos obsoletos para serem transferidos, depois de longos perodos de esquecimento, para repositrios digitais, pois existe o risco de a tecnologia no conseguir recuperar as informaes. Esta preocupao envolve tanto os produtores dos dados quanto os rgos detentores dessa informao. Para Hedstrom (1996, p. 189), a preservao digital se refere ao [...] planejamento, alocao de recursos e aplicao de mtodos e tecnologias para assegurar que a informao digital de valor contnuo permanea acessvel e utilizvel [...]. A preservao digital compreende os mecanismos que permitem o armazenamento em repositrios de dados digitais que garantem a perenidade dos seus contedos. Para atingir esse fim, os objetos digitais devem ser compreendidos e gerenciados em vrios nveis: como um objeto fsico, como uma codificao lgica, como objetos conceituais ou possuidores de significado para os humanos e como
44 um conjunto de elementos essenciais que devem ser preservados para oferecer aos futuros usurios a essncia do objeto (UNESCO, 2003). A condio bsica preservao digital seria, ento, a adoo desses mtodos e tecnologias que integrariam a preservao fsica, lgica e intelectual dos objetos digitais. A preservao fsica est centrada nos contedos armazenados em mdia magntica (fitas cassete de udio e de rolo, fitas VHS e DAT) e discos ticos (CD-ROM, WORM e discos ticos regravveis). A preservao lgica procura, na tecnologia, formatos atualizados para insero dos dados (correio eletrnico, material de udio e audiovisual e material em rede), novos software e hardware que mantenham vigentes seus bits, para conservar sua capacidade de leitura. A preservao digital a parte mais longa e tambm a ltima do ciclo de gerenciamento de objetos digitais. Ela permite o emprego de mecanismos que viabilizam o armazenamento em repositrios de objetos digitais e que garantem a autenticidade e perenidade dos seus contedos. So necessrios, no apenas, procedimentos de manuteno e recuperao de dados, no caso de perdas acidentais para resguardar a mdia e seu contedo, mas tambm estratgias e procedimentos para manter sua acessibilidade e autenticidade atravs do tempo, podendo requerer colaborao entre diferentes financiadoras e boa prtica de licenciamento, metadados e documentao, antes de aplicar aes tcnicas. Ao analisar o ciclo da informao (gerao, tratamento, preservao e conservao e, finalmente, difuso da informao), percebe-se que a preservao e conservao necessitam ser revistas no mbito da informao digital. At pouco tempo, entendia-se a preservao no sentido de conservar e prevenir os documentos do risco de deteriorao. importante analisar a preservao a partir da necessidade de assegurar o acesso e recuperao da informao cientfica como fundamento para a pesquisa acadmica. Aliado a isso, deve-se considerar o crescente uso dos computadores e a quantidade de informaes disponveis em meio eletrnico (algumas, inclusive, somente neste meio). A natureza dos documentos digitais est permitindo ampla produo e disseminao de informao no mundo atual. fato que, na era da informao digital, muita nfase dada gerao e/ou aquisio de material digital, em vez de manter a preservao e o acesso de longo prazo aos acervos eletrnicos existentes. Outro conceito associado ao da preservao digital, que surgiu da comunidade arquivstica, o de ciclo de vida do material digital. Nos primeiros
45 estudos do grupo de trabalho do National Preservation Office e do Joint Information Systems Committee (JISC/NPO) (BENNETT, 1997), encarregado de desenvolver um arcabouo para uma poltica estratgica de criao e preservao de objetos digitais, o ciclo de vida foi dividido em cinco partes: criao de dados; gerenciamento de colees e preservao; aquisio, reteno e descarte; gerenciamento de dados; dados de uso. Foi graas a esses trabalhos que ficou esclarecido que os envolvidos (stake-holders) tm variados interesses em estgios diferentes do ciclo, assim como a importncia que h em considerar o assunto preservao em todas as etapas, e no apenas no final do ciclo, exigindo a cooperao entre as grandes iniciativas. A partir da formulao dessa estrutura, comearam a ser desenvolvidos guias estratgicos para os responsveis por todos e cada um dos estgios do ciclo de vida dos objetos digitais. Neles, existem recomendaes sobre a valorizao de um estgio do ciclo em particular, assim como a relao entre eles, e como as decises podem afetar as tarefas dos outros responsveis. Em geral, as tarefas relacionadas com a preservao digital seriam os procedimentos de manuseio e armazenamento da mdia digital, a cpia da informao contida, a migrao para novas mdias e a preservao da integridade da informao digital. Como mostra o Quadro 1, a preservao fsica continua relevante na mdia eletrnica, ainda que o seu armazenamento haja demonstrado a necessidade de constante atividade de migrao para novos materiais que favoream sua disseminao e uso (disquete, fita VHS, CD-ROM, DVD).
Requisitos Documentos Impressos Documentos Digitais Preservao fsica Relevante Relevante Preservao lgica Pouco relevante Relevante Preservao intelectual No relevante Relevante Quadro 1 Relevncia dos requisitos de preservao
Na preservao intelectual, o foco so os mecanismos que garantem a integridade e a autenticidade da informao nos documentos eletrnicos. Uma
46 soluo tem sido a autenticao digital (digital time-stamping 8 , DTS). Essa tcnica permite que os documentos sejam criptografados no momento em que so depositados (GRAHAM, 1998). No caso dos materiais impressos, a preservao lgica pouco relevante, por estar garantida no formato especfico em que foram publicados (peridico, livro, entre outros formatos). Na publicao digital, a preservao lgica est associada necessidade de garantir a converso dos formatos originais que se tornaram obsoletos ou de custosa manuteno. O Quadro 1 mostra, tambm, que a importncia da preservao intelectual maior no caso dos materiais digitais devido, principalmente, capacidade de o objeto digital ser passvel de modificao no seu leiaute, apresentao ou interao no formato de publicao. Com isso, a perda do contedo intelectual original pode ser declarada inaceitvel pelo autor. Esse requisito envolve a preservao da propriedade intelectual (Intellectual Propriety Rights 9 , IPR), que tem um significado mais argvel do que na mdia tradicional. O IPR deve considerar no apenas o contedo, mas tambm qualquer ao relacionada ao software (cpias, encapsulamento de contedo, emulao de software, migrao de contedo) que envolva atividades que podem infringir permisses especficas daqueles que mantm os direitos. Para Bullock (1999), o IPR uma das principais barreiras que interferem na preservao dos objetos digitais. Ela enumera os aspectos tcnicos da preservao dos documentos digitais da seguinte forma: limites do objeto digital; presena fsica; contedo bsico (ex.: arquivo ASCII); apresentao; funcionalidades; autenticidade; localizao e rastreamento do objeto digital no tempo; provenincia; contexto. Esses requisitos especificam os elementos que devero ser efetivamente mantidos de um documento digital, a cadeia de bits que dever ser recuperada.
8 Selo de tempo digital. Traduo nossa. 9 Direitos de Propriedade Intelectual.
47 Referem-se capacidade de acesso aos contedos dinmicos independentemente da sua apresentao, componentes de multimdia, hipertextualidade e interatividade. Observar essas condies significa identificar o objeto digital na sua origem e pelas suas dependncias de hardware e software. Um documento digital pode estar representado em um ou vrios objetos digitais, em diversos formatos lgicos, e pode ser suportado por grande variedade de representaes fsicas. A sua dependncia de software tem origem em sua natureza binria, armazenada em forma codificada, apenas legvel por programas. Sem esses programas, os objetos digitais no podem ser acessados, lidos ou impressos. Salvar os bits de um objeto digital necessrio, mas no suficiente para preserv-lo. necessrio tambm conhecer os atributos da aplicao na qual ele foi criado e com o qual ele pode ser interpretado. O esforo da preservao engloba tambm o software e o hardware no qual o objeto digital pode ser executado, j que eles tambm podem ficar obsoletos. A problemtica dos objetos digitais aumenta a partir do momento no qual eles so inerentemente digitais, quando no podem ser representados em forma de imagem ou pginas de texto; tentar representar documentos audiovisuais dessa forma significa perder aspectos essenciais dos seus contedos e comportamento, como no caso de artefatos interativos e dinmicos (multimdia, dados meteorolgicos em imagens ou gerados automaticamente em JavaScript, cgi, pginas ASP, entre outros). Sem deixar de mencionar simulaes de experimentos, bases de dados e realidade virtual interativa. As solues propostas para a preservao desse tipo de objeto digital vo desde a arqueologia digital, at solues mais completas, como a formalizao (substituio dos artefatos pelas descries formais deles), a migrao (converter os artefatos em novos formatos repetidamente) e a emulao (rodar os softwares originais em hardware recriados virtualmente); passando pela reproduo dos objetos em forma de imagens e salvando os componentes principais dos artefatos. Em geral, um objeto digital um componente digital necessrio para reproduzir um documento eletrnico. Ele no apenas um arquivo, dentro de uma biblioteca digital, mas est composto de vrias partes: metadados (descritivos, administrativos, estruturais, de preservao); arquivos de preservao;
48 arquivos de disseminao. Para mant-los organizados e conectados, necessria uma prtica correta de organizao de diretrios e projetos de documentao. O lugar ao qual pertencem o repositrio de documentos digitais. preciso chamar a ateno para a importncia de informar o contexto do objeto digital a ser registrado (e preservado) para que, assim, futuros usurios possam entender o ambiente tecnolgico no qual ele foi criado 10 . A preservao dos documentos continua a ser determinada pela capacidade de o objeto informacional servir s utilizaes que lhe so imputadas, s suas atribuies que garantem que ele continue a ser satisfatrio s utilizaes posteriores. Porm no caso especfico dos documentos em formato digital, a preservao depender principalmente da soluo tecnolgica adotada e dos custos que ela envolve. Tanto a arquivologia quanto a cincia da informao prevem a descrio de documentos digitais como uma maneira de possibilitar o armazenamento e a recuperao da informao. A descrio arquivstica e a descrio bibliogrfica compreendem o contexto e o contedo dos documentos digitais (os padres de metadados resultantes comeam a homogeneizar-se, e espera-se a criao de redes interoperveis de arquivos e bibliotecas digitais). Na preservao de documentos digitais, assim como em papel, necessria a adoo de ferramentas que protejam e garantam a sua manuteno. Essas ferramentas devero servir para restaurar registros protegidos, prevendo os danos e reduzindo os riscos dos efeitos naturais (preservao prospectiva), ou para restaurar os documentos j danificados (preservao retrospectiva). O suporte fsico da informao, o papel e a superfcie metlica magnetizada se desintegram ou podem se tornar irrecuperveis. Existem, ademais, os efeitos da temperatura, umidade, nvel de poluio do ar e das ameaas biolgicas; os danos provocados pelo seu uso indevido e o uso regular; as catstrofes naturais e a obsolescncia tecnolgica. A aplicao de estratgias de preservao para documentos digitais uma prioridade, pois sem elas no existiria nenhuma garantia de acesso, confiabilidade e integridade dos documentos de longo prazo.
10 Um documento eletrnico um registro que foi criado (elaborado ou recebido) de forma eletrnica. Um documento digital aquele que existe em formato eletrnico, mas que pode ou no ter sido criado em formato eletrnico - pode ter sido criado em papel e digitalizado. (CONSELHO NACIONAL DE ARQUIVOS, 2004).
49 Quando a primeira verso eletrnica de um documento criada, inicia-se uma longa lista de ameaas inerentes aos documentos digitais. Segundo Greenstein e George (1998), para proteger a informao digital da destruio causada pelo tempo, a obsolescncia tecnolgica e a deteriorao da mdia magntica, precisa-se de mtodos apropriados para diferentes tipos de dados e estruturas. Uma das principais ameaas o problema da obsolescncia tecnolgica. Hardware e software so dispositivos para gerar e acessar informaes gravadas que requerem estratgias tcnicas diferenciadas para garantir seu funcionamento (FEENEY, 1999). Nesse contexto, os documentos multimdia so os mais comprometidos, pois no existem garantias de que a essncia da informao possa ser preservada, se no houver dispositivos que leiam as mdias magnticas usadas. A busca por estratgias de preservao digital requer no apenas procedimentos de manuteno e recuperao de dados, no caso de perdas acidentais, para resguardar a mdia e seu contedo, mas tambm estratgias e procedimentos para manter sua acessibilidade e autenticidade atravs do tempo, podendo requerer colaborao entre diferentes organizaes, boa prtica de licenciamento, aplicao de padres de metadados e documentao. Todas as tarefas aplicadas s colees digitais tm sido objeto de aes por parte da comunidade da rea da cincia da informao, que tem entre seus desafios viabilizar a recuperao e o processamento da informao no futuro (FUNARI, 2004). Especificamente a preservao digital est sendo observada como o resultado do uso de normas nos processos de arquivamento dos documentos digitais. O uso de repositrios digitais que adotam essas normas est sendo apontado como uma melhoria na qualidade da produo da informao digital a ser preservada pelas organizaes. Os especialistas da rea que trabalham com informao em formatos digitais esto elaborando normas necessrias para armazenar e compartilhar em repositrios digitais esses materiais, assim como buscam a formulao de polticas institucionais de preservao. Segundo Jones (2003), existem trs tipos de criadores de documentos digitais: 1) aqueles que no acreditam que os repositrios digitais tenham a habilidade de preservar seus materiais; 2) aqueles que desconhecem que esses repositrios existem; 3) aqueles que desejam que seus materiais digitais sejam preservados, mas para os quais tais recursos so inexistentes. Como Jones aponta,
50 existe relutncia por parte desses criadores de documentos digitais em lidar com a responsabilidade da preservao desses materiais, alm do desconhecimento das necessidades reais de preservao dos seus acervos digitais. Se os criadores de materiais digitais originais no compreendem as implicaes das suas aes em termos de viabilizao a mdio e longo prazo dos materiais criados, eles no sero capazes de proporcionar o suporte e o acompanhamento necessrios com as infra-estruturas tcnica e organizacional que possam dar assistncia e facilite um gerenciamento eficiente da preservao digital.
2.2.2 Necessidades de preservao digital
O estudo da preservao digital tem passado do reconhecimento da sua necessidade e da sua definio, para abordagens mais tcnicas e propostas de aes mais claras. O foco da preservao digital mudou da necessidade de uma ao imediata de resgate dos materiais ameaados, para a conscientizao de que perpetuar os materiais digitais ao longo do tempo envolve a observncia de um conjunto de prticas gerenciais que integrem os sistemas de preservao digital. No incio, as prticas relacionadas com a preservao digital estavam baseadas na idia de garantir a longevidade dos arquivos, entretanto essa preocupao est agora centralizada na ausncia de conhecimento sobre as estratgias de preservao digital e o que isso poder significar na necessidade de garantir a longevidade dos arquivos digitais. O desafio muito mais um problema social e institucional do que tcnico, porque, principalmente para a preservao digital, depende-se de instituies que passam por mudanas de direo, misso, administrao e fontes de financiamento. Muitos materiais publicados digitalmente so resultados de servios de informao disponibilizados por organizaes que adotam alguma infra-estrutura tecnolgica. Essas instituies levam em considerao aspectos legais e culturais que atingem a oferta desses servios orientados a atender s necessidades de determinados usurios. Porm muitas vezes essa preocupao no a mesma que tm os produtores das novas tecnologias.
51 Em 1996, Waters e Garrett referiam-se queles que seriam os responsveis pela preservao digital como [...] a linha de frente na defesa contra a perda da informao digital valiosa [...] (p. 21). Para esses detentores de acervos digitais, cada vez mais imperiosa a necessidade de contar com mecanismos que garantam a preservao de seus documentos em formato digital. Especificamente, essa preocupao parte das comunidades responsveis pelas bibliotecas e pelos arquivos, para as quais o desenvolvimento de padres e de mecanismo legais para lidar com arquivos eletrnicos precisa de estratgias metodolgicas bem definidas. A necessidade de preservao digital, do modo como percebida por vrios autores, refora a importncia do planejamento na criao e gerenciamento de objetos digitais. A comunidade arquivstica tem ressaltado a necessidade da preservao da integridade da informao digital. Para Elkington (1997), em citao de Chilvers (2000, p. 27), a necessidade de preservao est presente na motivao das aes empreendidas para garantir a integridade do contedo digital, tais como: a) a percepo do uso corrente ou antecipado dos recursos que so criados; b) o interesse da pesquisa; c) as imposies legais; d) as imposies de negcios; e) a misso pblica; f) os propsitos para os quais os contedos so criados. Chilvers (2000) menciona a prioridade da preservao digital como a necessidade de seleo e avaliao dos custos baseados no ciclo de vida de um objeto digital. Boeres (2004), aps uma investigao junto s bibliotecas universitrias brasileiras, identificou a necessidade de preservao digital no momento da seleo das colees. Para ela, a questo de seleo de documentos digitais deve ser observada na tomada de deciso, na qual seriam reavaliados os critrios da seleo e detectada a necessidade de uma poltica de seleo. No caso das bibliotecas universitrias, a seleo do que ser preservado deve estar de acordo com a misso da unidade de informao e a necessidade de seu corpo acadmico. A necessidade de preservar tem um papel de destaque na garantia do acesso e recuperao de informao, a fim de fundamentar a pesquisa acadmica.
52 Neste mbito, Funari (2005, p. 8), ao mencionar a necessidade da gesto da preservao dos documentos eletrnicos gerados por uma instituio de ensino superior brasileira, enumera as aes a serem empreendidas como resposta a necessidades administrativas e de pesquisa acadmico-cientfica. Segundo ele: Para alm da manuteno da integridade fsica, necessrio prever uma srie de procedimentos, em constante reavaliao, de transposio de dados de equipamentos e programas informticos antigos para novos.
Verifica-se, nas instituies de ensino e pesquisa, um aumento na necessidade de modernizao dos servios de informao que elas prestam. A necessidade de digitalizar e ou copiar seus acervos um indcio de necessidade de preservao digital. Para Boeres (2004), a necessidade de preservao digital percebida tambm pelos gestores dos acervos, pois seu objeto de trabalho est em constante mudana e existe pouco investimento em cursos de atualizao. A natureza dos documentos digitais permite a reproduo do documento em inmeras verses, e a sua preservao precisa de novos conhecimentos e ferramentas. Com base nos estudos dos autores consultados, as necessidades de preservao podem ser agrupadas da forma como mostra a Figura 1.
53
Figura 1 Contexto das necessidades de preservao digital da informao cientfica
O ambiente onde a informao cientfica criada e disponibilizada est sendo afetado pela rapidez dos meios de comunicao e de redes, pelos ambientes de aprendizagem virtuais e pelo trabalho colaborativo. Cada vez mais sistemas de informao para armazenamento e recuperao de informao so requeridos para conseguir acompanhar esse avano na produo de conhecimento cientfico. Alguns aspectos do contexto em que ocorrem as necessidades de preservao digital incluem conceitos como novas tecnologias, comunicao cientfica, depsito legal e direitos autorais, entre outros. Para atingir todo o potencial dos sistemas de preservao digital e aumentar a probabilidade de adoo nas instituies, preciso uma efetiva identificao das necessidades de preservao. O desafio para os implementadores
54 desses sistemas a adoo de polticas, modelos de negcios, estratgias, suporte tecnolgico e guias para o desenvolvimento de repositrios digitais confiveis.
2.2.3 Estratgias para a preservao digital
No incio da era digital, a preocupao das organizaes com a preservao concentrava-se na estratgia de fazer cpias de segurana (backup). Atualmente, em vrios pases, h urgncia na definio das polticas, obrigaes e metodologias mais apropriadas para a administrao dos recursos digitais. Em nvel mundial, as iniciativas se multiplicam (Apndice C) e novas solues so testadas por instituies detentoras de acervos de especial relevncia para o desenvolvimento cientfico e tecnolgico de seus pases de origem. Muitos projetos e iniciativas tm conseguido estabelecer os benefcios de algumas metodologias ou estratgias. A concluso a que essas iniciativas chegam que devem ser usados padres e preciso converter os documentos nos formatos abertos, para que eles sejam acessados aps a obsolescncia dos equipamentos e programas de informtica em que foram criados. O uso de padres abertos permitiria seu estudo e sua converso para novos padres. Alguns dos tpicos relacionados com a preservao digital, citados por vrios autores, esto relacionados com a aplicao de mtodos e tecnologias para garantir a integridade e acessibilidade da informao (HODGE; FRANGAKIS, 2004; LEVACOV, 1997; THOMAZ; SOARES, 2004). A obsolescncia da tecnologia coloca em questionamento todas as estratgias de preservao existentes. A execuo de estratgias est condicionada aos conhecimentos do alcance das tecnologias e s limitaes oramentrias nas instituies. Por tais motivos, existe imperiosa necessidade de planejamento da preservao digital de baixo custo. Rothenberg (1995) afirma que a vida mdia de uma mdia ptica est em torno de 30 anos. Seu estudo tambm apresentou outro dado o qual mostra que o equipamento de leitura estar obsoleto em 10 anos. Estudo realizado por Stinson, Ameli e Zaino (1995) apontou que 95% das mdias Kodak Writable CD e Photo CD Media tm seu tempo de vida estimado em 217 anos, quando conservadas a uma temperatura de 25 C e 40% de umidade relativa. J no incio das mdias digitais
55 alguns especialistas mencionavam a fragilidade dos suportes eletrnicos (ver Figura 2).
Figura 2 Expectativa de vida de vrias mdias para armazenamento de informao Fonte: VanBogart (1995)
O acompanhamento das normas e padres de preservao cada vez mais difcil devido ao rpido avano das tecnologias, especificamente no que se refere aos problemas trazidos pelos formatos digitais (MARCUM; FRIEDLANDER, 2003). Para Woods (1998), h trs critrios que as novas mdias devem cumprir antes de serem escolhidas para a preservao digital: 1) a mdia deve proteger o documento original; 2) a mdia deve possuir mecanismos de verificao da integridade, de tal modo que o documento no possa ser alterado ou modificado, e 3) a mdia deve ser de acesso fcil. Por conseguinte, tambm seriam preservados a propriedade intelectual e o hardware e software usados para acessar o documento.
56 Autores como Thomas (2003) propem que a preservao deveria ser apenas do contedo intelectual, e que separadamente seria desenvolvido o software para ler e acessar os dados, no sendo aplicvel aos recursos em mdia interativa. Dois aspectos importantes relacionados com a mdia digital so a expectativa de vida e a estabilidade. Para Stephens e Wallace (2003), a expectativa de vida de uma mdia o espao mnimo de tempo que uma informao est prevista a ser recuperada; estabilidade da mdia a habilidade que tm vrias mdias de reter o contedo para uso em determinado perodo de tempo (Quadro 2).
Mdia Tipo Expectativa de vida (anos) Estabilidade Papel ANSI/NISO 200-300 Boa Microfilme 500 tima Microformas Microficha 100 Boa WORM (write once, read many) 25 Pobre CD-R 100 Boa Mdia ptica CD-ROM 25 Pobre Disquetes 5 Pobre Mdia Magntica Fitas 10-20 Pobre Quadro 2 - Expectativa de vida de algumas mdias para fins de preservao digital Fonte: verso traduzida e adaptada de Stephens e Wallace (2003)
Os dados mostram que a mudana para uma mdia nova significa alguma perda na durabilidade e longevidade dos recursos. No seu estudo sobre as mdias, Stephens e Wallace (2003) citam como exemplo as fitas magnticas usadas comumente como mdia para armazenamento de dados computacionais inativos, para pelo menos 10 a 20 anos, para mostrar como cada tipo de informao a ser preservada acrescenta algum elemento de avaliao da mdia escolhida. Esses autores tambm mencionam a durabilidade de uma mdia como outro dos aspectos da preservao digital que tm de ser levados em considerao, pois o software requerido para ler menos durvel do que a mdia na qual o registro foi gravado. Os estudos atuais sobre os problemas relacionados com os softwares vm mostrando que eles superam em nmero aqueles relacionados com o hardware. Para Dukart (2002), os formatos XML (eXtensible Markup Language) e o PDF
57 (Portable Document Format) so os mais promissrios, apesar das suas vantagens e desvantagens. A linguagem XML pode ser considerada como um tipo particular de migrao. Ela participa como uma linguagem de enriquecimento de informao sobre estruturas e significado, um padro aberto, independentemente da plataforma onde ir funcionar. Favorece a interoperabilidade e pode ser usada como formato de criao de documentos. Pode considerar-se como uma estratgia de preservao por si s. Junto com o formato PDF, a opo XML complementar na rea da preservao de longo prazo. Nos Estados Unidos, o Goverment Printing Office adotou o PDF como o formato oficial para seus documentos eletrnicos por consider-lo seguro para futuros projetos de preservao, mas nenhum dos formatos existentes at hoje pode ser considerado imune obsolescncia tecnolgica (TEPER; KRAEMER, 2002). Terrio (2002) defende um estudo mais profundo dos formatos no proprietrios, para poder ter argumentos que mostrem o cenrio diferente daquele onde as licenas no permitem o acesso ao hardware ou ao software necessrio para representar os dados. Em contrapartida, sistemas como o DSpace do Massachussett Institute of Technology (MIT) disponibilizam uma lista de formatos que so suportados e que continuaro disponveis e legveis no futuro (FALK, 2003). Algumas estratgias implementadas continuam considerando o mtodo de adotar softwares no proprietrios e salvar o contedo intelectual dos documentos como o mais apropriado para resolver os problemas da preservao digital. A publicao de relatrios por parte de grupos de estudo sobre materiais eletrnicos, como o Studies on the Preservation of Electronic Material da JISC/NPO e o da European Commission on Preservation and Access (ECPA) tem favorecido a construo de um corpo de guias e recomendaes para o gerenciamento dos materiais digitais (BENNETT, 1997). As concluses sugerem a manuteno desse tipo de acervos em formatos, sistemas e mdia padro. As sugestes envolvem mtodos operacionais para materiais especficos e mtodos estruturais para atender s necessidades de comunidades especficas de usurios. A Commission on Preservation & Access/Research Libraries Group (CPA/RLG) mencionou trs das principais estratgias para a preservao digital: a preservao da tecnologia, a tecnologia de emulao e a migrao da informao (WATERS; GARRETT, 1996). Desde o surgimento desses relatrios em 1995, as
58 sugestes apontam um ou vrios mtodos como o processo tcnico que melhor garante a preservao. Para a ECPA, por exemplo, seria a emulao (ROTHEMBERG, 1995); j para os detentores do projeto Cedar (CURL Exemplars in Digital Archives), o foco no uma mdia especfica, mas o acesso de longo prazo ao contedo intelectual do recurso. Em 1995, a JISC e a NPO (HAYNES, 1997), j afirmavam que a preservao digital precisa ser uma responsabilidade compartilhada, principalmente pelo grande volume de informao digital que est sendo produzido e pela natureza da tecnologia digital. A responsabilidade de que a informao cientfica e tecnolgica seja preservada para benefcio das futuras geraes est nas mos dos criadores desses materiais. Para o desenvolvimento de uma infra-estrutura para a preservao de materiais digitais, necessrio esclarecer a importncia dos criadores desses objetos e apontar as suas responsabilidades. Alguns dos criadores de materiais digitais de informao cientfica e tecnolgica no possuem os conhecimentos arquivsticos necessrios para realizar essa tarefa. A literatura especializada indica que os responsveis pelos acervos devem buscar uma viso sistmica, segundo a qual a informao esteja resguardada pela preservao. Pesquisadores em vrias partes do mundo esto desenvolvendo modelos do que seria a infra-estrutura para a preservao de longo prazo da informao em formato digital. Muitas das iniciativas propostas pelos grandes centros de pesquisa continuam sendo utpicas, mas proporcionam uma base para a discusso sobre a implantao de solues futuras ao problema (GRANGER, 2002). Para Beagrie e Greenstein (1998), algumas precaues devem ser tomadas para reduzir o perigo da perda dos materiais digitais: 1) armazenar os materiais em ambiente estvel e controlvel; 2) implementar ciclos de atualizao (refreshment) para cpia em nova mdia; 3) fazer cpias de preservao (assumindo licenas e permisses de copyrights); 4) implementar procedimentos apropriados de manuseio; 5) transferir materiais para uma mdia de armazenamento padro.
59 2.2.3.1 Preservao da seqncia de bits
De acordo com Rothenberg (2003), o dado e a mdia que suportam a informao devem possuir um nvel de funcionalidade representacional que permita a sua reproduo a qualquer momento em que a instituio mantenedora precise recuperar o dado. Cada mdia pode armazenar uma seqncia de bits de forma diferente, segundo as propriedades fsicas da mdia. A cadeia de bits (a seqncia de zeros e de uns que compreende o dado) precisa ento ser interpretada, pois toda seqncia significativa de bits pode representar qualquer coisa. Os objetos digitais so salvos como colees de bits representando documentos especficos, significativos apenas para o programa que os criou. A orientao bsica com relao s cadeias de bits que eles tenham sido transformados para um formato de mdia neutro ou padro; que suas propriedades mais significativas tenham sido capturadas e descritas; que exista a possibilidade de retornar em qualquer momento para a cadeia de bits original, no caso de alguma solicitao de acesso ao contedo intelectual original. Para que a cadeia de bits continue tendo sentido, algumas opes tm sido apontadas: a) manter a cadeia de bits original; b) manter a ferramenta que interpreta a cadeia de bits; c) focalizar a preservao para a ferramenta que interpreta; d) usar tcnicas para a longevidade do software.
Os motivos para escolher a estratgia de salvar a cadeia de bits vo desde o fato de ser uma escolha que deixa de lado o controle do desenho/criao do objeto a ser preservado, direcionando o foco para a ferramenta que interpreta, at o desenho de uma ferramenta que facilite a sua preservao. A interpretao da cadeia de bits e do dado envolve definies de hardware (para cpia e visualizao) e software ou aplicativos para as mais complexas entidades. Mas todo software interpretado por um hardware. Ele, como um processo ativo, executa comandos especificados em uma linguagem formal. Assim como Levy (1998), Bearman j ressaltava que salvar o contedo necessrio, mas no o suficiente. O contedo, a estrutura e o contexto da informao digital devem ser enlaados s funcionalidades do software que preserva suas conexes
60 executveis ou representaes de suas relaes, permitindo a sua reconstruo (BEARMAN, 1994, p. 302).
O motivo dessa limitao que para salvar uma cadeia de bits de um registro necessrio salvar tambm o seu intrprete. Interpretao significa que a recuperao dos arquivos digitais, tais como textos, figuras, imagens e sons decodifica-os e transforma-os em representaes inteligveis. Rothenberg (2003) mostrou que isso desencadeia, em todas as estratgias aplicadas, um ciclo de atividades repetitivo (ver Figura 3).
Figura 3 - Modelos do processamento nas perspectivas de preservao digital Fonte: verso traduzida e adaptada de Rothenberg (2003)
Copiar a mdia garante que o original bitstream do documento digital ser preservado. Mas um bitstream no pode ser auto-explanatrio. Um bitstream pode representar qualquer coisa como um smbolo. No apenas texto, mas tambm dados, udio, vdeo, grficos animados e outras formas ou formatos, atuais ou futuros, nicos ou combinados em formatos de hipermdia. Cada software est tendo diferentes tipos de codificao. Por isso cada computador precisa de alguma especificao de software para ativar os documentos digitais. Um bitstream pode ser
61 inteligvel apenas dentro de um software que o criou, ou algum software prximo que possa entend-lo.
2.2.3.2 Preservao da tecnologia e do objeto digital
Atualmente, os principais mtodos recomendados para a preservao dos objetos digitais podem ser agrupados em dois tipos: os estruturais e os operacionais. Os estruturais tratam dos investimentos iniciais por parte das instituies que esto se preparando para implementar algum processo de preservao e que adotam ou adaptam um dos modelos de metadados existentes ou seu prprio esquema. As atividades operacionais so as medidas concretas aplicadas aos objetos digitais. O Quadro 3 enumera os mtodos de preservao mais freqentemente usados.
Mtodos Estruturais Mtodos Operacionais Adoo de padres Conservao de software/hardware Elaborao de normas Migrao de suporte Formao de consrcios Preservao do contedo Metadados de preservao digital Converso de formatos Montagem de infra-estrutura Emulao Quadro 3 - Mtodos de preservao digital
As estratgias operacionais que englobariam os novos requisitos de preservao seriam a migrao de suporte e a atualizao do meio (preservao fsica), a converso dos formatos, a emulao (preservao lgica) e a preservao do contedo (intelectual). Para Thibodeu (2002), o que diferencia as estratgias de preservao o grau de especificidade e o enfoque na tecnologia ou no objeto digital (ver Figura 4).
62
Figura 4 - Diferenas entre estratgias de preservao Fonte: verso traduzida e adaptada de Thibodeu (2002)
Outra questo relativa preservao digital a autenticidade dos dados, pois os usurios precisam ter certeza de que a informao que esto utilizando o que diz ser e no foi alterada nem por outros usurios, nem em alguma atualizao de dados. Na manipulao dos objetos digitais existe o risco de corromper a originalidade, integridade e autenticidade da informao. Sero mencionadas a seguir, as trs metodologias mais usadas para enfrentar o problema da preservao digital: migrao, emulao/encapsulamento e conservao de hardware e software.
2.2.3.3 Migrao
Para Martin e Coleman (2002), no ambiente tecnolgico atual, todos os dados eletrnicos devem ser migrados a cada ano para que possam sobreviver. A migrao peridica da informao digital a partir de um ambiente de hardware ou de um software para outro a estratgia operacional para a preservao digital mais freqentemente usada pelas instituies detentoras de grandes acervos.
63 Segundo a definio da Task Force on the Archiving of Digital Information da Commission on Preservation and Access e o Research Library Group (1996), migrao a transferncia peridica de materiais digitais de uma configurao de hardware/software para outra, ou de uma gerao de tecnologia computacional para a gerao seguinte. O propsito da migrao preservar a integridade dos objetos digitais e assegurar a habilidade dos clientes para recuper-los, exp-los e us-los de outra maneira diante da constante mudana da tecnologia. A importncia da migrao transferir para novos formatos enquanto for possvel, preservando a integridade da informao. Um arquivo digital pode converter objetos digitais para um reduzido nmero de formatos-padro. Por exemplo, dados textuais podem ser estocados em um formato de software relativamente independente como ASCII, em formatos proprietrios de grande difuso como PDF, ou em formatos baseados em aplicaes de Standard Generalized Markup Language (SGML) como XML (COLEMAN; WILLIS, 1997). Com o passar do tempo, os dados podem ser copiados, recriados e atualizados como migraes peridicas necessrias em novos formatos para seu uso em novas geraes de hardware e software. Na rea de documentos digitais, alguns modelos comeam a surgir com a finalidade de converter materiais de formatos proprietrios para a linguagem XML. Os metadados tm um papel importante em qualquer estratgia de migrao bem-sucedida. Esse tipo de estratgia depender dos metadados criados para registrar a histria da migrao de um objeto digital. Tambm, existe a necessidade de informao do contexto para ser registrada (e preservada) para que, dessa maneira, futuros usurios possam entender o ambiente tecnolgico no qual um objeto digital foi criado. A International Federation of Library Associations (IFLA) recomenda a utilizao de formatos padro nos objetos digitais e nos metadados. Esses formatos devem permitir a migrao dos prprios metadados para outros padres. Vrios estudos tm mostrado que a migrao a estratgia mais adotada pelas instituies que produzem informao cientfica (OCLC/RLG PREMIS WORKING GROUP, 2004). Mas como a Task Force on the Archiving of Digital Information apontou, [...] apenas uma nica estratgia aplicada para todos os
64 formatos de informao digital e nenhum dos mtodos de preservao atuais so inteiramente satisfatrios [...] (TASK FORCE, 1996, p. 38). A metodologia de migrao est evoluindo, as tcnicas ligadas a essa estratgia esto sendo amplamente aceitas, mas a sua adoo est apenas comeando a ser aplicada no caso dos objetos digitais complexos. Para alguns especialistas a migrao continua sendo experimental e permanece como uma rea de pesquisa interessante. Para a Task Force a migrao no opcional, mas sim uma operao essencial: Existe uma variedade de estratgias de migrao para a transformao de informao digital contida em sistemas obsoletos para sistemas de hardware software atuais, para que essa informao continue acessvel e usvel. Nenhuma nica estratgia pode ser aplicada a todos os formatos de informao digital e nenhum dos mtodos de preservao atuais totalmente satisfatrio. As estratgias de migrao e seus custos variam dependendo dos contextos de aplicao, dos formatos, dos graus de preservao que as estratgias atendem e das suas possibilidades de recuperao. (TASK FORCE, 1996 p.27)
A migrao continua sendo a estratgia mais adotada; entretanto, para muitas instituies ainda cedo para pensar em uma grande mudana tecnolgica. Alm das grandes e antigas instituies, os arquivos e bibliotecas no tm iniciado nenhuma mudana tecnolgica significativa. A prevalncia da migrao significa a prevalncia de produtos comerciais como os da Microsoft Office e dos produtos da empresa Adobe na rea cientfica (PDF/A). Os assuntos ligados com a atualizao de software e hardware no esto sendo tratados pelas instituies, que manifestam estar mais preocupadas em coletar e inserir os contedos nos sistemas atuais. Assim como aumenta o nmero de verses de software ou documentos que so movidos de uma aplicao para outra (por exemplo, de WordStar para WordPerfect ou Microsoft Word para o Open Office), o risco de corrupo e de perdas essenciais de informao tambm crescem. O trabalho das bibliotecas na estratgia de migrao envolve grande nmero de formatos, complexos e proprietrios. Uma tarefa que diminui a sucessiva migrao de formatos a transferncia de recursos digitais em formatos preservveis no momento da submisso em um repositrio. Um autor pode escrever seu trabalho em Microsoft Word e submet-lo dessa forma no repositrio. Como o repositrio considera o Word no ajustvel para preservao, os bibliotecrios o
65 convertem para PDF, que possui especificaes de formatos pblicos e que promete uma representao imutvel no futuro. Como sendo um componente da estratgia de migrao, vrias iniciativas de preservao esto sistematicamente documentando formatos de dados, os softwares nos quais eles esto sendo criados, e coletando suas especificaes dos formatos quando elas esto disponveis. Nos Estados Unidos, a Library of Congress est construindo sites com informaes sobre formatos de contedo digital. Na Inglaterra, a National Archives criou o primeiro registro operacional de formato, Pronom, e a comunidade internacional de preservao est trabalhando na criao de um formato de registro de dados internacional. Mesmo assim, um registro operacional de formato pode oferecer uma variedade de servios, incluindo identificao de formato, verificao e converso. Entretanto, isto ainda pode demorar alguns anos, devido principalmente a assuntos organizacionais. O DSpace do MIT utiliza a migrao como sua principal estratgia de preservao. O MIT mantm o original e permitir o suporte atravs da migrao de formatos classificada como suportada (ou no proprietria). Espera-se, mas sem nenhuma garantia, que sero migrados os arquivos de sistemas proprietrios como Word, Excel, etc., para os quais as ferramentas de converso tornam-se possveis de serem disponibilizadas porque so formatos originais instalados pelos usurios. Existe tambm a migrao a pedido, na qual a verso original do material retida, e quando necessrio, so aplicadas ferramentas prprias para converter o original para os formatos requeridos pelo usurio (MELLOR, 2003). Com ela possvel poupar tempo, pelo fato de que os usurios no atualizam uma verso de software ou hardware para a seguinte com a mesma velocidade. Esse conceito foi testado no projeto CAMiLEON (CAMiLEON, 2001). Nos ltimos 10 anos, um grande nmero de estratgias de preservao surgiu, como projetos desenvolvidos em todo o mundo (LEE et al., 2002). Todos os trabalhos analisados mostraram que a estratgia mais citada e aplicada a de migrao (WHEATLEY, 2001). Essa estratgia tem sido usada principalmente nos contextos em que no existem objetos digitais interativos, apenas imagens, bases de dados e documentos de texto. O tipo e a quantidade de recursos devem ser levados em considerao na escolha de uma estratgia de preservao. A deciso dever garantir que a melhor estratgia de preservao foi escolhida entre as opes disponveis. Como todas as
66 estratgias usadas at hoje, a migrao depende de fatores tais como: experincia tcnica, expectativas de usurios, oramento institucional, equipamento existente e tempo disponvel. Para Ferreira, Baptista e Ramalho (2006), necessrio entender todos os passos envolvidos no processo de migrao, considerando uma seqncia de atividades: 1. Seleo da estratgia: as decises a serem tomadas inicialmente envolvem os formatos e as aplicaes. As instituies devem procurar otimizar a combinao do formato a ser tratado e o software para a converso [...] um que preserve o maior nmero das propriedades do objeto digital a um custo baixo [...]. Especificamente com relao ao custo, esses autores falam que ele deve ser considerado como uma varivel multidimensional. 2. A converso: a tarefa da converso consiste na reorganizao dos elementos que compreendem o objeto digital em estruturas lgicas definidas por formatos diferentes. Para o responsvel pela preservao, a ao da converso consiste na preparao de uma aplicao de converso e sua execuo em uma coleo de objetos digitais. O processo pode ser automatizado com a ajuda de scripts de programao. 3. Avaliao dos resultados: aps o processo de converso, os objetos resultantes devero ser avaliados para determinar a quantidade de dados perdidos durante a migrao. Para conseguir isso, as propriedades que compreendem o objeto original devem ser comparadas (chamadas de propriedades significativas) com as propriedades dos objetos convertidos. Se os resultados da avaliao no correspondem s expectativas (ex.: as propriedades do objeto foram degradadas para nveis inaceitveis), dever ser selecionada uma alternativa de migrao diferente e o processo reiniciado na integra. O processo de avaliao requer de trabalho manual com relao aos documentos comprimidos de arquivos de imagem e a elementos grficos nos documentos de texto. Em Portugal, na Universidade do Minho esto sendo realizados estudos para automatizar as trs atividades relacionadas com a migrao (seleo das
67 opes de migrao, converso e avaliao). Os pesquisadores da Universidade do Minho esperam testar uma Arquitetura de Servio Orientado (SOA) para combinar vrios sistemas distribudos ou repositrios digitais que permitam s instituies preservar suas colees automaticamente. O sistema trabalharia na fase inicial da entrada de dados (ingest processes) oferecendo uma srie de servios. O exemplo que eles apresentam o do Arquivo Nacional de Portugal: na instituio est sendo desenvolvido um sistema de repositrio digital para preservar objetos digitais autnticos produzidos por instituies filiadas (Projeto RODA). Ao mesmo tempo est sendo criado o processo de ingest e as polticas de preservao, para ajudar aos produtores na preparao do material antes de ele ser submetido ao repositrio. Dessa forma, ser realizado um processo de normalizao para lidar com objetos em formatos no identificados. Na presena de um formato no reconhecido o repositrio solicitar um servio de identificao de formato ao SOA, para obter informao e conferir a sua integridade. Aps essa tarefa, a instituio solicita ao SOA uma lista de formatos para os quais o documento pode ser convertido, informando suas preferncias e requisitos de preservao (provenientes das polticas), por exemplo: - as intervenes de preservao devero ser acessveis e rpidas; - as intervenes devero preservar o nmero mximo de propriedades do objeto original; - as intervenes no devero recorrer a formatos que sejam dependentes de pagamentos ou direitos autorais (FERREIRA, BAPTISTA; RAMALHO, 2006). Na estratgia de migrao a habilidade de decodificar o formato atual deve estar sempre presente, garantindo a compatibilidade retroativa, a interoperabilidade dos programas e o uso de formatos padro. Os recursos digitais podem ser transportados de uma plataforma para outra atravs de migraes mltiplas, considerando as corrupes acumulativas que podem alterar algumas dessas caractersticas (ROTHENBERG, 2000). Uma das vantagens da migrao que ela permite o acesso rpido ao recurso, j que o documento estar sempre em formato padro. Dessa forma os usurios encontraram como resultado da converso, recursos digitais considerados suficientes apesar da perda de algum atributo visual (look-and-feel).
68
2.2.3.4 Emulao e encapsulamento
Com a emulao pretende-se preservar os documentos digitais e suas funcionalidades (ROTHENBERG, 1999). As tcnicas de emulao sugerem a preservao do dado no seu formato original, por meio de programas emuladores que poderiam imitar o comportamento de uma plataforma de hardware obsoleta e emular o sistema operacional relevante. O processo consiste na preparao de um sistema que funcione da mesma forma que outro de tipo diferente, para conseguir processar programas. Essa estratgia est relacionada preservao do dado original no seu formato original. No lugar de preservar o software e hardware hospedeiro, os engenheiros de sistemas poderiam construir programas emuladores (ROTHENBERG, 1995). Na prtica, os dados podem ser encapsulados junto com a aplicao de software utilizado na sua criao, assim como uma descrio do ambiente de software e hardware requerido para seu funcionamento. Para facilitar seu uso no futuro, Rothenberg (1996) sugere que seja anexada uma anotao de metadados na superfcie de cada encapsulao que poderia explicar como decodificar os dados obsoletos contidos e prover qualquer informao desejada sobre esses registros. A emulao precisa do desenvolvimento de tcnicas de encapsulamento de documentos, seus metadados, software e especificaes de emulador de forma a assegurar sua coeso e prevenir sua corrupo (ver Figura 5).
69
Figura 5 - Um documento digital encapsulado Fonte: verso traduzida e adaptada de Rothenberg (1995)
A emulao uma estratgia importante que possui aplicaes teis quando a aparncia do recurso digital original importante, desde que no seja aconselhvel investir em uma tecnologia da informao de alto custo. Hendley (1998) pede precauo no caso de se usar apenas esta abordagem e comenta que os gerentes de colees ficaro dependendo da habilidade tcnica dos engenheiros de software para emular um ambiente especfico e sustent-lo, para processar em computadores futuros e desconhecidos e recriar o comportamento de documentos digitais. Segundo Hendley (1998), a metodologia de emulao a nica que pode potencialmente preservar os objetos digitais originais e a capacidade deles serem executados como eles foram inicialmente. Para isto, ele prev o entendimento do software necessrio para a visualizao do recurso, sem nenhum outro esforo necessrio no decorrer do tempo. Esta metodologia retarda a necessidade da converso dos registros em novos formatos, at o momento em que uma deciso gerencial determine que para acessar os documentos necessrio que o registro original seja acessado em formatos novos. Rothenberg (1995) afirma que no futuro alguns programas como o MS DOS continuaro sendo ubquos e que os gerentes das colees digitais tero que continuar instruindo aos seus usurios a usarem programas como esse. Prev-se que os programas proprietrios ficaro obsoletos e que em conseqncia seu valor
70 comercial e restries de direitos autorais expirem, ficando assim disponveis para os futuros usurios. Para alguns especialistas (GRANGER, 2000; LAWRENCE et al., 2000), a estratgia de emulao uma metodologia a curto e a mdio prazo, especialmente para aqueles que precisam do recurso original pela sua importncia para os usurios da coleo (ROTHENBERG, 1999). A emulao deve ser usada nos casos em que os recursos digitais no podem ser migrados dada a sua complexidade, nem convertidos para formatos de software independentes. A implementao desta estratgia complexa e difcil, devido principalmente, ao tipo de necessidades efetivas a serem preenchidas. A estratgia de emulao est sendo usada quando o recurso digital no pode ser convertido em formatos de software independentes, e migrados no futuro. Ela exige uma descrio da tecnologia usada durante a criao do recurso, e a encapsulao: a) do recurso digital, acompanhado pelo sistema operacional e seus aplicativos e, b) das especificaes do emulador a ser usado e o histrico do recurso digital. A emulao ocorre em nvel de software e de hardware. No primeiro caso, a dificuldade est na descrio das aplicaes que permita a reproduo posterior. Isto exige uma atualizao constante dos conceitos usados devido principalmente s mudanas freqentes de arquivos multimdia e hipertextuais (GRANGER, 2000). J a emulao do hardware atravs de um software precisa da informao detalhada sobre suas caractersticas. A estratgia de emulao tem algo em comum com a preservao de tecnologia e envolve os seguintes critrios: a) uma mdia de informao digital estvel deve ser armazenada em um sistema b) a mdia digital ser preservada enquanto o documento est sendo preservado como uma machine language; c) dados sero representados como um formato de mdia novo atravs da converso e reformatao; d) a integridade da informao digital ser incrementada atravs de um processo de cpias;
71 e) a aplicao original deve ser preservada e usada para criar ou acessar o recurso digital. A linguagem XML est sendo considerada capaz de assegurar o encapsulamento dos metadados e das informaes necessrias para a interpretao do objeto digital original. O projeto VERS (Victorian Electronic Records Strategy) na Austrlia implementou a estratgia e recomenda que a estrutura dos dados encapsulados em um nico objeto, em linguagem XML permita a incluso de metadados e informaes de identificao.
2.2.3.5 Conservao de hardware e software
A perspectiva de preservao digital que prope a conservao do software e do hardware (technology preservation) sugere que os dados digitais sejam preservados em mdia estvel e copiados para nova mdia, caso seja necessrio, e associados s cpias preservadas de uma aplicao de software original. Esse sistema operacional ser normalmente usado para ser lido sob uma plataforma de software relevante. Essa estratgia pode ter valor para casos particulares ou histricos de software e hardware, bem como ser til para a comunidade dos museus (SWADE, 1992), de longo prazo, entretanto, cara e pouco prtica. Segundo Hendley (1998), a perspectiva da tecnologia da preservao no pode ser apreciada como vivel, mas apenas, para o curto e mdio prazo, como uma medida de relativo desespero em casos em que valiosos recursos digitais no possam ser convertidos para formatos independentes de software e hardware e, assim, migrados para outros formatos. A preservao do hardware e do software envolve algumas aes especficas, tais como: o armazenamento das cadeias de bits em uma mdia digital estvel e a preservao dessa mdia; copiar ou atualizar os dados para uma nova mdia e preservar sua integridade e tambm, preservar a aplicao original, os programas e as plataformas para processar essas aplicaes. Em concluso, a aplicao desta metodologia tem sentido quando o objeto digital foi criado em formato proprietrio e em um software obsoleto.
72 Esta estratgia envolve os seguintes critrios: a) converter a informao atravs de uma mquina de linguagem como um mio estvel; b) a mdia digital deve ser preservada pela tecnologia; c) informao pode ser atualizada e copiada como uma mdia de acordo com os requerimentos; d) os programas de aplicao precisam criar ou acessar os documentos digitais; e) preservar a integridade da informao digital durante o processo da cpia; f) o hardware ou o sistema de software devem suportar a aplicao de software; g) preservar a plataforma de hardware na qual opera o sistema de software no qual o documento pode ser processado. A conservao de software e hardware pode ser adotada quando um recurso digital valioso est sendo acessado por uma aplicao de software que deve ser operada em um sistema de software. Esta estratgia est sendo considerada em declnio.
2.2.4 Metadados de preservao
Na preservao digital, ao criar uma estrutura que guarde o contedo e a estrutura da informao, as informaes devem ser preservadas de modo a evitar que sejam corrompidas. Para isso, vrias tcnicas esto sendo usadas, tais como a criao de metadados de preservao que so atributos especiais de dados ou documentos, geralmente descritivos. Para Hodge (2000), a preservao e o processo de arquivamento devem comear no momento da criao do objeto digital, indicando o valor que ele tem e enfatizando os assuntos ligados com a consistncia dos metadados no incio do seu ciclo de vida. Harnad (2003) enftico ao afirmar que os e-prints autodepositados, como verses para acesso livre, no precisam de nenhum trabalho tcnico em relao aos metadados, e que o mnimo do protocolo de coleta de metadados da
73 Open Archive Initiative (OAI) satisfatrio. Para ele, os metadados usados para criar a interoperabilidade 11 entre repositrios tm mostrado sua eficcia desde 1999. Os tericos do acesso livre concordam que para os originais necessrio esse gerenciamento de longo prazo. Na rea da cincia da informao, o papel dos metadados tem sido tratado amplamente, enfocando a sua necessidade e desafios que eles criam no gerenciamento de recursos digitais. Alemneh, Hastings e Hartman (2002) mencionam que o princpio fundamental dos metadados integrar colees digitais, heterogneas, em mltiplos formatos e de vrias instituies, permitindo que elas sejam acessveis a qualquer pessoa, em qualquer lugar ou hora. Segundo vrios autores (Besser, 2000; Moen, 2001; Sutton, 1999; Waibel, 2000; Zeng, 1999), o uso de metadados est centralizado na identificao, autenticao e contextualizao dos registros, das pessoas, dos processos e dos sistemas que criam, gerenciam, mantm e usam esses objetos digitais. A funo bsica dos metadados prover informaes sobre o documento digital, dando subsdios aos processos de gesto, recuperao e reproduo. Com eles, a interoperabilidade dos estoques informacionais pode estar garantida, configurando- se em mais uma soluo para a preservao digital (SANTANNA, 2001). Os metadados tm vrias funes e servem para vrios propsitos. Eles do suporte aos processos de registro e de negociao, das seguintes formas: a) realizando a proteo dos registros como evidncias e garantindo sua acessibilidade e usabilidade atravs do tempo; b) facilitando a habilidade de entender os registros; c) apoiando e garantindo o valor de ser evidncias dos registros; d) ajudando na comprovao da autenticidade, confiabilidade e integridade dos registros; e) apoiando e gerenciando o acesso, a privacidade e os direitos autorais; f) apoiando uma recuperao efetiva; g) apoiando as estratgias de interoperabilidade, permitindo a captura dos registros criados em diversos ambientes tcnicos e gerenciais e sua sustentabilidade;
11 Capacidade de um sistema ou dispositivo comunicar de forma transparente com outro sistema ou dispositivo.
74 h) provendo e mantendo a lgica dos links entre registros e o contexto da sua criao. Os metadados so expressos em grupos de elementos e atributos, sendo que o agrupamento de elementos depende das suas relaes. Os elementos e atributos podem ser mandatrios ou opcionais. Estruturados em esquemas de metadados eles especificam e descrevem o conjunto padro de elementos de metadados e suas inter-relaes Os esquemas provem uma sintaxe formal (ou estrutura) e semntica (ou definies) para os elementos de metadados (ex.: ISO Metadata for Records). Baseados na experincia de vrios projetos de implementao de metadados, autores como Rosenthal; Lipkis; Robertson e Morabito (2005) tm reforado a viso de que os padres atuais so prematuros e insuficientes em um futuro previsvel. Assim tambm, o seu uso e evoluo requereram sempre um tradutor. A traduo ou transformao de um padro para outro no tem garantido, a inexistncia de perda ou a cobertura de todos os dados, sendo, dessa forma, impossvel a reconstruo de um objeto digital original. Na viso desses autores, a evoluo dos padres de metadados sempre ficar atrs das novas verses que estaro sendo usadas considerando que a cincia da informao continua avanando e os novos objetos digitais no param de ser criados, permanecendo rfos de padres desde seu surgimento. Na literatura da rea podem ser encontrados comentrios sobre a necessidade de fazer uma clara definio dos atributos de um documento atravs de metadados para que, alm de minimizar os riscos de perda do contedo, possam ser feitas revises da informao mantida em repositrios e identificar como ela pode ser aperfeioada (CAPLAN, 2004; DAY, 2004; McGOVERN, 2007; CANDS ROMERO, 2006). Um primeiro passo seria a reviso de todos os metadados existentes em repositrios em uso para, em seguida: 1) localizar os metadados para descoberta; 2) localizar os metadados de preservao mnimos e, 3) identificar os metadados adicionais requeridos para a preservao e mtodos de captura, tcnicos e de provenincia. Uma parte importante do suporte que os metadados oferecem permitir as estratgias de interoperabilidade, conseguindo capturar os registros criados e ambientes tcnicos e de negcios diferentes e possibilitar sua sustentabilidade. Com
75 os metadados, os links entre registros e seu contexto de criao so mantidos e podem ser informados. Os atributos dos metadados podem ser identificados como tipos de metadados necessrios para ser aplicados em diferentes reas da organizao, dependendo dos riscos e necessidades (Ex.: ISO RM Standard). As comunidades que tm implementado algumas das iniciativas de metadados concordam que um nico padro de metadados no pode atender a todas as necessidades dos diferentes contextos digitais (OCLC/RLG, 2001). Nem mesmo o projeto Dublin Core tem conseguido prover uma soluo que abranja todo tipo de recurso de informao digital. Por isso, alguns formatos de metadados tm sido desenvolvidos para ser usados em diferentes contextos de informao digitais. Entre eles esto os seguintes: - Government Information Locator Service (GILS); - Visual Resources Association (VRA); - Content Standard for Digital Geospatial Metadata (CSDGM) e, - Encoding Archives Description (EAD). Tambm, tem sido foco da ateno o desenvolvimento de ferramentas para a descoberta de materiais digitais, para facilitar a interoperabilidade entre os recursos de diferentes reas. Alguns desses esforos so o Resource Description Framework (RDF), o Extensible Markup Language (XML) 12 e o Z39.50. Entretanto, Mullen (2001) mostra que essas iniciativas no garantem o acesso de longo prazo dos recursos digitais, pois a abordagem que elas do aos metadados enfatiza a descoberta de recursos de informao, e no sua preservao. Os metadados de preservao so aqueles relacionados com o contedo do documento, seu contexto e estrutura no momento da sua criao, assim como das mudanas acontecidas em todo seu ciclo de vida. Essa perspectiva inclui sua estrutura fsica, tcnica e lgica (a relao entre registros). Nos ltimos anos tm surgido vrios esquemas e padres de metadados de preservao. A maioria originou-se da comunidade de profissionais da cincia da informao, entre os quais se encontram:
12 Extensible Markup Language (XML) um formato padro para publicao, armazenamento e transferncia de documentos por via eletrnica, independente dos fabricantes de software, facilmente interpretvel por mltiplas aplicaes e, em certa forma, auto-explicativo.
76 a) National Library of Australia; b) CEDARS; c) California Digital Library; d) National Library of New Zealand; e) Open Archival Information System (OAIS) Reference Model; f) OCLC Digital Archive Metadata; g) VERS; h) AUDIOMD e VIDEOMD; i) Creative Commons Metadata. Alguns formatos de metadados esto sendo usados para a identificao, validao e extrao de dados: a) GDFR/JHOVE; b) PRONOM/DROID; c) Toolkit da National Library of New Zealand; d) A base de dados de software NIST; e) CRiB. Tambm, arquivos nacionais e outras agncias governamentais tm desenvolvido padres para o registro de metadados: j) Public Record Office [PRO]; k) National Archives of Australia; l) Public Record Office Victoria, VERS e Information Interchange Office of the e-Envoy; m) METS: Metadata Encoding and Transmission Standard; n) MIX ou NISO Z39.87 Technical Metadata for Digital Still Images; o) Library of Congress; p) NEDLIB; q) Arquivo Nacional do Brasil. Os metadados de preservao so uma forma especializada de administrar metadados que podem ser usados como um meio de estocar a informao tcnica que suporta a preservao dos objetos digitais. No seu documento sobre as diversas classes de informao que devem estar presentes num esquema de metadados de preservao, a iniciativa da OCLC/RLG (2002) afirma que existem trs condies bsicas para o uso dos metadados de preservao:
77 a) abrangncia: metadados estendidos a todos os aspectos do processo de preservao digital; b) estruturao: ser complemento aos componentes e processos funcionais de um sistema de arquivamento digital; c) larga aplicabilidade: aplicveis a uma extensa faixa de tipos de objetos digitais, atividades de preservao digital e instituies. Para Besser (2000), os metadados de preservao tm como objetivo prover informao suficiente sobre os recursos digitais para que metodologias de preservao, tais como a migrao e a emulao, possam ser aplicadas, e dessa forma contar com as informaes necessrias sobre as verses, os esquemas de descompresso e conexes. A criao e o uso de metadados representam uma parte importante em todas as estratgias operacionais de preservao digital, por no estarem baseados na conservao de software e hardware, emulao ou migrao, como um meio para garantir a autenticidade, registrar o gerenciamento de direitos e colees de dados. Alm de assegurar a interao com recursos de busca (ROTHENBERG, 1996), eles tambm informam sobre a origem do material e os detalhes tcnicos dos registros, como qual foi a verso do software usado, como foi construdo, por exemplo, o registro. Para Lavoie (2004), os metadados de preservao so empacotados (fsica ou logicamente) com os objetos digitais, acompanhando-os durante todo o perodo do arquivamento. As informaes sobre o contexto contidas nesses metadados so essenciais para garantir a acessibilidade e usabilidade dos objetos. O desafio dos esquemas de metadados de preservao antecipar a informao que ser necessria para cumprir determinados objetivos de preservao. So informaes sobre a provenincia, autenticidade, aes de preservao, o contexto tecnolgico e condies legais (LAVOIE; GARTNER, 2005). Em 1998, o Research Libraries Group (RLG) recomendou, a utilizao de 16 elementos de metadados para garantir a preservao de longo prazo. Mas o consenso sobre o modelo nico de metadados de preservao no foi ainda alcanado (McGOVERN, 2007). Segundo Searle e Thompson (2003), a implementao de um esquema de metadados de preservao requer no mnimo a limitao do escopo dos metadados para preservao, a fim de maximizar o potencial para sua automao e garantir o
78 controle da mudana nos metadados. Na parte operacional do desenvolvimento do esquema de metadados para preservao, algumas atividades so necessrias: 1. implementao do padro de metadados; 2. criao de repositrios de metadados de preservao integrados a outros repositrios de metadados usados pela instituio; 3. definio do script para extrair os metadados de preservao, que produza um relatrio em XML daquilo que os metadados identificaram como importante para a preservao, para depois serem transferidos para o repositrio de metadados. Vrias instituies internacionais tm construdo marcos conceituais para identificar elementos especficos de metadados de preservao. Esto sendo desenvolvidos dicionrios de metadados de preservao utilizados nesses projetos e que refletem o tipo de necessidades que as instituies enfrentam (CEDAR PROJECT TEAM, 2002; LUPOVICI; MASANS, 2000; NATIONAL ARCHIVES OF AUSTRALIA, 1999). A National Library of New Zealand produziu um esquema de metadados para preservao, orientado para ser um ponto de equilbrio entre os princpios expressos no modelo de referncia Open Archival Information System (OAIS) para a preservao de metadados e a praticidade de implementao de um conjunto de metadados operacionais de preservao. Ele est dividido em quatro entidades: o objeto, o processo, o arquivo e a modificao de metadados (Figura 6).
79
Figura 6 - Esquema de metadados da NZNL Fonte: National Library of New Zealand (2003)
No artigo de Searle e Thompson (2003), o esquema da NLNZ apresentado identificando-se as reas nas quais ele pode ser desenvolvido: para a expanso dos dados de definio dos elementos do esquema; para criao de um repositrio baseado nesses dados de definio, e para o desenvolvimento de ferramentas de extrao automtica de metadados para alimentar o repositrio. O esquema identifica os dados que a biblioteca coletar e manter. O arquivo original (preservation master file) deve ser preservado, gerenciado e disseminado atravs do tempo. Segundo a NLNZ (2003), os metadados de preservao contm informaes sobre: a) polticas e tcnicas de preservao adotadas; b) efeitos da estratgia adotada; c) gerenciamento de colees; d) gesto de direitos autorais; ENTITY 4 - METADATA MODIFICATION 4.1 Object identifier 4.2 Metadata record modifier 4.3 Date and time 4.4 Field modified 4.5 Data modified ENTITY 3 FILE (cont.) 3.14 VIDEO: 3.14.1 Frame dimensions 3.14.2 Duration 3.14.3 Number of frames 3.14.4 Frame rate 3.14.5 Codec method 3.14.6 Aspect ratio 3.14.7 Scan mode 3.14.8 Sound indicator 3.15 TEXT: 3.15.1 Character set 3.15.2 Mark up language 3.16 DATASETS: Use common elements only 3.17 SYSTEM FILES: Use common elements only ENTITY 1 - OBJECT 1.1 Name of object 1.2 Reference number 1.3 Object identifier 1.4 Group Identifier 1.5 Persistent identifier 1.6 Preservation Master Creation Date 1.7 Logical composition 1.8 Is part of group 1.9 Structural type 1.10 Hardware environment 1.11 Software environment 1.12 Installation requirements 1.13 Access inhibitors 1.14 Access facilitators 1.15 Quirks 1.16 Metadata record creator 1.17 Date of metadata record creation 1.18 Structural composition 1.19 Comments ENTITY 2 - PROCESS 2.1 Object identifier 2.2 Original identifier 2.3 Process type 2.4 Purpose 2.5 Person/agency performing process 2.6 Permission 2.7 Permission date 2.8 Hardware used 2.9 Software used 2.10 Steps 2.11 Result 2.12 Guidelines 2.13 Completion date and time 2.14 Comments OBJECT METADATA MODIFICATION FILE PROCESS ENTITY 3 - FILE 3.1 Object identifier 3.2 File identifier 3.3 File path 3.4 Filename and extension 3.5 Former filename 3.6 File size 3.7 File date and time 3.8 MIME type 3.9 File format 3.10 File format version 3.11 Target indicator 3.12 IMAGE: 3.12.1 Resolution 3.12.2 Dimensions 3.12.3 Bits per sample 3.12.4 Colour space 3.12.5 ICC Profile Name 3.12.6 Colour map reference 3.12.7 Orientation 3.12.8 Compression 3.13 AUDIO: 3.13.1 Resolution 3.13.2 Duration 3.13.3 Bit rate 3.13.4 Compression 3.13.5 Encapsulation 3.13.6 Channels
80 e) autenticidade do recurso digital. Tambm a NLNZ afirma que os metadados de preservao podem ser usados para: 1) armazenar informaes que do suporte s decises e aes relacionadas com a preservao; 2) documentar processos de preservao, tais como migrao, transformao e emulao de registros que afetam os processos de preservao; 3) garantir a autenticidade da verso original preservada ao longo do tempo; 4) permitir a identificao dos objetos que so responsabilidade da biblioteca. A National Library of Australia (2003) tem mostrado como os metadados de preservao (considerados como uma forma especializada de metadados administrativos) podem ser usados como um meio de estocar a informao tcnica que sustenta a preservao dos objetos digitas. Em 2005, o OCLC-RLG Metadata Implementation Strategies Working Group (PREMIS) que trata dos [...] aspectos prticos da implementao de metadados de preservao nos sistemas de preservao digital [...] (OCLC/RLG, 2005) lanou a primeira verso do Preservation Metadata Data Dictionary 13 . O PREMIS quase um padro para metadados de preservao, mas muitos envolvidos com projetos de preservao digital no conseguem implementar metadados de preservao porque trabalham com apenas reduzida parte deles no gerenciamento da preservao digital. O Dicionrio de Dados PREMIS descreve o conjunto de elementos bsico de metadados necessrios para dar suporte preservao digital e como eles devem ser usados na estruturao de um repositrio digital (OCLC/RLG, 2005). O Dicionrio classifica esses elementos em cinco entidades: 1) Intelectuais: descrevem a manifestao fsica do objeto digital. 2) Agentes: descrevem pessoas, organizaes e aplicaes envolvidas. 3) Eventos: descrevem aes de preservao direcionadas a um objeto digital.
13 Dicionrio de dados sobre metadados de preservao
81 4) Objetos: descrevem o conjunto de manifestaes fsicas de uma entidade intelectual. 5) Direitos: descrevem os direitos e as permisses relacionadas com o objeto digital. As prticas de aplicao de metadados de preservao mencionada na literatura assinalam que, para cumprir com seu objetivo, elas devem ser mantidas consistentemente atravs do tempo. Para isto, fundamental a criao da documentao que controle e informe cada passo na criao dos metadados. Alemneh, Hasting e Hartman (2002) recomendam o detalhamento do workflow e um guia para que os usurios possam prover toda a informao requerida sobre o processo de criao de metadados, com exemplos para diferentes formatos de arquivos. O guia, segundo esses autores, dever informar as regras, sintaxe e descrio necessria para identificar a fonte de informao para cada elemento. Eles citam como exemplo disso o esboo do sumrio da estrutura dos metadados de preservao da University of North Texas (Figura 7).
82
Figura 7 - Estrutura de metadados de preservao das UNT Libraries Fonte: verso traduzida e adaptada de Alemneh; Hastings e Hartman (2002)
2.2.4.1 Iniciativas de implementao de metadados de preservao
A medida que os objetos digitais vo se convertendo no mtodo dominante de registrar e disseminar informao cientfica, o gerenciamento dos metadados de preservao torna-se uma rea de crescente interesse por parte dos responsveis por tais recursos. A rea dos metadados de preservao continua a ser o foco das principais iniciativas de preservao digital devido quantidade macia de informao que est sendo colocada nos arquivos, bibliotecas e repositrios digitais, assim como tambm pela nfase na criao de colees digitais mais do que em documentos isolados. Internacionalmente, vrias iniciativas esto desenvolvendo estruturas para incluir metadados de preservao. Entre elas conta-se com grupos de trabalho da
83 iniciativa conjunta da OCLC/RLG, o projeto CEDARS (Universidade de Leeds), PADI (National Library of Australia) e a NEDLIB (da Biblioteca Nacional da Holanda). No existe consenso sobre qual seria o padro de metadados de preservao, mas todos esses grupos coincidem em alguns pontos, como o caso do CEDARS Guide to Preservation Metadata e o OCLC Preservation Metadata Framework, sendo que esta ltima considerada o mais avanado desenvolvimento no campo dos metadados de preservao. Outros modelos existentes so: National Library of Australias Guidelines for the Preservation of Digital Heritage; Esquema de metadados para preservao da National Library of New Zealand; Elementos de metadados propostos pela Cornell University Library; Library of Congress Metadata Encoding and Transmission Standard (METS); Open Archival Information System Reference Model, publicado pelo Consultive Committee for Space Data Systems (CCSDS). O trabalho da OCLC e a RLG vm discutindo a necessidade de metadados de preservao e as diferenas entre os tipos de metadados e seus objetivos, sejam estes na descoberta ou na disseminao de contedos. Os especialistas envolvidos tm analisado os elementos de metadados de preservao identificados em outros grandes projetos, como o NEDLIB, CEDAR e HARVARD, tentando integrar todos eles. Nessa mesma linha, est o trabalho realizado pelo Defense Technical Information Center (DTIC) dos Estados Unidos, que publicou um guia para metadados de preservao em 2002 (DEFENSE TECHNICAL INFORMATION CENTER, 2002), para apoiar a criao da sua Defense Virtual Library. Os metadados de preservao nesse guia abarcam vrios tipos de objetos, como imagens, vdeos e relatrios tcnicos. O conjunto de elementos chega a mais de 100, propostos pelo DTIC como os elementos necessrios para dar incio preservao a longo prazo de objetos digitais e em concordncia com o Modelo de Referncia OAIS. Uma experincia relevante foi a da Public Record Office Victoria na Austrlia, que criou a Victorian Electronic Records Strategy (VERS) com registro de um nmero extenso de metadados de preservao identificados. Uma caracterstica
84 especial que o VERS inclui, tambm, metadados para descrever a prpria estratgia. Dessa forma, no futuro, um usurio que acesse um objeto encapsulado sem documentao poder extrair um documento em XML com as descries textuais das tcnicas usadas na construo do objeto encapsulado e dessa forma recriar o software no qual foi criado e at substituir o repositrio (Figura 8).
Figura 8 - Registro de metadados da Victorian Electronic Records Strategy Fonte: Public Record Office Victoria (1999)
85 Alm disso, cada registro leva includa uma referncia textual aos padres de metadados como uma forma de documentar o formato de preservao usado. Essa estratgia converge com a linha de atuao proposta por Hodge e Carroll (1999), quando sugerem que, para melhor funcionamento dos objetos digitais, os metadados devem estar embutidos no prprio documento e serem extrados pelos mecanismos de busca como etiquetas no prprio recurso on-line. A estratgia VERS pressupe que os objetos digitais provm de sistemas de gerenciamento digital que contm metadados. Esses metadados podem formar um conjunto simples ou um arranjo de metadados qualificados. Segundo os proponentes dos metadados VERS, estes podem chegar a servir como lngua franca em que os metadados originais podem ser mapeados (QUENAULT, 2004). H 141 elementos para a preservao e suporte do acesso de longo prazo. Destes, 34 so obrigatrios; 11 o sistema cria automaticamente; 8 vm preenchidos (defaulted); e 2 so derivados de outros elementos. Dos restantes 13 elementos, 11 so selecionados de uma lista e com apenas dois o responsvel deve criar seu contedo (SINCLAIR, 2003). Os padres continuam a ser revisados e melhorados. Com o desenvolvimento da tecnologia, o conhecimento sobre a estratgia de metadados de preservao precisa evoluir junto. Ferramentas relacionadas com a gerao, a marcao e a editorao de metadados esto surgindo. Os softwares para construo de repositrios comeam a integrar ferramentas direcionadas para a preservao digital. Entre eles est o NLNZ metadata extractor (RESEARCH LIBRARY GROUP, 2006), um dos projetos da iniciativa da NLNZ na criao de uma estrutura de padres de metadados que comeou no ano de 2000 (Figura 9) 14
Figura 9 - Ferramenta para extrao de metadados de preservao da NLNZ Fonte: verso traduzida e adaptada de National Library of New Zealand (2007)
A ferramenta permite lidar com objetos digitais dentro de um processo de workflow identificado pela NLNZ, contendo especificaes sobre o modelo de negcios, a infra-estrutura do material digital e as estratgias segundo o tipo de formato dos arquivos. Nesse desenvolvimento de padres, modelos e representaes, a ferramenta de extrao de metadados (Extract Tool) est sendo considerada a concretizao da experincia da NLNZ na manuteno de objetos digitais (ex.: The New Zealand Locator Service (NZGLS) e o Metadata Standard and Reference Manual). As solues propostas para enfrentar os desafios trazidos pelas mudanas constantes no ambiente digital esto sendo desenvolvidas e atualizadas em grandes projetos de preservao digital. Cada vez mais, informaes sobre criao, entrega, operao e administrao dos recursos digitais vm sendo consideradas cruciais para determinar seu acesso e preservao (OCLC/RLG, 2001). Os metadados que informam aos usurios sobre o contexto tecnolgico e sua
87 segurana esto ajudando a resolver questes que acompanham a vida desses recursos, tais como: - que tipo de recurso ? - como ele pode ser usado? - como pode ser modificado? e, - quem esteve envolvido na sua criao/modificao? Considerando esses objetivos dos metadados de preservao, a National Library of Australia (1999) definiu as cinco funes principais desse tipo de metadados: 1) armazenar informao tcnica que apie as decises e aes de preservao; 2) documentar as aes de preservao tomadas (ex.: migrao ou emulao); 3) registrar os efeitos das estratgias de preservao; 4) garantir a autenticidade dos recursos digitais ao longo do tempo; 5) anotar informao sobre gerenciamento de colees e direitos de autor. importante o consenso nos metadados de preservao e nos padres para o gerenciamento dos documentos digitais ao longo do tempo, a fim de garantir sua longevidade, interoperabilidade, veracidade, consistncia e, desta maneira, motivar que empresas criem solues que possam dar suporte a eles. Alm disso, deve-se apontar que existem elementos lgicos nos arquivos que precisam ser conservados, assim como o registro da evoluo da estrutura lgica dos objetos digitais.
2.2.4.2 A norma OAIS
Vrios autores mencionam a importncia dos padres na rea da preservao digital. Nos ltimos anos, tm sido formulados diversos modelos de referncia, e algumas iniciativas de preservao afirmam j estar seguindo esses requerimentos e fatores condicionantes.
88 Em 1998, Fresko ressaltava que as normas aceitas para a preservao digital eram poucas e nenhuma cobria todos os aspectos relacionados com a informao digital. Em 2003, a Digital Preservation Coalition (DPC) 15 realizou uma pesquisa entre seus membros sobre necessidades de preservao digital. O resultado mostrou que, tanto as grandes organizaes nacionais estavam comeando a lidar com o problema, quanto as de pequeno porte no tinham elaborado nenhum projeto relacionado ao assunto. Nesse mesmo ano, a OCLC e a RLG criaram um grupo de trabalho para estudar os aspectos prticos da implementao de metadados de preservao e projetos de preservao digital (OCLC, 2003). Como mencionado anteriormente, fundamental o uso de padres internacionais de arquivamento de metadados para proporcionar uma gesto mais efetiva de estratgias de preservao de documentos eletrnicos. A mais importante proposta de modelo de metadados de preservao foi produto de 10 anos de trabalho do Consultative Committee for Space Data System (CCSDS), ligado NASA, quem props o modelo de referncia Open Archival Information System (OAIS), cercado de polticas e procedimentos arquivsticos em sua arquitetura (CCSDS, 2002). Considerado o modelo para repositrios de metadados de preservao mais usado atualmente, o modelo de referncia Open Archival Information System (OAIS), traduzido para o portugus como Sistema Aberto de Arquivamento de Informao (SAAI) (THOMAZ; SOARES, 2004) , desde fevereiro de 2003, uma iniciativa da International Organization for Standardization (ISO 1471). Ela define um alto nvel de modelo de referncia para organizaes e pessoas que criam informaes que podem necessitar de preservao de longo prazo, bem como das organizaes que adquirem tais informaes. Originalmente, a norma era destinada a regular o armazenamento de longo prazo de informaes digitais obtidas de observaes de ambientes espaciais e da Terra, mas ela aplicvel a qualquer tipo de arquivo digital e compatvel com os sistemas baseados no protocolo de coleta de metadados da Open Archives Iniciative (DAY, 2001).
15 Disponvel em: Digital Curation Centre http://www.dcc.ac.uk/ Acesso em: 23/set/2008
89 Um arquivo nos termos do OAIS significa considerar os arquivos como organizaes de pessoas e sistemas, que aceitaram a responsabilidade de preservar a informao e torn-la disponvel, melhorando a comunicao e produtividade entre diferentes comunidades (CCSDS, 2002). O modelo de referncia no especifica um projeto ou qualquer tipo de implementao, mas ele est dirigido para organizaes que tm a responsabilidade de tornar a informao disponvel de longo prazo. Cada vez mais, comunidades esto adotando o modelo OAIS como uma estrutura para reunir atividades cooperativas entre diferentes reas de interesse. Vrias instituies esto usando a estrutura conceitual para metadados de preservao do OAIS para identificar seus elementos de metadados especficos, os componentes funcionais de sistemas de informao dedicados preservao digital: a Cornell University, as Bibliotecas Nacionais da Austrlia e da Nova Zelndia, On-line Computer Library Center (OCLC), Massachussetts Institute of Technology (MIT), entre outras. Mesmo proporcionando uma terminologia prpria que facilita a comunicao entre os envolvidos na preservao, o modelo de referncia no uma implementao especfica, mas proporciona uma lista de condies daquilo que deve ser considerado no estabelecimento de um projeto de preservao de qualquer tipo de documento, seja digital ou analgico. No modelo de referncia OAIS, o primeiro objeto o pacote de informao (packaging information); ele seria um recipiente que encapsula informao de contedo e de descrio para metadados de preservao e outros metadados. No esquema do OAIS, est includo um modelo de informao para insero dos metadados de preservao (ver Figura 10).
90
Figura 10 - Modelo de referncia Open Archival Information System (OAIS) ou Sistema Aberto de Arquivamento de Informao (SAAI) Fonte: Thomaz e Soares (2004)
No modelo, os objetos fsicos e digitais podem ser coletivamente referenciados como objetos de dados. Eles so interpretados pela combinao da base de conhecimento da comunidade-alvo e a informao de representao associada ao objeto de dados. O objeto de dados pode ser complementado com informao de representao, para ser entendido pela comunidade-alvo. No modelo OAIS existem dois grupos de objetos de informao (metadados) unidos e identificados pelo pacote de informao, categorias j definidas no Relatrio da CPA/RLG de 1996, so elas: 1. informao de contedo (content information): uma informao que o objeto primrio da preservao. Ela contm o objeto digital primrio e informao representada necessria para transformar esse objeto em informao com significado; 2. informao de descrio de preservao (preservation description information): qualquer informao necessria para preservar
91 adequadamente a informao de contedo com a qual est associada, acrescentando significado em quatro aspectos: 1) informao de referncia (reference information) (ex.: identificadores); 2) informao de contexto (context information) ex.: classificaes por assunto); 3) informao de provenincia (provenance information) (ex.: copyright, histrico); 4) informao de integridade (fixity information): documenta os mecanismos de autenticao; No esquema conceitual do OAIS atuam quatro entidades: produtores, consumidores, administrao e o arquivo propriamente dito, e existem seis entidades funcionais: recepo, armazenamento, gerenciamento de dados, administrao do sistema, planejamento de preservao e acesso (Figura 11) 16 .
Figura 11 Modelo funcional OAIS Fonte: Thomaz; Soares (2004)
16 PSI: Pacote de Submisso de Informao PAI: Pacote de Arquivamento de Informao PDI: Pacote de Disseminao de Informao
92 As entidades funcionais gerenciam o fluxo de informao entre as entidades que formam o ambiente OAIS e identificam os componentes funcionais dos arquivos relacionados com a preservao dos objetos digitais. No ambiente OAIS cada entidade responsvel por algum dos processos do sistema: 1) produtor: a pessoa ou sistema cliente que fornece a informao; 2) consumidor: a pessoa ou sistema cliente interessado no material arquivado ou por uma verso transformada da mesma; 3) comunidade-alvo: so os usurios potenciais, a serem reconhecidos para a realizao da meta maior da preservao de longo prazo. Com a norma OAIS, as instituies podem configurar sistemas responsveis pela preservao da informao de longo prazo e torn-la disponvel para uma comunidade de usurios. A definio dos componentes necessrios para a criao desses sistemas que o modelo proporciona serve para suportar uma gama de servios de preservao. Essa descrio est relacionada com as atividades de submisso, organizao e gerenciamento e acesso contnuo de um repositrio em funcionamento. Especificamente, o PAI (Pacote de Arquivamento de Informao) 17
contm o material a ser preservado e que ser conservado no repositrio, assim como a informao para sua representao. A conceitualizao do modelo OAIS serve para compreender os componentes necessrios para preservar e acessar informao de longo prazo. Essa descrio do arquivamento de objetos digitais serve para que instituies no arquivsticas participem efetivamente no processo de preservao, permitindo tambm: 1) efetuar comparaes entre arquiteturas, operaes, estratgias e metodologias de preservao; 2) estabelecer o mesmo modelo para informaes em formatos analgicos; 3) ampliar o consenso entre as partes comprometidas com a preservao digital, e, 4) guiar na identificao e produo de normas relacionadas com o modelo.
17 O PAI [...] uma forma concisa de fazer referncia a um conjunto de informao que tem em princpio, todas as qualidades necessrias para a permanente, ou indefinida preservao de longo prazo de um objeto designado de informao [..] (CCSDS, 2002 p. 33). Traduo nossa.
93 Um repositrio que segue as definies do modelo OAIS est obrigado a cumprir as seguintes responsabilidades: 1) negociar com os produtores de informao a aceitao dos critrios relacionados s caractersticas dos documentos (tipo, assunto, fonte, originalidade, singularidade, mdia, formatos, etc.) e a conformao com padres e polticas; 2) obter controle das informaes que garantem a preservao de longo prazo (propriedades e direitos autorais); 3) determinar as comunidades de usurios potenciais; 4) garantir a compreenso da informao fornecida; 5) seguir polticas de documentao de procedimentos para auxiliar na localizao dos originais; 6) definir as condies de acesso, distribuio e preservao do acesso. A administrao de um sistema de preservao que siga o modelo do OAIS deve acompanhar o desenvolvimento de padres para apoio, com isso ele ter a garantia de ser uma ferramenta na interoperabilidade entre bibliotecas e repositrios digitais. Suas funes principais de Recepo, Gerao de Pacotes de Arquivamento e Acesso so fundamentais na determinao da existncia, descrio, localizao e disponibilidade da informao armazenada no OAIS. No caso da Recepo dos PSI (Pacote de Submisso de Informao), a administrao deve definir os formatos, a forma de transferncia (harvesting ou convencional) e se ela ser para custdia. Nessa primeira etapa quando os PSI so transformados em PAI (Pacote de Arquivamento de Informao), reformatando os arquivos, convertendo os dados de representao e reorganizando as informaes de contedo. A administrao do PSI fundamental para a gerao de informaes descritivas (metadados) que facilitaro a recuperao dos PAI. Toda atualizao dever ser coordenada para uma correta transferncia de informaes novas dos PAI para a etapa de armazenamento de gerenciamento de dados. O armazenamento envolve a manuteno e recuperao dos PAI e sua incorporao na rea de arquivamento permanente. Na vasta lista de componentes, servios e funes de um OAIS, o acesso auxilia os consumidores a determinar a existncia, descrio, localizao e disponibilidade da informao armazenada. A gerao de um Pacote de
94 Disseminao de Informaes (PDI) facilita a solicitao e recebimento dos produtos de informao contidos nas bibliotecas e repositrios digitais. Coordenar um sistema OAIS para e-prints, de acesso livre, significa no apenas lidar com interfaces, pedidos de consulta, relatrios e pedidos de ajuda, mas representa lidar especialmente com as autorizaes para usurios de documentos digitais. Para Harnad (2003), alcanar o modelo OAIS no uma prioridade para os repositrios digitais de e-prints, mas sim, o fato de estar em concordncia com o protocolo dos Arquivos Abertos (OAI-PMH). Para a preservao digital de e-prints o modelo OAIS ilustra o tipo de atividades e complexidade de relaes por detrs de um repositrio digital. So as organizaes que devem determinar o tipo de sistema, parcerias e polticas de acesso a serem implementados para o estabelecimento e crescimento dos repositrios. Um repositrio que possui o protocolo de coleta de metadados da Iniciativa dos Arquivos Abertos e est em concordncia com o modelo de referncia OAIS pode oferecer garantias de acessibilidade de longo prazo, segurana e integridade, beneficiando o avano da pesquisa cientfica (HIRTLE, 2001; HITCHCOCK et al., 2007). Em 2002, o relatrio do OCLC/RLG apontava que um repositrio digital que estiver fundamentado no modelo OAIS deve estar baseado no Pacote de Submisso de Informao (PSI) que inclui tanto o objeto digital como os metadados necessrios. No primeiro momento, os objetos devem ser submetidos no repositrio como um PSI, o qual contm os objetos digitais e sua respectiva informao. Em seguida, o PSI reconhecido e encapsulado como um Pacote de Arquivamento de (PAI). O objeto digital original armazenado como um bitstream no PAI, junto com os metadados necessrios para que o bitstream seja entendvel e til como recurso digital. Para os pesquisadores da iniciativa OCLC/RLG e outros autores (STEENBAKKERS, 2001), toda publicao eletrnica contm trs elementos: o bitstream, o objeto lgico no bitstream e a funcionalidade necessria para decodificar esse formato lgico, sendo que cada um deles possui seus prprios critrios e requisitos de preservao. o caso do bitstream que s pode ser preservado se os bits forem copiados e o ambiente de armazenamento atualizado. Steenbakkers (2001) identifica trs normas principais para a preservao digital:
95 1. separar o documento do seu suporte original e armazenar o documento em um ambiente de arquivamento controlado; 2. o ambiente de arquivamento controlado deve ser construdo em concordncia com o modelo de referncia OAIS; 3. o ambiente de arquivamento ou sistema de depsito deve estar separado do ambiente computacional para publicao da instituio, enfocado em arquivamento e no em recuperao ou autenticao. Isto faz com que o sistema de depsito dure mais e torne-se capaz de ser atualizado assim que novas tecnologias forem surgindo. A estrutura conceitual do OAIS est construda para atender as necessidades desse ambiente de arquivamento digital, mas isso no evita que ela possa ser aplicada em qualquer tipo de objeto fsico (impresso ou digital), assim como tambm, ela no para um nico tipo de implementao ou sistema. Qualquer instituio pode ter mais de um arquivo OAIS com diferentes misses, objetivos e comunidades, apenas se faz necessrio que cada arquivo providencie todas as funes especificadas na norma, sendo possvel que algumas dessas funes sejam compartilhadas entre os arquivos e at entre diferentes organizaes, seguindo o modelo do OAIS. O desenvolvimento de um sistema de preservao baseado no modelo OAIS apresenta a dificuldade de no haver na literatura muitos exemplos; a informao que o prprio modelo oferece no suficiente, forando as organizaes a planejar como os componentes do sistema precisam ser includos. Uma das caractersticas do OAIS que ele no prov um conjunto de metadados, mas um modelo em que os padres de metadados devem ser propostos. Nesse sentido ele tanto um modelo funcional como um modelo de dados. Um exemplo disso a National Library of New Zealand, que criou seu prprio esquema de metadados de preservao [...] para encontrar um equilbrio entre os princpios expressos no modelo de informao do OAIS e os aspectos prticos da implementao de um conjunto de metadados de preservao que podem ser trabalhados [...] (NLNZ, 2003, p. 4). Os desenvolvedores do esquema de metadados de preservao da NLNZ identificaram algumas reas que devem ser estudadas: a) desenvolvimento de definies de dados para os elementos no esquema;
96 b) design do repositrio baseado nessas definies de dados, e c) desenvolvimento de ferramentas para extrao automtica de metadados para incrementar o repositrio. Alguns conjuntos de metadados esto sendo propostos para comportar o modelo OAIS, tais como: - padro de metadados da National Library of Australia; - especificao de Metadados CEDAR; - metadados da NEDLIB (Networked European Depository Library); - estrutura de metadados da OCLC/RLG (Online Computer Library Center/Research Libraries Group). Entre as iniciativas e sistemas que abordam o problema da preservao digital e que de alguma maneira seguem o modelo OAIS, encontram-se as seguintes (ver Apndice C): 1) CDPP (Centre de Donnes de la Physique des Plasmas) ; 2) DIAS (Digital Information Archival System); 3) DIOnAS (Data Ingest and Online Access Sub-System); 4) DiVA Project (Digitala Vetenskapliga Arkivet); 5) IMAGE project (Imager for Magnetopause-to-Aurora Global Exploration); 6) Iniciativa DSpace do MIT (Massachusetts Institute of Technology) 7) JSTOR (Journal Storage); 8) LOCKSS (Lots of Copies Keep Stuff Safe); 9) LOTAR (Long Term Archiving and Retrieval and Product Data within the Aerospace Industry). 10) MoReq (Model Requirements for the Management of Electronic Records) 11) Digital Archive (OCLC) 12) PANDORA (National Library of Australia) Com o nmero de iniciativas crescendo 18 , a deciso de qual sistema adotar deve levar em considerao as necessidades da comunidade de usurios do sistema. Uma experincia mencionada na literatura a da British Library. Em 2000,
18 O CCSDS continua informando sobre as atividades que o centro desenvolve relacionadas com o modelo, e uma lista de requisitos para repositrios nele baseados (http://nssdc.gsfc.nasa.gov/nost/isoas/).
97 a biblioteca, que recebe materiais digitais como depsito legal, por aquisio e digitalizao, precisou de um sistema que pudesse auxiliar no armazenamento, preservao e acesso de longo prazo a uma grande variedade de objetos digitais. Foi realizada uma definio inicial das especificaes funcionais para que o sistema estivesse em concordncia com os conceitos do modelo OAIS. Dessa forma, a British Library conseguiu apresentar s empresas um sistema adequado s suas necessidades. Houve dificuldades no incio devido ausncia de guias de implementao. 19
O modelo foi considerado perfeito pelo seu nvel de estruturao e justificativa poltica para o desenvolvimento de sistemas desse tipo, assim como pela adaptabilidade da terminologia de comunicao semelhante ao sistema que a instituio queria construir. Mesmo que o sistema aparente ser uma unidade, ele precisou da definio de seus limites uma vez que alguns dos seus componentes j existiam na instituio. Para isso, os processos foram analisados, encontrando-se seus equivalentes. Elaborou-se um glossrio com a finalidade de entender o modelo e sua terminologia e publicou-se o conjunto de elementos de metadados na Internet. A British Library divulgou que alguns grupos de metadados foram inspirados nos da Biblioteca Nacional da Austrlia, considerando os metadados do padro Dublin Core limitantes para seus propsitos. O conjunto de metadados definitivo foi de 30 elementos. Experincias, como a da British Library, mostram que algumas decises independem do Modelo OAIS. Como o caso do tipo de material a ser armazenado, sobre o local do armazenamento das informaes descritivas, de relacionamento entre objetos e se outros componentes do gerenciamento devem ou no ser includos. Em concluso, o modelo apresenta desafios para as instituies. Assim como ele pode ser considerado uma estratgia de preservao de longo prazo de informao digital, ele prov conceitos importantes e a adequao necessria dos componentes que podem chegar a ser desenvolvidos no futuro. Outra aplicao do modelo OAIS o projeto InterPARES 20 que surgiu dentro da comunidade arquivstica. A caracterstica principal desse modelo que ele
19 Disponvel em: Library of Congress. National Digital Information Infrastructure and Information Preservation Program (NDIIPP). http:/www.digitalpreservation.gov/ Acesso em: 10/09/2008 20 Disponvel em: http://www.interpares.org Acesso em: 13/out/2008
98 leva em considerao aspectos relacionados com os elementos intelectuais e fsicos, sob a perspectiva de quem os preserva (GREENAN, 2003). Tanto esses como outros projetos que usam o OAIS tm sua motivao nos interesses nas potenciais comunidades utilizadoras. O CCSDS produziu o documento Producer Archive Interface Abstract Methodology Standard (CCSDS, 2003) para prover uma estrutura geral para a relao entre o produtor e o arquivo. A metodologia no especifica apenas uma implementao, mas uma lista de requisitos a serem considerados no momento de negociar um acordo entre as partes. A primeira fase envolve o contato inicial, a definio preliminar do projeto e se ele praticvel; ele tambm identifica os objetos digitais e os padres que devem ser aplicados para que esses objetos possam ser identificados, assim como informaes sobre o nmero de itens, segurana, aspectos legais e contratuais, operaes de transferncia e validao. A segunda fase ou fase de formalizao inclui mais informaes sobre os objetos a serem transferidos, metadados especficos e a criao de um dicionrio de dados e um modelo formal. Aps a formalizao dos aspectos legais e as possveis mudanas gerenciais especificadas inicia-se a fase da transferncia, procurando-se testar e validar o sistema. Na seo final da Metodologia descrito como o sistema ser adaptado para criar um padro para uma comunidade especfica (SAWYER, 2002). Todas as iniciativas mencionadas indicam a necessidade de mais orientaes sobre a implementao do modelo OAIS. No existem na literatura muitos exemplos de projetos ou relatos de problemas encontrados, na sua aplicao em diferentes processamentos de informao em bibliotecas e arquivos. Existe sim a recomendao de que profissionais das reas da cincia da informao e arquivologia trabalhem junto com profissionais da informtica na implementao do modelo (GREENAN, 2003). Pelo fato de que o modelo OAIS pode atender a necessidades de comunidades individuais, no existem dois sistemas que sigam o modelo da mesma forma. Isso coloca o OAIS no como uma funo de preservao, mas como parte da administrao e do planejamento da preservao de documentos digitais.
99 2.3 PRESERVAO DIGITAL DA PRODUO CIENTFICA
2.3.1 Preservao digital e acesso livre
Acesso Livre (Open Access), segundo entendimento amplamente difundido na comunicao cientfica, significa a disponibilizao livre na Internet de literatura de carter acadmico ou cientfico, permitindo a qualquer pessoa ler, descarregar (download), copiar, distribuir, imprimir, pesquisar ou referenciar (links) o texto integral dos documentos. A expresso comeou a ser utilizada a partir do momento em que a quantidade de peridicos eletrnicos aumentou significativamente, surgindo, assim, os primeiros ttulos que permitiam o acesso gratuito ao seu contedo (ex.: PACS Review, Postmodern Culture, Bryn Mawr Classical Review). Entretando, Sally Morris, membro da Association of Learned and Professional Society Publishers, sugere uma definio mais simples, em que o acesso livre significa o acesso aberto a artigos cientficos sem restries para todos (MORRIS, 2004). A comunidade de especialistas dedicada ao estudo dos fenmenos da comunicao na cincia particularmente relacionados com o acesso livre parece ser unnime em concordar que se trata efetivamente de um novo modelo de comunicao cientfica. Nesse modelo permitido ao autor retomar o controle sobre o conhecimento que ele prprio gerou, sobre a integridade do seu trabalho e, paralelamente, a possibilidade de ser citado e reconhecido apropriadamente. As barreiras do acesso informao cientfica ficam limitadas apenas ao preo e s permisses associadas com o uso e direitos autorais (BUDAPEST OPEN ACCESS INITIATIVE, 2002). No Movimento do Acesso Livre informao cientfica a questo da preservao deve ser uma ao especfica orientada a dois tipos de objetos digitais diferentes, cujos requerimentos no podem ser considerados ao mesmo tempo que os da proviso do acesso. Com isso se quer dizer que cpias da verso final de artigos cientficos depositadas em repositrios digitais respondem necessidade primordial do acesso imediato aos resultados das pesquisas, diminuindo consideravelmente o tempo entre a produo do conhecimento e o seu uso por parte de outros pesquisadores.
100 Em contrapartida, a verso oficial publicada em peridicos cientficos deve ser objeto das aes de preservao de longo prazo. Desse modo, o problema da preservao continua sendo como garantir o acesso para esses originais por parte dos que podem pagar hoje e no futuro. Esse problema, em princpio, no possui relao com a problemtica das restries de acesso impostas aos pesquisadores e instituies que no podem pagar as assinaturas; para estes esto sendo criadas verses duplicadas autodepositadas em repositrios digitais, uma vez que, para a maioria dos 2,5 milhes de artigos publicados anualmente, no existem verses autodepositadas (HARNAD, 2007). Na perspectiva da OAI, o problema do acesso livre no a preservao de longo prazo, mas a proviso do acesso hoje. Transpor o problema da proviso para o da preservao futura outra forma de prolongar o fato de que 85% dos peridicos no esto provendo o acesso livre aos seus contedos.
2.3.1.1 OAI e a preservao do acesso de longo prazo
A Open Archives Initiative (OAI) possui relao com dois aspectos diferenciados. O primeiro diz respeito iniciativa que deu origem a uma nova perspectiva dos contedos digitais conectados na Rede de forma simples e federada, e o outro, relacionado com um protocolo de comunicao, OAI Protocol for Metadata Harvesting (OAI-PMH). Os dois respondem mesma misso, proposta em 1999 na propalada Conveno de Santa F (VAN DE SOMPEL; LAGOZE, 2000), cujos esforos eram desenvolver e promover padres de interoperabilidade para facilitar a disseminao eficiente de contedos. O OAI representa uma mudana de perspectiva dos padres de estrutura de dados para aquela dos protocolos de intercmbio de dados. A palavra Open refere-se viso da arquitetura dos dados e ao conceito de uma interface que possibilita o acesso a uma variedade de materiais provenientes de diferentes provedores de dados. Portanto, nesse sentido, ser livre no significa que ele seja gratuito. O termo Initiative, por seu turno, refere-se ao aspecto da governana da instituio que est por trs dos provedores de dados, uma idia que remete ao
101 governo de todas as partes constitutivas do corpo de instituies que suportam e promovem o intercmbio de dados. Com o surgimento de mais repositrios digitais, a OAI tem ganhado aceitao e contado com o apoio financeiro de vrias agncias internacionais (nos Estados Unidos sobressai-se a IMLS e na Inglaterra a JISC). J a expresso Archives advm da origem histrica dos repositrios de e-prints, utilizada como sinnimo de repositrios e sem conotao arquivstica. O OAI-PMH, lanado em 2001, o mecanismo que permite alcanar os objetivos dessa organizao (atualmente na verso 2.0), usado por instituies de todo o mundo. Mesmo tendo surgido dentro da comunidade cientfica para promover e manter o acesso on-line aos resultados das pesquisas acadmicas, o protocolo passou a ser de interesse de outras comunidades que lidam com arquivos digitais e redes de bibliotecas. O problema que a OAI enfrenta o compartilhamento de metadados de colees digitais e objetos digitais. O protocolo OAI tem sido usado, ainda, para coletar dados sobre objetos anlogos de bibliotecas e museus. At o momento, o OAI centraliza seus esforos apenas nos dados que podem ser coletados, e no com a coleta ou interoperabilidade entre contedos. Para tanto, os dados a ser coletados devem estar descritos em esquemas de linguagem XML; o protocolo trabalha com os metadados descritivos expressados no padro de metadados Dublin Core, no qualificado e simples como requisito. Outros padres de metadados ainda esto sendo estudados para serem adaptados ao protocolo no futuro. As comunidades que integram o OAI esto divididas em duas: as provedoras de dados interessadas em compartilhar dados e as provedoras de servios, interessadas em usar esses dados compartilhados. Uma instituio pode cumprir os papis das duas comunidades ao mesmo tempo. As solicitaes que o protocolo OAI lana so feitas como um pedido em HTTP, trazendo como resposta um XML que pode ser formatado em um registro de metadados descritivo ou apenas dar as informaes sobre determinado repositrio. Em contrapartida, o OAI ainda no permite o gerenciamento dos direitos autorais dos dados intercambiados, assim como tambm no prov o acesso aos contedos, apenas aponta para o local onde esto armazenados, e no suporta outros formatos de metadados que no sejam os do Dublin Core. A razo disso a
102 inteno dos desenvolvedores em manter o OAI simples para poder alcanar as suas principais metas. Para muitos especialistas, o esforo da OAI para que seja aberto o acesso aos contedos deveria ser o mesmo para que eles continuassem accessveis de longo prazo. Porm, uma das lies aprendidas com o protocolo que no necessrio pensar mais em grandes repositrios centrais (anlogos a bibliotecas). O protocolo permite que se pense mais em termos de pequenos arquivos distribudos unificados pelos mecanismos da interoperabilidade. Dentro da OAI alguns arquivos precisam de um tipo de metadados mais detalhados. No caso dos repositrios das verses, esse grau de detalhamento nos metadados apenas necessrio para depurar o acesso. Segundo Harnad (2007), a necessidade atual fazer com que os arquivos sejam interoperveis, via protocolo OAI, incluindo outros arquivos da mesma instituio, sem tentar forar todos a usar o mesmo esquema de metadados. Isso significa deixar que os esquemas detalhados de metadados trabalhem para a preservao digital, pois so eles os que precisam de mais tempo para implementao. Os repositrios institucionais deparam-se com o problema de gerenciar suas prprias colees on-line ou qualquer outro material que possuam, acarretando a sua preservao. Essa carga, no caso da literatura de peridicos por assinatura, aquela que deve ser compartilhada com bibliotecas universitrias e as editoras de literatura seriada. Essa afirmao pode ser relativa, uma vez que muitas editoras acreditam que o trabalho da preservao deve ser de responsabilidade das bibliotecas.
2.3.1.2 Acesso livre e a comunidade cientfica
O movimento a favor do acesso livre informao cientfica vem crescendo, os esforos empreendidos para tornar a informao cientfica acessvel a todos deixou claro que a preocupao com a preservao dos documentos digitais pertence ao grupo de motivos que poderiam fazer com que os pesquisadores e as editoras autodepositassem seus manuscritos originais. Para alguns autores, o
103 acesso livre aparenta favorecer a preservao digital da informao cientfica, mesmo que as implementaes da Iniciativa enfatizem e estejam focadas no acesso imediato. Nesse novo modelo de comunicao cientfica, a preservao considerada mais um requisito para o arquivamento em repositrios digitais do que uma necessidade urgente na construo dos repositrios institucionais (SUBER, 2003). A evoluo do movimento a favor do acesso livre tem revelado algumas interaes entre os papis de vrias comunidades envolvidas, entre elas: 1. a comunidade de pesquisadores (autores de artigos avaliados pelos pares, assim como seus leitores e usurios); 2. a comunidade de bibliotecrios de bibliotecas especializadas (os compradores e curadores do acesso de artigos de peridicos da comunidade de pesquisadores); 3. a comunidade de editores de peridicos cientficos (os administradores dos pareceristas, os certificadores desses produtos e os provedores de acesso a esses artigos, anteriormente em papel, mas agora tambm on-line); 4. os empregadores dos pesquisadores (universidades, instituies de pesquisa que se co-beneficiam da produtividade e impacto da pesquisa que eles financiam); 5. as agncias de fomento (que respondem para os contribuintes sobre o uso dos fundos e pela produtividade e o impacto da pesquisa e pesquisadores que eles beneficiam). Embora a comunidade cientfica tenha sido a primeira a descobrir o poder da mdia on-line para aumentar o uso e o impacto dos artigos avaliados, foi a comunidade das bibliotecas a primeira a direcionar a ateno para o escopo e a urgncia do problema do acesso pesquisa, resultado do problema dos custos/possibilidade financeira. Constata-se que so os pesquisadores, as instituies (de ensino e pesquisa) e os financiadores os nicos que se encontram na posio de resolver o problema do acesso/impacto. As instituies e as agncias de fomento so os que podem estabelecer mandatos de depsito compulsrio para seus pesquisadores (pelo seu prprio interesse e o interesse da pesquisa em si) do mesmo modo que
104 tm obrigado aos pesquisadores publicar os resultados de suas atividades cientficas. A comunidade da biblioteconomia e cincia da informao percebeu que existia o problema do impacto dos resultados de pesquisa e acesso, e que ele deveria ser atendido. Mas ela est sendo lenta em perceber qual o prprio papel na soluo do problema, considerando que a questo da falta de recursos no diz respeito ao problema do acesso/impacto. Como resultado, essa comunidade inadvertidamente torna-se parte do problema do acesso e do impacto, no lugar da soluo, questionando, no lugar de afirmando, a necessidade de prover o acesso imediato aos resultados das pesquisas. Nesse sentido, Harnad (2007) ressalta que h resistncia por parte dos bibliotecrios de que todos sejam apenas peridicos de acesso livre, mesmo que alcanar os 100% disso seja extremadamente lento, enquanto a via verde do acesso livre mais rpida, direta e segura. Harnad observa que a comunidade de bibliotecrios no deve perceber o acesso livre como um assunto relacionado com a aquisio de contedo, como so as colees das bibliotecas, mas deve encara-lo como assunto relacionado proviso. Os prprios autores das instituies so os provedores de contedo, mesmo que eles publiquem em peridicos de acesso livre ou em peridicos com acesso restrito, mas que autodepositem seus artigos nos repositrios digitais de suas instituies para, dessa maneira, torn-los contedos de acesso livre. Ao compreender que no se trata de um assunto relacionado com a aquisio e sim um tema de interesse da comunidade de pesquisadores, e, cientes desta necessidade, os bibliotecrios no apenas podem contribuir na reduo dos preos dos peridicos, mas, sobretudo, garantir que aquilo que j est em acesso livre continue permanentemente acessvel. Os bibliotecrios no devem trabalhar junto aos autores persuadindo-os a prover o acesso livre sua produo cientfica fazendo uso dos seguintes argumentos: a) isso diminuiria os custos com a aquisio dos peridicos; b) resolveria a crise dos peridicos, ou c) garantiria a permanncia das verses autodepositadas (suas verses publicadas j esto permanentes como nunca tinham sido), nem para reformar a lei de direitos autorais, entre outros. Para Harnad (2003), os pesquisadores e bibliotecrios no apresentam as mesmas motivaes para o progresso do acesso livre, so os pesquisadores os nicos que podem prover esse acesso e, portanto, isto deve ser enfatizado.
105
Mas a pior coisa que uma biblioteca pode fazer no lugar de promover o autodepsito para o acesso livre, levantar a bandeira das preocupaes com a preservao e falar das irrelevantes dvidas dos seus possveis depositantes. A preservao uma preocupao fora de lugar quando se fala de aumentar o acesso e o impacto da pesquisa. Se a biblioteca no tem recursos para contribuir com o acesso livre melhor no fazer nada agora, pois, agora melhor do que no ter nada agora, mesmo que o agora no seja para sempre (HARNAD, 2003). 21
Para os defensores do acesso livre, as bibliotecas poderiam usar seus fundos para fazer melhores negcios com as bases de peridicos pagos, depois investir o restante dos recursos comprando assinaturas institucionais em peridicos de acesso livre, promovendo a publicao nesses peridicos por parte dos seus autores institucionais e desenhando um acesso fcil para os peridicos de acesso livre pelos seus usurios. Isso no precisa de financiamento, apenas tempo por parte da equipe da biblioteca. 22
2.3.1.3 Autodepsito e preservao digital
Como foi mencionado, o objetivo do autodepsito no a preservao digital, mas sim o acesso e uso. O autodepsito compatvel com o trabalho em paralelo de qualquer meta de longo prazo, incluindo preservao e transio para a publicao de acesso livre. As verses de artigos cientficos depositadas pelos autores em repositrios digitais so apenas suplementos do artigo cientfico; elas no so verses que apresentam o problema da preservao, do qual os especialistas em preservao mostram estar preocupados. A verso oficial dos editores em XML/PDF a que apresenta esse problema. Desde a perspectiva do Movimento do Acesso Livre, a ateno com a preservao de longo prazo uma preocupao dos editores, das bibliotecas que assinam as bases de dados e das bibliotecas depositrias, e no dos autores. Apenas o acesso aos resultados das pesquisas, uso e impacto constituem as
21 Documento eletrnico. Traduo nossa. 22 Ex.: St Andrews University Library Disponvel em: http://eprints.st- andrews.ac.uk/proxy_archive.html. Acesso em: 20/set/2008
106 preocupaes dos autores, das instituies e agncias que financiam a pesquisa. Para Harnad (1999), essa a principal razo pela qual o autodepsito deve ser mandatrio. Portanto, temas que distraem e confundem os autores, tais como direitos autorais, avaliao pelos pares, reforma editorial e preservao devem ser deixados de lado em benefcio da promoo do acesso livre informao cientfica de fato. Segundo ele, declaraes e manifestos continuam declamando esses obstculos como se eles fossem parte da problemtica, quando, na realidade, o acesso livre significa apenas acesso on-line a artigos cientficos. No existe uma preocupao de preservao por parte dos pesquisadores na hora de autodepositar seus documentos. As estatsticas revelam que apenas 15% dos pesquisadores autodepositam sua produo cientfica. A Iniciativa dos Arquivos Abertos tem como meta chegar a 100% dos pesquisadores autodepositando seus trabalhos. Harnad (2007) 23 assegura que nenhuma sugesto que se faa para que os autores autodepositem seus documentos em repositrios institucionais conseguir ajudar no aumento das taxas de autodepsito. Levantar o interesse na preservao pode chegar a ser uma razo negativa e exigir um trabalho extra para a concretizao dessa ao. A prioridade para a Iniciativa dos Arquivos Abertos o autodepsito, que no deve ser negligenciada por outras prioridades arquivsticas, como a preservao digital. Para o acesso livre o problema no a preservao de longo prazo, mas a proviso para hoje. A razo do autodepsito para o acesso livre no preservar o artigo do editor nem substitu-lo. O propsito prover um suplemento dele, para aqueles que poderiam ser usurios e que no podem pagar pelo aceso verso proprietria do editor, com o fim de maximizar o uso da pesquisa e seu impacto. Harnad sugere que no se deve induzir as instituies de pesquisa e as agncias financiadoras a criar mandatos de autodepsito para fins de preservao da verso dos autores. Isto compatvel com a continuidade de um trabalho paralelo com metas de longo prazo, incluindo a preservao e a transio para a publicao em acesso livre. Trata-se de assuntos que ocorrem simultaneamente, mas que so distintos porque as solues de alguns podem no ser adequadas para outros.
23 Comunicao pessoal em 9 de julho de 2007, Belm, Par.
107 A mudana de paradigma, segundo Harnad, ser quando 100% dos artigos estiverem autodepositados, o que causar mudanas radicais no sistema de publicao atual. Tais transformaes foraro os editores a se tornarem apenas provedores de servios de avaliao pelos pares e certificadores de conhecimento cientfico, no lugar de serem provedores de acesso a produtos analgicos e digitais, como se verifica atualmente. Desse modo, no momento em que os editores cederem, por fora das circunstncias, a proviso do acesso e o arquivamento para as instituies dos autores, estas herdaro a misso de preservar as verses originais e no apenas aquelas dos contedos suplementares.
2.3.1.4 Preservao e preservao
Harnad (2003) distingue dois tipos de preservao: small-p preservation e large-P Preservation. Para ele, os repositrios institucionais realizam a chamada small-p preservation e continuaro a faz-lo. O motivo principal porque o acesso livre para conseguir o acesso imediato, portanto, a small-p preservation um meio necessrio para esse fim. Harnad chama de small-p preservation aquela na qual os repositrios de acesso livre garantem que o acesso aos contedos continuar para um futuro prximo. Dessa maneira, o problema no a preservao em si, mas sim a ausncia de 85% dos peridicos cientficos que podem no ser depositados porque os responsveis pelos repositrios continuam tornando o processo complicado. Se no existe contedo a ser preservado, a preservao simplesmente no acontece. Harnad cita, como exemplo, o caso do quadro La Gioconda. O original da obra de arte deve ser o objeto de preocupao pela preservao, e no as rplicas que so disponibilizadas para aqueles que no podem pagar para ir ao Museu do Louvre. Assim, enquanto os especialistas trabalham para resolver o problema de preservar o original, os visitantes de qualquer parte do mundo podem apreciar a rplica. O autor argumenta que [...] o pressuposto prover hoje acesso imediato aos possveis usurios do que esperar at encontrar uma forma de garantir que o acesso ser para sempre. Alguns autores acreditam que os pesquisadores precisam de um acesso permanente, mas no livre. O Movimento do Acesso Livre no sobre esforos para a digitalizao, sobre aumentar o impacto da pesquisa,
108 alm do que os autores imaginam. As nicas universidades que no tm interesse em aumentar o impacto das pesquisas so aquelas que no tm produo cientfica, nesses casos no um assunto que tenha a ver com dinheiro, mas com poltica. (HARNAD, 2003) 24
Alguns dos principais repositrios digitais baseados em arquivos abertos, como o Arxiv (fundado em 1991) e o CogPrints (fundado em 1997), atendem s necessidades de preservao digital, classificada por Harnad de small-p preservation. O contedo desses repositrios permanece acessvel sem nenhuma pretenso de que estejam atendendo a preservao denominada large-P Preservation, aplicada nos originais guardados pelas editoras. Isto ocorre, principalmente, porque a preservao no era o principal motivo para o autodepsito nesses repositrios. Em contrapartida, a large-P Preservation a Preservao como um fim em si mesma: como a motivao para o arquivamento em primeiro lugar; ou como uma necessidade urgente dos contedos efmeros e de contedos frgeis nascidos digitais; ou como uma responsabilidade para os provedores de contedo (provedores de peridicos) ou compradores de contedo (bibliotecas assinantes) ou preservadores de contedo (depsitos/bibliotecas que registram contedo) que precisam garantir a perenidade dos produtos que vendem ou que adquirem. Mesmo assim, segundo Harnad, absurdo imaginar que software como EPrints ignorem a small-p preservation ou que seu contedo um pouco plausvel de desaparecer amanh assim como qualquer outro contedo digital que tem sido conscientemente preservado e migrado e atualizado hoje, ainda que atualizado segundo os desenvolvimentos das estratgias de preservao (HARNAD, 2003) 25 .
A diferena entre preservao e Preservao est em que preservao no um fim por si s, ela apenas um meio para um fim (que o acesso imediato, assim como a proviso do acesso e uso), enquanto Preservao um fim por si mesmo. As verses e documentos suplementares autodepositados no requerem um tipo de preservao denominado de large-P Preservation. A preservao com p minsculo assegurada pelos arquivos de acesso livre e para um previsvel futuro. Harnad ressalta (2003) que quando todos os artigos avaliados pelos pares forem autodepositados, ento o p minsculo se converter
24 Documento eletrnico. Traduo nossa. 25 Documento eletrnico. Traduo do autor.
109 em P maisculo, pois o problema da preservao com p minsculo ser idntico ao problema da preservao com P maisculo. Ainda por algum tempo, a preservao digital, na perspectiva da OAI, dever continuar a ser aplicada aos originais guardados pelas editoras.
2.3.1.5 Tecnologias para o Acesso Livre
Argumenta-se, portanto, que a fuso da misso de preservao e arquivamento com a misso do acesso e proviso est adiando e esvaziando a motivao para a proviso do acesso livre, que a principal razo dos repositrios digitais, tais como aqueles construdos com plataformas, como o Eprints ou Dspace. Para o acesso livre o que est faltando a motivao por parte dos autores. As evidncias dos benefcios decorrentes do acesso livre, como o aumento do uso e do impacto dos resultados de pesquisa parece ainda no chegar at eles. Um dos fatores apontado como o principal estimulador do autodepsito nas instituies que criam seus repositrios digitais tem sido a elaborao e implementao de polticas mandatrias que obrigam o autodepsito por arte dos autores, e no unicamente o argumento de o acesso livre como mais uma camada na plataforma genrica institucional da preservao. Mesmo que softwares como o EPrints, Dspace e Fedora possam prover longevidade e acompanhem o desenvolvimento na rea da preservao digital, a motivao primeira no a preservao de longo prazo. Dos 2,5 milhes de artigos publicados anualmente nos mais de 24 mil peridicos existentes no mundo, 85% no esto sendo autodepositados, assim como no tm sido as edies anteriores desses peridicos. Os contedos, no entanto, no esto perdidos, pois continuam preservados nas verses proprietrias pelos produtores (editores) juntamente com as bibliotecas, suas compradoras. As ferramentas para repositrios institucionais no so originalmente destinadas a projetos de preservao digital. A motivao primordial no diz respeito garantia da longevidade dos contedos digitais, mesmo que elas acompanhem o desenvolvimento nas reas de preservao de longo prazo de contedos digitais. O contedo dos repositrios institucionais em ferramentas para repositrios digitais
110 pode ser preservado, mesmo que seu objetivo no seja a preservao, e principalmente, porque o contedo de acesso livre est em risco de no ser preservado devido ao fato de ele no estar sendo totalmente disponibilizado, sem restries.
2.3.2 Preservao de peridicos eletrnicos
Os peridicos eletrnicos esto deixando de representar apenas uma extenso da verso impressa, para serem uma garantia do acesso informao cientfica, e projetos de criao de arquivos de e-journals continuam aparecendo. As evidncias demonstram que as publicaes peridicas so mais facilmente acessveis nas novas mdias eletrnicas (via web), assim como esses formatos podem oferecer algum tipo de garantia de que estaro disponveis por muito mais tempo. A opo pela publicao eletrnica, disponvel desde os anos 1980, vem crescendo a cada dia. Em 2006 eram 14.338 ttulos de peridicos registrados no Ulrichs International Periodicals Directory, representando 62% de todos os peridicos referenciados nesse diretrio (os 38% restantes tinham verso apenas em papel). Os peridicos de acesso livre eletrnicos j eram 1.429. A Electronic Publishing Services, em estudo sobre o futuro das publicaes cientfica elaborado em 2003, projetou que, em 2016, a metade dos peridicos j ter migrado para a verso unicamente eletrnica; predizendo que as reas das cincias exatas, da sade e das tecnologias sero as primeiras a faz-lo (COUNCIL ON LIBRARY AND INFORMATION RESOURCES, 2006). No caso das bibliotecas no mundo, a EBSCO estima que as assinaturas de ttulos impressos das reas das cincias exatas, sade e das tecnologias, assinaturas de verses analgicas de peridicos sero superadas pelas assinaturas das verses on-line (BRUCE, 2005). Outros levantamentos mostram que 84% das bibliotecas universitrias do mundo cancelam a assinatura da verso impressa quando a verso eletrnica fica disponvel (HAHN, 2006). Pensar na necessidade de preservao dos peridicos eletrnicos significa captar o valor do artigo eletrnico quanto s ligaes que ele possui:
111 grficos e bases de dados multimdia. So elementos que tm se tornado partes intrnsecas da moderna literatura cientfica. As publicaes cientficas de universidades e instituies de pesquisa esto adotando os arquivos de acesso livre porque a informao que elas produzem est, na sua maioria, em formato digital, o que facilita a sua transferncia, a transposio do problema da obsolescncia da informao cientfica, assim como a criao de um espao para a produo e armazenamento dentro da prpria instituio. Trata-se da garantia da existncia de um avanado conjunto de servios no qual est includa, principalmente, a questo da preservao digital (CAF et al., 2003). No modelo atual de publicao cientfica, a preocupao dos responsveis pelas bibliotecas e centros de informao est na centralizao dos peridicos em poucas bases de dados, que detm o acesso e o controle das publicaes, sem permitir o direito a reter cpias digitais nas suas prprias instituies. A preservao digital de peridicos eletrnicos est dirigida especialmente a assegurar que seus contedos podero ser acessados sempre de alguma maneira. Os gerentes das bibliotecas precisam reconhecer que a preservao dos objetos digitais uma forma de gerenciar riscos e um direito ante o possvel descumprimento de acordo com as editoras e donos de bancos de dados. Para alguns editores, a preservao considerada uma extenso da sua misso com vistas a preservar o conhecimento de uma rea e justificar os recursos conseguidos para as suas atividades. Em torno das discusses sobre preservao digital de longo prazo, os peridicos eletrnicos aparecem sempre em primeiro plano. Isso se deve ao seu papel na comunicao cientfica e pelos interesses comerciais envolvidos. A soluo sugerida por vrios grupos de pesquisadores que sejam construdos repositrios digitais fora do controle dos editores e provedores de bases de dados comerciais para os peridicos, assim como para outros tipos de publicaes cientficas. Preservar peridicos eletrnicos uma responsabilidade dos editores e das bibliotecas depositrias. A aplicao de alguma das metodologias mencionadas depender da poltica de preservao que elas adotam. No caso das editoras que no permitem que nenhum dos seus autores e leitores copie e deposite verses dos artigos originais em repositrios institucionais, elas esto declarando a sua responsabilidade pela preservao e o acesso aos artigos de longo prazo. Alguns casos apresentam mais caractersticas restritivas ao acesso quando os editores
112 provem acesso temporrio apenas a arquivos criptografados, criando maiores dificuldades de recuperao, se porventura a editora fechar. No caso especfico de peridicos cientficos de acesso livre, quando o editor permite aos autores o autodepsito da verso final dos autores como suplementos da verso final em repositrios digitais, essas verses no substituem os originais. Os suplementos autodepositados servem apenas para prover o acesso imediato e contnuo para aqueles que no tm como pagar o acesso verso final. Eles no funcionam como mecanismo de preservao da verso oficial, mesmo que nesse aspecto cheguem um dia a servir para ajudar tambm. As iniciativas de Acesso Livre parecem beneficiar a preservao digital dos peridicos cientficos, mas a motivao principal delas o acesso. Tanto para Suber (2003) como para Harnad (2007), a preservao de longo prazo, assim como o autodepsito em repositrios, apenas um dos vrios requisitos para o acesso livre. Na viso do Movimento da OAI, esses requisitos no esto inerentemente unidos, pois, ao coloc-los juntos, corre-se o risco de sobrecarregar o conceito principal (acesso livre) e retardar sua implementao com condies que a Iniciativa realizar. A discusso continua sobre se a preservao parte essencial ou no do acesso livre. Segundo Suber (2003), as grandes iniciativas de acesso livre diferem na incluso ou no de medidas para garantir a preservao de longo prazo. Para esse autor, a Declarao de Bethesda e a da BioMed Central (BMC) incluem a preservao, enquanto as de Budapest Open Access Initiative (BOAI) e a da Public Library of Science (PLoS) no o fazem. Suber tambm afirma que, o acesso livre, apesar de estar enfocado na disseminao imediata, atua como catalisador da necessidade de preservao de longo prazo, sem as restries dos direitos autorais. Nas estatsticas do Movimento dos Arquivos Abertos, entre 10% e 20% de todos os peridicos cientficos no mundo j possuem algum tipo de poltica de autodepsito para as verses suplementares, e mesmo esses peridicos precisam enfocar os objetivos reais da preservao para as suas verses proprietrias originais. Com o crescimento do nmero de solues para a criao e gerenciamento de peridicos de acesso livre, os editores cientficos no precisam se preocupar com a necessidade de aumento da visibilidade, uso e impacto dos seus contedos. A ateno desses editores com a preservao deve recair agora nas
113 potencialidades dessas solues com relao ao arquivamento das verses originais.
2.3.2.1 Arquivamento de peridicos eletrnicos
No uso de programas proprietrios e que podem tornar-se obsoletos, os editores enfrentam o problema de que a deciso de autorizar a migrao para um novo formato no entre em conflito com os direitos autorais aceitos pelos autores dos artigos. Algumas grandes bases de revistas, como a Elsevier, j manifestaram a promessa de manter os arquivos originais preservados. O arquivamento do peridico eletrnico uma das tarefas editoriais que precisa de uma poltica clara para a criao de cpias arquivveis. As cpias em papel esto diminuindo como opo de back-up e o fator da redundncia no considerado por muitos editores. As editoras de universidades americanas, sob auspcios de instituies de fomento, como a Mellon Foundation, tm trabalhado em projetos com editores individuais e por rea de conhecimento, para estudar as principais caractersticas das mudanas que as verses eletrnicas envolvem e as ferramentas de software mais apropriadas para o arquivamento dos seus originais. Algumas dessas iniciativas tm optado por metodologias para garantir a permanncia dos formatos dos arquivos, como a do servio Electronic Journal Platform da American Institute of Physics (AIP, 2003), que permite que vrios documentos sejam criados a partir da marcao em SGML ou de uma DTD, colocando uma verso em formato ASCII para ser disponibilizada em processos de preservao no futuro. Outras iniciativas de preservao digital de peridicos cientficos tm optado pela metodologia da migrao cclica. Como a American Geophysical Union, que em 1996 criou um fundo para a manuteno e atualizao das verses eletrnicas dos peridicos da rea. Tambm a American Astronomical Society usa parte dos recursos financeiros arrecadados com as assinaturas para apoiar os processos de migrao da verso eletrnica da sua publicao, a cada cinco anos. Vrias instituies em pases desenvolvidos tm financiado projetos para a criao de repositrios digitais de peridicos eletrnicos. Em 2001, um projeto da
114 Harvard University Library foi financiado pela Andrew W. Mellon Foundation, com o objetivo de analisar os mecanismos por meio dos quais os peridicos eletrnicos devero ser selecionados para serem preservados, assim como outros assuntos relacionados com o acesso de longo prazo. A proposta desse projeto mostrar a importncia da integrao das iniciativas em programas de preservao que operem em conjunto (HARVARD, 2000). Dentro desse mesmo projeto foi realizado um estudo que indicava o desenvolvimento de uma DTD comum para todos os peridicos eletrnicos, mas percebeu-se que ela teria limitaes devido s especificaes de cada rea de conhecimento (INERA, 2001). Em 2003, um estudo da Association of Learned and Professional Society Publishers mostrou que 52% dos editores comerciais e 45% dos editores no comerciais entrevistados j usavam algum tipo de soluo para cumprir com a sua responsabilidade de preservao de longo prazo. Mesmo assim, para as editoras comerciais, os direitos autorais continuam nas mos dos editores, e por serem eles os beneficirios comerciais, tornam-se os responsveis pelo seu controle e preservao. Alguns sistemas como o Journal Storage: The Schorarly Journal Archive (JSTOR) e o Lots of Copies Keeps Staff Save (LOCKSS) foram citados. Segundo a pesquisa, os editores comeam a perceber os benefcios econmicos que traz o reuso dos contedos das suas publicaes (COX; COX, 2003). Internacionalmente reconhecida, a base de dados JSTOR o resultado de um consrcio entre instituies de ensino superior (IES) e institutos de pesquisa, promovido por uma organizao independente, sem fins lucrativos, estabelecida nos Estados Unidos, desde 1995. A proposta do JSTOR armazenar e tornar disponvel o texto integral de colees eletrnicas retrospectivas (backfiles) de peridicos, a partir do primeiro nmero. O servio pago e o perodo de abrangncia de cada revista varivel.
2.3.2.2 LOCKSS
Um dos projetos direcionados a esse objetivo o Lots of Copies Keep Stuff Safe da Stanford University (LOCKSS, 2003). O mtodo de arquivamento desse projeto est direcionado para conservar a integridade das publicaes
115 eletrnicas mantendo cpias em vrios endereos eletrnicos (sites), conferindo periodicamente todas as cpias para verificar a congruncia da informao armazenada. A soluo LOCKSS procura minimizar o grau de impacto que um desastre possa causar em um nico arquivo digital. Depois de cinco anos de testes, em 2004 a Stanford University lanou o LOCKSS com o apoio financeiro da National Science Foundation (NSF), da Sun Microsystems e da Mellon Foundation. Desde ento, uma corporao LOCKSS prov suporte tecnolgico e para o gerenciamento das colees digitais (REICH, 2003). O funcionamento do software livre LOCKSS precisa de uma infra-estrutura de hardware de custo reduzido e uma administrao tcnica mnima. Considerando o alto custo do armazenamento em repositrios, uma metodologia como a do LOCKSS muito importante para os pases em desenvolvimento, onde a maioria das instituies carece de financiamento para as atividades relacionadas com a preservao digital de publicaes cientficas. A soluo permite que os leitores autorizados tenham acesso s edies eletrnicas dos peridicos, respeita os direitos das editoras e no aumenta o oramento das bibliotecas (REICH; ROSENTHAL, 2001). Ela compreende: 1) a preservao atravs da replicao distribuda; 2) a aplicao de uma tecnologia de apurao de dados pelos pares; 3) o uso do repositrio como ncleo das atividades; 4) a incluso de quatro das seis entidades funcionais do modelo OAIS: Recepo, Administrao, Armazenamento e Acesso. 26
O modelo LOCKSS foi desenhado para criar um sistema descentralizado de publicao e acesso permanente na web, apoiado na redundncia de sistemas distribudos para preservar os contedos, seu acesso e a habilidade de entender seus bits. A preservao digital que o LOCKSS permite no se reduz disponibilizao perptua dos materiais armazenados, mas se estende s funes que garantem a preservao da propriedade intelectual dos documentos em qualquer formato digital. Os responsveis pelo seu desenvolvimento adquirem e disponibilizam cpias das publicaes de uma forma anloga da biblioteca, com
26 Declarao de Conformidade com o a norma OAIS/ISO 14721:2003 Disponvel em: http://www.lockss.org/lockss/OAIS Acesso em: 15/set/2008
116 uma diferena: os registros no so descartados e seu acesso salvaguardado (LOCKSS, 2007). Com o LOCKSS, as instituies que assinam peridicos cientficos podem escolher a preservao dessas publicaes, criando verses (caches) persistentes e autorizadas de baixo custo dos contedos que elas assinam. O servidor LOCKSS guarda permanentemente as verses que ele coleta das novas edies, comparando-as de forma lenta com os contedos de outras verses mantidas em diferentes bibliotecas, corrigindo e detectando possveis erros nos arquivos de qualquer um dos repositrios que formem uma rede cooperativa de rplicas LOCKSS (Figura 12).
Figura 12 Exemplo de monitoramento de caixas LOCKSS Fonte: Projeto LOCKSS 27
recomendado que o uso dos repositrios ou caixas LOCKSS (LOCKSS, 2007) esteja sob a responsabilidade de bibliotecas que garantam o acesso a peridicos cientficos na Internet. O sistema permite que as bibliotecas
117 voltem a tomar a custdia das revistas para fins de preservao, mesmo que os editores deixem de public-las tanto na verso impressa quanto na eletrnica. Um compromisso se estabelece entre as editoras e as bibliotecas para que as instituies possam coletar, armazenar, arquivar e preservar contedo autorizado e salvaguardar o acesso das suas comunidades. Dessa maneira, o modelo LOCKSS refora o controle de acesso por parte dos editores, sem mudar os seus modelos de negcios, sejam eles restritos ou abertos. Os editores permitem que as caixas do LOCKSS funcionem, publicando um termo que registra a sua aprovao para que o processo ocorra. Nos novos sistemas de gerenciamento eletrnico de editorao, como o Open Journal Systems (OJS/SEER) o termo j est incorporado, deixando ao editor a deciso de permitir que as caixas LOCKSS consigam identificar o endereo de IP e os contedos autorizados.
2.3.2.3 Gerenciamento editorial e preservao digital
A preservao digital comea a ser considerada uma extenso da misso das publicaes cientficas com vistas a preservar o conhecimento de uma rea e justificar os recursos conseguidos para suas atividades. O trabalho de coletar e preservar materiais para o acesso futuro normalmente no de responsabilidade direta do cientista ou do criador do material. Esse um problema do editor e das bibliotecas que tm de preservar materiais por muitos anos. Raramente profissionais que no so bibliotecrios ou arquivistas sabem dessa tarefa, at o momento que os documentos comeam a sofrer danos ou so perdidos. Na ltima dcada tem crescido o nmero de solues para criao e gerenciamento de peridicos; com isso, os editores cientficos no precisam se preocupar com a necessidade de aumento da visibilidade, uso e impacto dos seus contedos. A preocupao desses editores com a preservao recai agora nas potencialidades dessas solues com relao ao arquivamento das verses originais. Tanto na oferta de solues comerciais como na de software livre para a editorao eletrnica de revistas, a variedade oferecida aumenta a cada dia. O objetivo de todas elas est orientado a ajudar no cumprimento das tarefas editoriais
118 e na visibilidade das etapas da edio. As caractersticas que esses softwares possuem em comum so as seguintes: 1. cadastro de todos os usurios do sistema; 2. produo de relatrios e estatsticas de uso; 3. adaptabilidade ao processo editorial de cada publicao; 4. suporte tcnico profissional; 5. produo e envio automtico de mensagens; 6. submisso de trabalhos on-line; 7. variedade de formatos de publicao; 8. aplicativos opcionais. Entre as ferramentas que surgiram na ltima dcada e que favorecem a edio completa de artigos cientficos na web, esto as relacionadas no Quadro 4.
Nome Ano Inicial Software Livre Software Proprietrio Instituio/Empresa Open Journal Systems (OJS/SEER) 1998 X British Columbia University, Fraser University OpenACS 1998 X ArsDigita SciX Open Publishing Services (SOPS) 2001 X University of Ljubljana (Slovenia) Article System 2002 X Sourceforge.net TOPAZ 2003 X Edgewall Software Digital Publishing System (DPubS) 2004 X Cornell University Library GAPworks 2005 X German Academic Publishers Hyperjournal
2005
X
HyperJournal Association
EdiKit 1999 X Berkeley electronic Press EJPress 1999 X eJournalPress Electronic Submission and Peer Review (ESPERE) 2000 X Electronic Libraires Programme (eLib) of the Higher Education Founding Council for England (HFCE) Rapid Review 2000 X Cadmus Journal Services Bench>Press 2001 X HighWire Press, Stanford University Libraries Manuscript Central 2001 X ScholarOne da Thompson Business Xpress Track 2001 X XpressTrack Editorial Manager 2001 X Aries Systems Corp. Allen Track 2002 X eJournalPress.com Quadro 4 Ferramentas para editorao eletrnica de revistas
O Open Journal Systems (OJS), software livre, de fonte aberta, desenvolvido pelo Public Knowledge Project originrio da British Columbia University (Canad) foi personalizado e traduzido pelo Instituto Brasileiro de Informao em
119 Cincia e Tecnologia (Ibict), com o nome de SEER (Sistema Eletrnico de Editorao de Revistas). O instituto presta assistncia aos editores em cada uma das etapas do processo de editorao e pode ser adaptado de acordo com as prprias polticas de publicao (MRDERO ARELLANO, 2004). o primeiro software em portugus de editorao eletrnica que possui o protocolo OAI para intercmbio de dados essenciais (metadados) e que contem mecanismos para a preservao de seu contedo em conjunto com o projeto LOCKSS (Figura 13).
Figura 13 - Pgina do OJS/SEER opo Arquivamento da Revista no LOCKSS Fonte: Portal do SEER 28
Outro passo importante tem sido o que as associaes de editores de peridicos cientficos e de pesquisa, como a International Union of Pure and Applied Physics (IUPAP), tm recomendado aos pesquisadores, editores e bibliotecrios da rea que desenvolvam formas de registro dos documentos que incluam informaes sobre hardware e software para que isso sirva como uma ajuda em casos de possveis migraes ou risco de perda dos dados e o uso de XML e outros formatos padro apropriados rea (SMITH, 2001).
120 Os sistemas de gerenciamento editorial tm encorajado os editores a usar linguagens de marcao e esquemas XML para permitir que o material seja extrado, integrado a outros servios, provendo aos aplicativos da web 2.0 os contedos que os usurios obtm sob demanda (MORGAN, 2000). Os editores que optam por sistemas baseados em SGML/XML esto disponibilizando formatos prprios para a preservao como parte de seu processo normal de editorao.
2.3.3 Preservao digital em repositrios digitais
As bibliotecas, atravs do tempo, tm cumprido a misso de permitir a descoberta e a entrega de material acadmico, mas elas no podem oferecer aquilo que no coletam ou mantm. As bibliotecas na iternet so importantes para os pesquisadores porque viabilizam a descoberta do que foi catalogado e publicado on- line. Para organizar os documentos com informaes cientficas em uma biblioteca digital, os profissionais da informao preparam metadados (descritivos, estruturais e de preservao), arquivos para preservao, arquivos para acesso, diretrios, projetos de documentao e repositrios de objetos digitais, seguindo prticas adequadas de descrio. As bibliotecas digitais, os repositrios digitais e os peridicos de acesso livre esto requerendo mudanas em seus usurios, no que se refere s prticas de trabalho e participao no esforo global, para definir e classificar seus documentos segundo novos modelos de comunicao cientfica. O estudo da preservao digital nas subreas da cincia da informao tem passado do reconhecimento de sua necessidade e da sua definio, para abordagens mais tcnicas e propostas de aes mais claras. Para alguns especialistas, as bibliotecas digitais so consideradas o caminho mais adequado para a preservao dos recursos de informao (HILDRETH, 1995). Lesk (1997) resume essa afirmao destacando que as bibliotecas digitais so meios mais dinmicos para as atividades de preservao digital do que as bibliotecas tradicionais, considerando a sua adaptao s freqentes mudanas tecnolgicas. Em contrapartida, pesquisadores de vrios projetos que envolvem softwares para repositrios digitais asseguram que os repositrios institucionais so
121 os lugares adequados para testar e formular as metodologias e polticas a serem adotadas pelos provedores de informao cientfica. O argumento no qual eles se baseiam que os repositrios para preservao de objetos digitais devem estar localizados em instituies confiveis e capazes de armazenar, migrar e dar acesso a colees digitais (OCLC/RLG, 2002). Os responsveis pelos acervos digitais confiam nos repositrios institucionais poder preservar e dar acesso a material no apenas publicado em peridicos avaliados pelos pares, mas tambm literatura cinzenta, como teses, relatrios, documentos governamentais e, ainda, materiais suplementares, conjuntos de dados, imagens, visualizaes e simulaes, comunicao informal como e- mails, blogs, podcasts, websites, wikis e apresentaes. Atualmente, os repositrios digitais podem integrar ferramentas de preservao digital, ou aquelas que sejam equivalentes nessa funcionalidade. Uma instituio pode tambm optar por definir um tipo de workflow que integre ferramentas em determinados momentos do processo. Entre as ferramentas atualmente disponveis esto as seguintes: a) as que geram e capturam metadados: NLNZ metadata extractor; 29
b) as que identificam e avaliam os formatos de arquivo: JHOVE 30 e DROID 31 ; c) as que padronizam arquivos para formatos preservveis ou formatos abertos para a preservao: XENA 32 da National Archives of Australia, entre outros. Esses so alguns exemplos de sistemas e solues tecnolgicas que esto sendo testados e que so considerados padres de preservao digital pela comunidade cientfica, mas os pesquisadores esto muito distantes de uma automao completa em sistemas de preservao digital.
Segundo Webb (2000), as bibliotecas tradicionalmente so responsveis por manter colees para uso permanente, protegendo-as de ameaas, ou salvando-as e reparando-as para compensar seus impactos. No mundo das bibliotecas digitais, um desafio importante a ser enfrentado a capacidade de poder acolher diferentes tipos de formatos inovadores, assim como o planejamento de suas adaptaes no futuro. Uma biblioteca digital pode incluir inmeros programas e aplicativos usados para criar e estruturar uma coleo digital. So softwares e sistemas que servem para gerenciar e administrar esses recursos digitais, antes de serem depositados e publicados. Essas ferramentas influenciam a maneira como os documentos sero preservados e os respectivos custos envolvidos no processo. Os sistemas informatizados para bibliotecas digitais atuais requerem acentuado esforo de gerenciamento de colees digitais, que vai alm das tarefas tradicionais das bibliotecas (ex.: aquisio, seleo, classificao, arquivamento), na construo da interoperabilidade de acervos digitais (arquiteturas, metadados, formatos padro), a qual possvel por meio de sistemas relacionados e desenvolvidos para propsitos e comunidades especficas (ARMS, 2000). Para Borbinha e Correia (2001), a biblioteca digital apresenta um dos primeiros agrupamentos dos requisitos associados com as atividades tradicionais de preservao como possvel acompanhar no Quadro 5.
123 Aquisio Entrega pelo produtor Captura pela biblioteca Coletado pela biblioteca Verificao Integridade fsica (meio) Integridade do contedo Integridade lgica Autenticao Registro Metadados Descrio bibliogrfica Instalao e manipulao Acesso Preservao Preservao Preservao fsica Refrescamento do meio Migrao de suporte Preservao lgica Converso de formatos Emulao Preservao intelectual Acesso Condies de uso Acesso local Acesso remoto Quadro 5 - Estratgias de preservao no fluxo dos objetos digitais na biblioteca digital Fonte: Borbinha e Correia (2001)
Esses autores mencionaram que, entre as responsabilidades de preservao de uma biblioteca digital, esto as relacionadas com os seguintes aspectos: a) converso de formatos digitais; b) tratamento dos metadados; c) usabilidade dos dados disponibilizados; d) infra-estrutura para manuteno dos sistemas; e) desenvolvimento de software; f) estruturao dos mecanismos de pesquisa; g) consultoria sobre recursos digitais. Entretanto, a preservao digital em mos das bibliotecas nacionais evidencia outros subconjuntos de responsabilidades: a) publicar: depsito externo, edio digital local, digitalizao e metadados estruturais; b) registrar e preservar: armazenamento, gesto de identificadores e catalogao;
124 c) acessar: local e remotamente; d) disseminar e pesquisar: catlogos on-line, ndices temticos (Web Services, OAI-PMH, Z39.50). Seja qual for o tamanho ou a importncia da biblioteca, verifica-se uma diferena entre os repositrios e as bibliotecas digitais. Os repositrios de informao digital so responsveis coletivamente por garantir, por meio de alguma estratgia de preservao, a integridade e o acesso de longo prazo da herana social, econmico-cultural e intelectual de um pas na forma digital. Uma biblioteca digital um repositrio que coleta e prov acesso informao digital, mas pode tambm no garantir o armazenamento de longo prazo e o acesso informao. Muitas bibliotecas digitais podem ou no ser repositrios digitais, mas os repositrios digitais realizam algumas funes de biblioteca digital pelo fato de elas tambm selecionarem, obterem, armazenarem e proverem acesso informao digital. Especificamente na rea de preservao digital, os repositrios digitais so considerados parte da infra-estrutura de servios de uma biblioteca digital.
2.3.3.2 Repositrios Digitais
Um repositrio digital um servio de armazenamento de objetos digitais que tem a capacidade de manter e gerenciar materiais por longos perodos de tempo e prover o seu acesso apropriado. Os repositrios digitais dividem-se em temticos, institucionais e centrais. Os repositrios temticos cobrem determinada rea do conhecimento. J os repositrios institucionais (RI) so sistemas de informao que armazenam, preservam, divulgam e do acesso produo intelectual de instituies e comunidades cientficas, em formato digital, enquanto os repositrios centrais so provedores de servios nacionais e internacionais que permitem a reunio de dados coletados tanto de bibliotecas digitais, quanto de repositrios temticos e repositrios institucionais. O propsito dos repositrios estaria dirigido a dois aspectos: o acesso e o armazenamento. As universidades de vrios pases esto adotando esta forma de publicao para apoiar a divulgao dos resultados de pesquisas cientficas, criando
125 polticas institucionais para legitimar os repositrios de acesso livre como detentores de produo cientfica reconhecida por rgos de fomento (LYNCH, 2003). Os repositrios digitais compreendem um conjunto de ferramentas necessrias para os produtores, disseminadores e usurios de documentos digitais. Os projetos de preservao digital devem atender a pr-requisitos e serem parte de um processo transparente de disponibilizao a longo prazo dos objetos digitais. Os desenvolvedores desses projetos so responsveis pela aplicao dos padres reconhecidos internacionalmente de preservao digital. J em 1996, a Task Force on Archiving of Digital Information da Commission on Preservation & Access (CPA) e a RLG analisou as possibilidades dos repositrios digitais, chegando s seguintes concluses: a) com a finalidade de preservar a longo prazo a informao digital, em uma escala adequada demanda da pesquisa cientfica no futuro, as instituies requerero uma infra-estrutura apropriada capaz de suportar um sistema de distribuio de arquivos digitais; b) um componente crtico da infra-estrutura de arquivamento digital a existncia de um nmero suficiente de organizaes confiveis capazes de armazenar, migrar e prover acesso s colees digitais (WATERS & GARRETT, 1996 p. 46). A gnese dos sistemas para repositrios digitais ocorreu no final do ano 2000, quando a University of Southampton na Inglaterra, lanou o pacote de software chamado EPrints. Desde ento, o movimento para a construo de repositrios digitais tem crescido consideravelmente, motivado pela convergncia entre a reduo dos custos no armazenamento on-line, a proliferao da banda larga e das tecnologias de redes de gigabits e o desenvolvimento de padres de metadados para descrever o contedo dos repositrios. As caractersticas principais dos repositrios para objetos digitais foram mencionadas por Stewart Granger (2002) como aquilo que formaria a infra-estrutura profunda, relacionada com toda a parte organizacional, aspectos legais e culturais, assim como toda a parte tecnolgica. Para ele, o problema principal est em que essa infra-estrutura realmente responda s necessidades da instituio e de seus usurios, e no apenas as das empresas que comercializam essas tecnologias. Para que isso seja possvel, ele menciona a necessidade de que existam
126 repositrios certificados, assim como mecanismos de colaborao que facilitem o intercmbio entre a comunidade envolvida no tratamento de materiais digitais. Esses repositrios incentivam o autodepsito e publicao na rede gerenciada pelo pesquisador (self-archiving), utilizam novas tecnologias abertas (open source), tornando disponveis as informaes para serem acessadas permanentemente por diversos provedores de servios em nvel nacional e internacional. 33 Tal mudana na publicao cientfica iniciou-se com a constituio dos chamados repositrios digitais temticos. A idia evoluiu para o agrupamento desses repositrios sob a responsabilidade de instituies centradas na divulgao da produo cientfica local (CAF et al., 2003). O crescimento do nmero de repositrios digitais no mundo est sendo acompanhado pela Iniciativa dos Arquivos Abertos, como mostra a Figura 14.
Figura 14 - Crescimento dos arquivos/repositrios 34
33 Ainda na sua fase inicial, poucos repositrios tm alcanado tamanho e importncia considerveis. Entre os principais esto Fedora (Flexible Extensible Digital Object and Repository Architecture), CDSWare, Eprints, Archimene, ARNO, iTor, MyCoRe. Alguns provedores de servio baseados no Protocolo OAI, que permitem a busca em mais de 250 arquivos abertos, so Arc, Citabase, MyOAI, Perseus, Scirus, OAIIECSP, Callima, CYCLADES, OAIster, SAIL-eprints, TORII e PKP. Um dos primeiros projetos de repositrios temticos foi o JSTOR (The Scholarly Journal Archive URL: http://www.jstor.org/), criado para servir, apenas, como repositrio de preservao digital de peridicos cientficos de algumas reas.
Como demonstra a Figura 14, o aumento do nmero de repositrios digitais comeou a ser expressivo a partir de 2002, o que se deve ao aparecimento de sistemas para repositrios institucionais e seu impacto na infra-estrutura das bibliotecas digitais existentes.
2.3.3.3 Repositrios Institucionais
Desde suas primeiras implementaes, os repositrios institucionais tm sido voltados para a informao cientfica, contendo os trabalhos de pesquisa e ensino de comunidades acadmicas, assim como a documentao de ampla variedade de atividades das prprias universidades. Os repositrios institucionais podem ser pensados como parte de uma ao dentro da gesto documental, que inclui sua criao, tratamento, transmisso e acesso. Crowe (2002, p. 4) define os repositrios institucionais como [...] um arquivo digital de produtos intelectuais criados por uma comunidade de pesquisadores, estudantes e professores de uma instituio [...]. Para Lynch (2003), eles representam servios e um compromisso: Segundo meu ponto de vista, um repositrio institucional acadmico um conjunto de servios que a universidade oferece para os membros da sua comunidade, para o gerenciamento e disseminao do material digital criado pela instituio e pelos seus membros. essencialmente o compromisso de uma instituio de cuidar do material digital, incluindo a preservao a longo prazo, quando apropriada, a organizao, acesso e distribuio. (LYNCH, 2003 s/p.).
O primeiro impacto que os repositrios institucionais causaram foi a criao de bibliotecas digitais de teses e dissertaes, que permitiu que outros documentos pouco divulgados por essas instituies fossem includos nos repositrios. Regularmente so materiais importantes para as equipes e empregados dessas organizaes. A misso dos repositrios institucionais ficou centralizada na produo, manuteno, distribuio e preservao de grande variedade de recursos de informao em rede para pesquisadores, professores e estudantes de dentro e fora de uma instituio. A primeira abordagem oficial a respeito dos repositrios institucionais foi da Association of Research Libraries, na qual so mencionados alguns exemplos
128 (CROWE, 2002). Nos Estados Unidos, o governo tem usado repositrios institucionais h muito tempo (Defense Technical Information Center, Department of Energys Office of Scientific and Technical Information, NASA Center for AeroSpace Information, National Technical Information Service e a Government Printing Office). Na Europa, um dos primeiros pases a adotar os repositrios institucionais foi a Frana, no seu Institut de lInformation Scientifique et Technique (INIST-CNRS). Na dcada de 1990, diferentes tipos de organizaes comearam a armazenar eletronicamente ampla variedade de materiais, resultando em grandes repositrios que precisam ser agora preservados. A responsabilidade de se ter optado por usar repositrios digitais vem crescendo, junto com a necessidade de preservar por longo prazo os materiais neles contidos, sua organizao, acesso constante e distribuio (LYNCH, 2003). Dependendo das circunstncias, a responsabilidade de alimentar os repositrios, de organizar o contedo e de preserv-lo ter prioridade na construo de repositrios digitais abertos (PINFIELD; JAMES, 2003). A implementao de repositrios institucionais levanta uma srie de questes complexas sobre os recursos e estratgias organizacionais, assim como questes sobre os papis e responsabilidades. Muitos projetos de repositrios institucionais so motivados pelo desejo de mudar a comunicao cientfica. Essa mudana, se necessria, poder questionar a responsabilidade das instituies de ensino de publicar sua produo, retirando esse papel das grandes editoras comerciais. Na rea de inovao tecnolgica para o gerenciamento de contedos digitais, os repositrios institucionais (RI) esto sendo considerados uma forma eficaz de preservao da produo intelectual dos especialistas de uma ou vrias instituies. Construdos no contexto das universidades e instituies governamentais, eles garantem a visibilidade das colees digitais pela potencializao do acesso informao e pela criao de indicadores da qualidade da produo cientfica nas organizaes, mostrando a relevncia de suas atividades e o valor da instituio. Segundo Crowe (2002), os repositrios digitais so uma resposta a dois assuntos estratgicos das IES: a) prover um sistema que expanda o acesso a resultados de pesquisa, garantir o controle da produo acadmica, aumentar a competio e reduzir o monoplio dos peridicos, diminuir os custos e destacar a
129 relevncia da prpria instituio e das bibliotecas; e b) servir como indicadores potenciais da qualidade da universidade e demonstrar a relevncia cientfica, social e econmica das atividades de pesquisa, para aumentar sua visibilidade, status e valor pblico. Porm, Pinfield (2002) afirma que os verdadeiros desafios na implementao de repositrios institucionais so as questes culturais e organizacionais. Uma das dificuldades existentes conseguir levar os autores ao autodepsito sistemtico de sua produo intelectual. Uma alternativa que os responsveis pelo repositrio ou os bibliotecrios depositem os itens em nome dos autores, pelo menos no incio do desenvolvimento do servio. Tambm pode haver a necessidade de formatao ou de converso de arquivos de modo a poder transferi- los para o servidor do repositrio. A mesma alternativa sugerida como soluo. Em ambos os casos, as bibliotecas podem facilitar o trabalho dos autores de contriburem com suas pesquisas para os repositrios institucionais, porque esto mais bem preparadas para prover a normalizao na preparao dos documentos digitais. Para Pinfield, Gardner e Macoll (2002), a principal meta dos repositrios institucionais envolver os pesquisadores e usurios. A participao destes agentes fundamental para a manuteno do repositrio. Eles precisam tanto contribuir com contedo para o RI, como tambm us-lo para consultas e acesso literatura tcnico-cientfica de outras instituies. Para que um repositrio seja valorizado pelos pesquisadores, necessrio que ele seja confivel, que os contedos no desapaream aleatoriamente. Um repositrio institucional nunca uma iniciativa isolada; ele permite que as bibliotecas possam trabalhar de um modo interdisciplinar, enquanto os canais formais e informais de comunicao continuam a evoluir. Assim, ele muda tambm o papel passivo das bibliotecas, de receptoras de material publicado para agentes ativos na determinao do gerenciamento do contedo relevante prprio (NIXON, 2002). A capacidade de contar com um espao onde possa ser depositada a produo cientfica de uma instituio propicia o ambiente necessrio para a discusso entre os pares, o intercmbio de idias dentro de uma comunidade de pesquisadores e a reviso constante das verses de um documento. O debate crtico alimentado de forma aberta pelos participantes dos repositrios de acesso
130 livre, e no se tem limite para o tamanho dos documentos ou extenso temporal da discusso de qualquer tema. So resolvidos os problemas de distribuio dos canais formais e o acesso pode ser gratuito. Por serem um veculo de autopublicao por natureza, os repositrios abertos solicitam, apenas, uma promoo institucional para seu uso. As instituies reconhecem os materiais arquivados e os valorizam, estabelecendo as ligaes entre a informao que precisam e aquela que desejam disponibilizar abertamente. Um repositrio digital pode ser operado em qualquer organizao do setor pblico. Atualmente existem instituies encarregadas de armazenar e gerenciar material digital, mas so poucas as que asseguram ter a capacidade de armazenamento de longo prazo. Muitas empresas privadas afirmam que provem acesso e armazenamento, mas o acesso pblico restringido, e o proprietrio original que gerencia o contedo em uma pgina comercial da internet passa o controle direto do material para terceiros. Nesses casos, segundo Simpson (2004), para manter os direitos e o controle sobre o material digital, deve-se consultar a legislao, assim como especificar se as pesquisas foram financiadas, estipulando que o material continuar sob o controle e propriedade da instituio que o gerou. Um dos objetivos da publicao cientfica salvaguardar a propriedade intelectual (OKUBO, 1997). Os repositrios institucionais lidam com essas tarefas e com o problema da cpia apropriada. Existem, tambm, alguns tipos de licena sobre a utilizao de material intelectual (Common License/Creative License), que seguem as normas de direitos autorais. O nico obstculo atual para o acesso livre mediante o uso de repositrios institucionais a ausncia de polticas institucionais que requeiram o autodepsito da sua prpria produo cientfica. A opo pelo autodepsito temtico e/ou institucional certamente mais confivel. Alm disso, medida que o repositrio institucional se consolida, a coleta automtica aos repositrios temticos e centrais poder auxiliar na segurana dos dados, fornecendo backups, redundncias e espelho dos metadados e documentos contidos nos repositrios temticos. As diferenas sutis entre esses objetivos so complicadas devido variedade de materiais publicveis. Por exemplo, nos repositrios, muitos dados so considerados literatura cinzenta: relatrios, folhetos, guias, informativos, dados oramentrios, memorandos e resultados de pesquisa que no foram publicados (muitos deles de organizaes que no tm perfil de editoras). Acrescentem-se
131 lista trabalhos artsticos, pedidos de oramento, mapas, entrevistas de TV e rdio, filmes, registros musicais, fotografias, relatrios de consultoria, desenhos tcnicos, psteres. Por causa da preservao digital desse tipo de materiais, os repositrios institucionais se converteram em assunto muito relevante. Com eles, so colocados em funcionamento servios para os membros das comunidades internas que visam ao gerenciamento e disseminao de todo o material criado dentro de uma instituio e fora dela. A vantagem dos softwares de repositrios est em prover mecanismos para identificar consistentemente materiais que simplifiquem as atividades relacionadas com futuras migraes. O objetivo possuir um software de repositrio que possa garantir o gerenciamento das mudanas tecnolgicas e a migrao do contedo digital para novas verses de mdia eletrnica. Sem uma estrutura de repositrio, a migrao de materiais digitais pode chegar a ser um fator complicador.
2.3.3.4 Repositrios institucionais nas bibliotecas
Os repositrios institucionais comearam a ter importncia para a comunidade cientfica a partir de 2002. A comunidade de pesquisadores da rea de preservao digital percebeu os benefcios que esses sistemas poderiam trazer para as instituies acadmicas. Para Lynch (2003), com os repositrios digitais as instituies acadmicas podem realmente apoiar a pesquisa da qual elas se beneficiam, deixando seu papel passivo de editoras e participando do desenvolvimento da arquitetura de novas funes dos sistemas de informao. No incio de 2003, o movimento dos repositrios institucionais j expressava clara misso: proporcionar s instituies acadmicas a possibilidade de investir no desenvolvimento de sistemas de repositrios digitais. Foi nesse momento que responsveis pelas bibliotecas, pelos arquivos e pelos museus perceberam as possibilidades de integrao de acervos criada pela homogeneidade dos documentos digitais com que lidam. Todos os objetos digitais podem ser abordados da mesma forma por qualquer dessas instituies, sem que uma perspectiva exclua as outras.
132 Na rea da cincia da informao, os repositrios institucionais esto sendo considerados como uma das formas de mudar rapidamente a comunicao cientfica e tambm como um dos incentivos para que as bibliotecas entrem em um territrio inexplorado. A prioridade atual o desenvolvimento de repositrios institucionais, softwares e servios que gerenciam e disseminam materiais digitais de toda instituio. Os bibliotecrios lideram esse trabalho de forma inovadora, como participantes de equipes colaborativas que podem incluir tecnologistas de informao, arquivistas, professores e administradores de universidades, assim como funcionrios pblicos e comunidades de usurios. Como produtoras de pesquisas cientficas, as instituies acadmicas esto interessadas na captura, disseminao e preservao da produo intelectual de seus prprios membros. Tradicionalmente, as editoras e bibliotecas tm tido o papel complementar de facilitar a publicao e preservao da produo cientfica. Nas ltimas dcadas, as mudanas tecnolgicas e de mercado tm-se acelerado, motivadas em parte pelo volume crescente da publicao de resultados de pesquisas. Essa mudana de papis est afetando a relao simbitica entre editoras e bibliotecas. A combinao de uma rede quase ubqua com o aumento crescente dos preos nos modelos tradicionais de publicao prepara o cenrio para novas expectativas. Entre elas est o uso de repositrios institucionais para prover aos professores novas formas de criar e preservar objetos de aprendizagem, tais como ilustraes, visualizaes, modelos e vdeos. Para Peters (2002), o papel das instituies de ensino superior e de pesquisa envolvidas em projetos de preservao digital ser de detentoras de repositrios digitais, que permitam controle da autoria e a cobertura de elevado nmero de reas de conhecimento. Peters cita o exemplo do consrcio de universidades pblicas de Ohio, nos Estados Unidos (OhioLINK), que est se desenvolvendo para ser um servio de repositrio digital por meio do [...] auto depsito da informao de bases de dados de artigos de peridicos e bancos de teses e dissertaes de bibliotecas participantes [...] (PETERS, 2002, p. 415). Outros autores, como Messerschmitt (2003) e Hitchcock (2003), tambm asseguram que os repositrios institucionais poderiam ser viabilizados mais facilmente atravs de sistemas distribudos de preservao digital. Neles, os repositrios centralizados e mais bem organizados compartilhariam suas
133 metodologias com os outros repositrios temticos e institucionais. Para Messerschmitt, o papel das bibliotecas como curadoras da informao digital fundamental, uma funo que elas tm realizado por sculos. Como a maioria dos repositrios est em instituies acadmicas, as bibliotecas universitrias comearam tambm a desenvolv-los. As bibliotecas esto se unindo s agncias de governo, sociedades histricas, museus e outras instituies culturais para estabelecer repositrios comunitrios ou temticos. Nesse intuito, vrios repositrios esto sendo desenvolvidos em consrcio, uma vez que nem todas as instituies acadmicas precisam ou desejam t-los. Os repositrios institucionais estendem significativamente o papel das bibliotecas, representando um compromisso srio e de longa durao, com muitos benefcios. Professores e cientistas que comeam a usar repositrios institucionais para publicar e preservar seus trabalhos confiam na integridade, conhecimento e competncia daqueles que gerenciam esses repositrios. A experincia acumulada de adoo de padres e protocolos de comunicao por parte dos profissionais da informao fundamental na construo de repositrios institucionais confiveis. Eles podem definir um conjunto mnimo de critrios para o arquivamento de informaes cientficas produzidas em uma instituio. Esse conjunto de critrios para o desenvolvimento de um repositrio de preservao deve estar influenciado pelo modelo OAIS e pelo princpio arquivstico de custdia responsvel.
2.3.3.5 Softwares para repositrios institucionais
Com o surgimento da Iniciativa dos Arquivos Abertos 35 , inicialmente conhecida como UPS (Universal Preprint Service), na ltima dcada do sculo XX, diminuram as dificuldades que os autores enfrentavam para disponibilizar o resultado das suas pesquisas internacionalmente, aumentando a sua visibilidade e a estimativa de impacto na comunidade, o qual medido pelo grau de usabilidade alcanado (HARNAD, 1999).
134 Atravs dos padres de interoperabilidade do modelo OAI (metadados Dublin Core, protocolo de coleta de metadados OAI-PMH, dentre outros), os autores e os editores interessados em disponibilizar suas publicaes abertamente podem ter seus trabalhos compartilhados com outras instituies. Esta uma das formas utilizadas pelas universidades para apoiar a divulgao dos resultados de pesquisas cientficas, criando mecanismos para legitimar e estimular a publicao dos trabalhos produzidos (LYNCH, 2003). Para Harnad (2003), os repositrios institucionais tm cinco objetivos: a) realizar o autodepsito da produo cientfica institucional em forma de pr-prints, ps-prints, teses, dissertaes, colees digitais, matriais digitais preservveis, materiais para o ensino e as verses eletrnicas de peridicos e livros; b) providenciar o gerenciamento da coleo digital institucional; c) prover material para o ensino distncia; d) viabilizar a publicao eletrnica; e) preservar o contedo digital institucional. Na perspectiva da Iniciativa dos Arquivos Abertos, nem todos os repositrios institucionais possuem as mesmas metas, mas eles compartilham objetivos similares. O contexto dos repositrios pode ser caracterizado pelos seguintes atributos: a) repositrios que armazenam arquivos que nasceram digitais, sem anlogos em papel; b) repositrios que possuem atributos de confiabilidade e disponibilidade relevantes para a comunidade cientfica; c) repositrios de acesso contnuo, atributo digital que garante a possibilidade de citar, descobrir, entregar e usar o recurso depois de sua criao e depsito no repositrio. Esses atributos devem ser garantidos permanentemente para prevenir as falhas dos formatos e controlar os efeitos das mudanas tecnolgicas. Tambm, os processos de preservao digital devem estar apoiados em polticas bem definidas, na sua organizao e nas estratgias adotadas. Como mencionado anteriormente, o modelo OAIS fornece as especificaes de um repositrio e estabelece responsabilidades que uma organizao deve distribuir para operar como um arquivo de acesso livre. O modelo
135 de referncia define um sistema de informao para arquivamento aberto como aquele composto por uma organizao de pessoas e sistemas que aceitam a responsabilidade de preservar informao e sua disponibilizao para uma comunidade especfica. A aplicao dos princpios do modelo OAIS, e particularmente, a implementao de um arquivo de acesso livre em concordncia com os modelos de funcionalidade e estrutura da informao do OAIS o pr- requisito chave para estabelecer repositrios confiveis e garantir a preservao de longo prazo dos seus atributos digitais. Para garantir a confiana nos repositrios digitais de acesso livre por parte dos autores e dos usurios, eles devem manter algumas propriedades de preservao digital mnimas: a) autenticidade: a certeza de que um componente digital foi criado pela pessoa que afirma t-lo feito; a autenticidade permite ter a certeza de que o criador do objeto digital no pode negar que foi ele quem o criou. As assinaturas digitais e as marcas dgua digitais so tcnicas que garantem a autenticidade dos objetos digitais; b) integridade: a habilidade de manter os dados completos e corretos, prevenindo mudanas acidentais ou maliciosas (corrupo dos dados). Entregando e salvando um bit/byte checksum, como o MD5 faz, constitui uma tcnica bsica para detectar se qualquer modificao produziu algum efeito nos objetos digitais depois de ter sido inserido no repositrio; c) confiana e disponibilidade: a confiabilidade est relacionada habilidade dos componentes de hardware e software funcionarem de acordo com suas especificaes sem erros ou defeitos. Disponibilidade a porcentagem do tempo que o sistema est regularmente em funcionamento, em relao com o tempo total que ele deve operar. Algumas tcnicas usadas para garantir altas porcentagens de confiabilidade e disponibilidade so backups, softwares de antivrus, firewalls, operating system patches, atualizaes de aplicaes de software, componentes de hardware de redundncia e tolerncia de falhas; d) capacidade de reuso: habilidade de acessar um recurso digital pelo tempo que a instituio decida manter o repositrio. Os objetos digitais
136 cientficos e acadmicos que possuem valor por longo perodo de tempo devem ser recuperados apropriadamente e reusados ao menos por um perodo longo de tempo (uso de identificadores permanentes e mantendo formatos e mdias). A preservao digital deve incluir todos os componentes de dados da infra-estrutura dos repositrios digitais de acesso livre, no apenas os objetos digitais, mas tambm seus metadados e identificadores. Com toda essa variedade de materiais e metas, possvel entender o porqu do aparecimento de sistemas de software to diversificados. Mas no todas essas diferenas surgem por causa, apenas, do tipo de contedos que cada repositrio coleta. Os sistemas existentes aplicam-se ampla maioria dos contextos institucionais, permitindo uma variedade de funcionalidades e recursos para gesto de documentos eletrnicos. A implementao dos RI pode ser realizada de forma simples: uma estrutura hierarquizada, acesso via Web e metadados coletados por meio do protocolo OAI-PMH, permitindo assim que os usurios, ao optar por qualquer mecanismo de busca da Iniciativa dos Arquivos Abertos, possam encontrar e recuperar o contedo do repositrio. A maior diferena entre os programas para repositrios institucionais est na origem do software, se ele gratuito ou comercial. Os softwares comerciais no esto abertos para modificaes locais na maioria dos casos. Nos softwares abertos, os cdigos de programao esto disponveis para que os usurios possam conhec-los e modifica-los. Na maioria dos casos, os softwares no vm com uma licena. O sistema operacional Linux o exemplo mais conhecido. Os espaos para o depsito e submisso de documentos digitais com informaes cientficas esto sendo desenvolvidos em alguns programas com caractersticas parecidas. Alguns pacotes de software livre para repositrios institucionais tm ganhado destaque, entre eles: EPrints, o mais antigo, possui a base de instalao mas variada. Disponibilizado pelo Joint Information Systems Committee na Inglaterra e pela National Science Foundation dos Estados Unidos, este sistema focaliza a produo cientfica tradicional em forma de pr-prints e ps- prints. A publicao no EPrints segue o modelo tradicional da publicao impressa. Mesmo sendo um software que prov
137 longevidade e acompanha o desenvolvimento na rea da preservao digital, a primeira motivao do EPrints no a preservao de longo prazo. Greenstone um software que permite a construo e distribuio de colees digitais de bibliotecas. Desenvolvido pelo New Zealand Digital Library Project, o Greenstone est sendo distribudo em colaborao com a Unesco e a Human Info NGO. i-Tor do Netherlands Institute for Scientific Information Services implementa um tipo de repositrio de dados independente. O contedo e a interface de usurio funcionam como partes autnomas porque o i- Tor publica os dados de grande variedade de sistemas de bases de dados relacionais, tipos de arquivos de sistemas, e de sites na web. CDS Invenio (antigo CDSWare) cobre todos os aspectos de uma biblioteca digital e usado entre outros repositrios no mundo pelo repositrio da CERN, o maior entre todos os registrados no ROAR e o terceiro entre os repositrios institucionais (no centrais que coletam de outros repositrios institucionais). O repositrio da CERN tambm, pelo seu elevado ndice de textos completos o que conta com mais aceitao institucional. Segundo Harnad (2003), o repositrio da CERN tem a melhor poltica de repositrios institucionais no mundo, com o mandato de auto-arquivamento institucional mais compreensivo, sistemtico e com sucesso 36 . Mas o CERN no promove a adoo de sua poltica institucional de auto-arquivamento, quando repassa o software CDS Invenio. Fedora (Flexible Extensible Digital Object Repository Architecture) Desenvolvido pela University of Virginia Library e o Cornell University Digital Library Group, o Fedora um software livre que focaliza a implementao e gerenciamento de bibliotecas digitais (STAPLES; WAYLAND; PAYETTE, 2003). Ele pode incluir servios de preservao, pois segue o modelo OAIS nas suas principais funes de entrada e sada de dados. A empresa VTLS usa o Fedora como
36 Disponvel em: http://www.eprints.org/signup/fulllist.php Acesso em 12/0ut/2008
138 base em alguns dos seus produtos comerciais para sistemas de bibliotecas. DIAS (Digital Information Archive System) foi desenvolvido originalmente por uma empresa para a Biblioteca Nacional da Holanda, com o objetivo de lidar com o depsito de documentos digitais e informao multimdia. A Koninklijke Bibliotheek usou como base os resultados obtidos em vrios projetos nos ltimos anos, como no sistema Deposit of Netherlands Electronic Publications (DNEP) (STEENBAKKERS, 2000); o seu design observa os requisitos de um sistema de depsito, suporta a insero automatizada e manual de materiais, que podem ser acessados via web, e um sistema baseado no gerenciador de contedo da IBM (IBM, 2003). OCLC Digital Archive est baseado no modelo OAIS e proporciona acesso de longo prazo, armazenamento e preservao de objetos digitais; usa a estrutura de metadados do METS (Metadata Encoding and Transmission Standard) para permitir a interoperabilidade com outros arquivos e est conectado com o sistema de catalogao OCLCs Conexion.
A vantagem desses softwares de repositrios est em disponibilizar mecanismos para identificar consistentemente materiais que simplifiquem as atividades relacionadas com futuras migraes. O objetivo das instituies responsveis pela guarda de informaes digitais possuir um software de repositrio que realize as migraes de forma estvel, apesar das mudanas tecnolgicas.
2.3.3.6 Repositrios DSpace
Dentre os softwares citados, a ferramenta que tem sido implementada pelo maior nmero de instituies e que desde sua criao deu prioridade preservao digital o DSpace. Orientado para ser um programa usado em repositrio que captura a produo intelectual das instituies de pesquisa, diferentemente dos
139 outros softwares, o DSpace estende-se para uma variedade maior de tipos de materiais e possui mais opes de preservao de objetos digitais. O DSpace um software livre desenvolvido pelo Massachusetts Institute of Technology (MIT) Libraries e pelos Laboratrios Hewlett-Packard para criao de repositrios institucionais e multidisciplinares para bibliotecas, arquivos e centros de pesquisa. Sua estrutura prov um modelo de informao organizacional baseado em comunidades e colees, o qual pode ser configurado de modo a refletir todo o conjunto de unidades administrativas de uma instituio. Permite a configurao do processo editorial nos moldes dos peridicos tradicionais, incluindo a possibilidade de reviso pelos pares. Suporta os mais variados tipos de formatos de arquivos digitais, incluindo textos, som e imagem (Figura 15).
Figura 15 - Primeira interface do DSpace da Cornell University
O surgimento do DSpace em 2003 est relacionado iniciativa da Open Courseware (OCW) da MIT, com o objetivo prover acesso livre, recupervel e coerente aos materiais de ensino do MIT (DSPACE, 2002). Eles so parte da infra- estrutura que o Council on Educational Technology (MITCET) formou em 2000. Tambm, o projeto estabelece conexo com outras iniciativas, como a que est sendo realizada na Harvard University, chamada Digital Repository Service (DRS). O DSpace representou a entrada do MIT na comunidade de desenvolvimento de software livre, com um sistema completo e disponvel gratuitamente. O interesse foi
140 expressivo desde as etapas pr-operacionais do projeto, sendo considerado pelos pesquisadores como um modelo na criao da estrutura de outros sistemas. O DSpace possui uma natureza operacional especfica de preservar os objetos digitais que so de interesse da comunidade cientfica. Criado inicialmente para a implementao de arquivos institucionais, tem sido usado para o compartilhamento da produo cientfica nas universidades. O software resultado da implementao de padres j aceitos internacionalmente, como o Open Archive Initiative, o Open Archival Information System Reference Model e o Dublin Core. Atualmente est sendo utilizado para promover uma aliana entre repositrios federativos e instituies. A misso do DSpace oferecer um armazenamento estvel a longo prazo para todos os materiais produzidos pelos professores e pesquisadores do MIT. A preservao de longo prazo seria em ampla variedade de formatos, incluindo texto, udio, vdeo, imagens, bases de dados, entre outros; assim como possibilitar o acesso remoto a todos os materiais atravs de uma interface coerente. As funcionalidades de preservao estiveram presentes desde as primeiras etapas do design da arquitetura do repositrio, envolvendo aspectos sociais (CHUDNOV, 2001). Para os desenvolvedores do DSpace, alm do seu uso como repositrio, o software foi implementado para ajudar na pesquisa dos sistemas de gerenciamento de contedo que contemplam a preservao, o arquivamento e a distribuio de materiais digitais. A plataforma utiliza o modelo OAIS, seu vocabulrio para descrever sistemas de arquivamento de mdias e a verificao dos planos operacionais e funcionais para determinado repositrio. A influncia do OAIS no design da arquitetura do DSpace faz dele um exemplo de repositrio com funcionalidades de arquivamento digital. Os repositrios digitais podem abordar uma preservao a curto ou longo prazo (CROW, 2002), promovendo o ambiente necessrio para a disseminao e processos de reproduo, assim como criar o compromisso institucional com a preservao. No DSpace, a preservao ocorre no nvel dos bytes onde a ordem de cada item armazenada, assim como sua habilidade de preservao em alto grau de representao, que pode facilitar na identificao e servir como evidncia das partes de um registro. Muitos repositrios enfrentam dificuldades para chegar a esse
141 grau de representao. Ainda so poucos os repositrios adequadamente equipados para lidar com metadados de preservao. Os nveis de preservao no DSpace so fundamentais devido, principalmente, ao uso de metadados na sua concepo. No DSpace encontrou-se trs tipos bsicos de metadados descritivos, administrativos e estruturais. A estrutura dos metadados segue o modelo de metadados METS. Os metadados descritivos esto baseados no Library Application Profile for Elements and Qualifiers, mas qualquer instituio que faa opo pelo DSpace pode mudar o conjunto de metadados usado. No nvel das comunidades e das colees, usam-se metadados descritivos simples derivados de um subconjunto do Dublin Core. Os metadados estruturais contm informaes sobre como apresentar um item ou bitstream, assim como informaes sobre as relaes entre os itens. Nos metadados administrativos esto includos os metadados de preservao, de origem e a informao sobre a poltica de autorizaes. Muitos deles so organizados segundo o esquema de relacionamento DBMS. As informaes sobre Origem (Provenance) so mantidas em Dublin Core, mas em uma descrio simplificada. Nesta rea de metadados administrativos espera-se que o dicionrio de metadados da OCLC/RLG PREMIS possa ser utilizado na identificao dos elementos para metadados de preservao. O DSpace faz uso da terminologia de comunidades para definir os espaos dos contedos onde os usurios podem localizar a informao. Em cada comunidade os usurios encontram colees, e nelas esto os itens ou [...] agrupamentos de contedos e metadados que permitem seu arquivamento em pequenas unidades [...] (DSpace, 2002). Os itens no DSpace so os registros ou arquivos, organizados em bundles ou agrupamento de bitstreams, como aqueles contidos num arquivo html e suas imagens associadas, tendo no seu nvel mais elementar a organizao dos itens por bitstream, identificados pelo seu formato de bitstream. Os itens constituem conjuntos de informaes que descrevem o conhecimento sobre o formato e a codificao do bitstream, incluindo uma verso MIME e o nome do tipo de formato (ex. Adobe PDF). As informaes tambm contm especificaes do formato e cdigo fonte para manipulao do formato. A diviso hierrquica dos bitstreams e seus agrupamentos na forma de metadados adicionados correspondem aproximadamente ao modelo de informao do OAIS.
142 A preservao desse tipo de contedo gerenciado na arquitetura do DSpace pelo Bitstream Storage Manager. O administrador do armazenamento dos bitstream uma das mais importantes funcionalidades de preservao na arquitetura do DSpace, pois nela so armazenadas as informaes sobre os arquivos submetidos ao nvel de bitstream, permitindo uma capacidade limitada de transao para os bitstreams. A complexidade inicia no momento em que o gerenciador do armazenamento e seus administradores comeam a identificar o nvel do servio de preservao para cada um dos itens e, dessa forma, determinar o grau de suporte para cada tipo de bitstream. Os administradores do DSpace dividem os formatos de bitstream em duas categorias: conhecido e desconhecido. Os tipos de bitstream conhecidos so divididos tambm em formatos suportados e os que o sistema no suporta (TANSLEY et al., 2003). Os conhecidos so aqueles aos quais os administradores do DSpace nomearam o formato do arquivo, sua verso, mimetype e outras informaes relevantes (ex.: sua relao com outros formatos) dentro do registro dos formatos do bitstream do sistema. Alm disso, um processo foi ativado para identificar automaticamente as futuras submisses, usando o formato j nomeado. Ser suportado significa que os administradores procuraram e armazenaram especificaes documentais do formato suficientes no DSpace ou em formato anlogo numa biblioteca confivel. O conhecimento dos administradores dos diferentes formatos de bitstream e seu suporte possibilita novo nvel de servios de preservao. O mais alto nvel denominado Suportado Nvel 2. Esse servio estabelecido quando o bitsream mantido e recuperado sob pedido no futuro. Acrescente-se a isso que a instituio confia na sua habilidade de usar e entender que o material depositado poder ser razoavelmente preservado e existe um comprometimento com essa finalidade, da forma mais apropriada, segundo o contexto que envolve cada material. As tcnicas de preservao a serem aplicadas incluem estratgias como emulao, migrao, servios de transformao de formatos. Todas as funcionalidades do Gerenciador de armazenamento de bitstream (Bitstream Storage Manager) podem ser contextualizadas dentro da concepo de planejamento da preservao (Preservation Planning) no modelo OAIS. Da mesma forma, alguns componentes tambm podem participar da Administrao e
143 Armazenamento de Arquivamento (Administration and Archival Storage). Isso mostra como o modelo OAIS pode ser aplicado em todas as funes de um repositrio. Os desenvolvedores do DSpace tomaram como exemplo o desenho do repositrio Harvard DRS na arquitetura do DSpace, especialmente os componentes relacionados com a identificao e gerenciamento dos nveis de preservao da informao digital que ele suporta. Uma peculiaridade que faz do DSpace um repositrio orientado para a preservao digital o fato de que, alm de utilizar tecnologias como as mencionadas, ele opera em um ambiente computacional de ferramentas de cdigo aberto (software livre). Isso permite assegurar a viabilidade da estrutura de longo prazo, apoiada na comunidade de usurios e desenvolvedores que mantm as informaes sobre o DSpace sob uma licena BSD. O DSpace o exemplo de um repositrio confivel que garante a manuteno de formatos de arquivos gerenciando-os, identificando-os e aplicando processos de preservao que o sistema capaz de suportar. As instituies que adotam o DSpace conseguem, alm de identificar quais so os arquivos ou colees que precisam de maior proteo, realizar um planejamento sobre a manuteno de cpias de software e hardware e sua documentao necessria para identificar os tipos de arquivo indispensveis para o uso dos objetos digitais no futuro. Essas aes servem para que os usurios do sistema possam ter maior grau de confiana de que seus documentos recebero os cuidados necessrios sua preservao.
2.3.3.7 Repositrios e identificadores persistentes
Outra rea relacionada com a preservao digital a tcnica de nomeao persistente dos objetos digitais ou incorporao na arquitetura de um sistema de URN (Uniform Resource Name). Identificar e localizar consistentemente contedo so cruciais para os softwares de repositrios. Existem vrios URN, tais como o Handle System, o DOI (Digital Object Identifier) da CrossRef e o PURL (Persistent Uniform Resource Locators) da OCLC. Para facilitar o acesso
144 permanente, cada objeto deve ter um identificador que transcende o prprio software. 37
Os identificadores permanentes esto relacionados diretamente com os padres de preservao digital, sendo um componente importante da infra-estrutura dos repositrios digitais, para ajudar a garantir que os objetos digitais possam ser gerenciados e localizados no futuro. Os identificadores permanentes devem permanecer vlidos, mesmo se o contedo for migrado para um novo sistema ou se a administrao responsvel pelo repositrio institucional mudar. O PURL foi desenvolvido pela OCLC baseado no padro URL (Uniform Resource Locator) do protocolo HTTP. O funcionamento do PURL est estruturado na conexo de URL que apontam para um servio de resoluo (service resolver) mantido para redirecionar um endereo ou link de pginas web que no esteja funcionando para o endereo ativo. Trs exemplos de instituies que usam PURL para a preservao do acesso s informaes nas suas pginas web so: o Digital Archive da OCLC, a US. Government Printing Office e o US Department of Energys Office of Scientific and Technical Information. O Handle System, criado pela Corporation for National Research Initiatives (CNRI), como um software de URN permite que qualquer item possa ser encontrado no decorrer do tempo, apesar de haver mudado de local fsico. Os protocolos do sistema possibilitam que de forma distribuda um servidor remoto guarde os handles ou identificadores permanentes dos recursos de informao e reconhea a informao necessria para localizar e acessar tais recursos. Essa informao pode mudar quando necessrio, para ser capaz de descrever o estado atual do objeto digital, sem mudar o prefixo ou handle. O sistema Handle tambm usa um servio de resoluo de identificao, mas no Handle, o servio permite que um nico prefixo resolva uma ou mais URL com verses, formatos e locais diferentes para o mesmo documento. No caso do DSpace, cada repositrio obtm um handle ou prefixo do do CNRI que permite a identificao persistente do Handle System para todos os documentos depositados, como um componente do repositrio institucional e
37 PURL: Online Computer Library Center Inc. http://purl.oclc.org URN: Internet Engineering Task Force. http://www.ietf.org/html.charters/urn-charte.html DOI: International DOI Foundation. http://www.doi.org Handle System: Corporation for National Research Initiatives. http://www.handle.net/index.html
145 convertendo-o globalmente em nico. Um handle pode ser designado a comunidades, colees ou itens, menos aos bitstreams, porque ele pode mudar para dar suporte a novas atividades de preservao. Instituies como a Koninklijke Bibliotheek na Holanda e a Defense Technical Information Center nos Estados Unidos tm includo os identificadores persistentes do Handle System (STEENBAKKERS, 2002). Algumas organizaes internacionais j trabalham no sentido de criar seus prprios sistemas de identificadores permanentes. Um dos mais reconhecidos o DOI da International DOI Foundation, que em 1998 implementou o Handle System especificamente para a gesto da propriedade intelectual, gerenciando identificadores permanentes de links referenciados entre publicaes, com seu prprio registro de nomes de autoridades. Em 2003, a DOI Foundation comeou a designar seus identificadores persistentes a documentos com dados cientficos, e tem sido usado para referenciar e citar documentos originais, aumentando com isso a possibilidade de que os documentos sejam encontrados e reusados. Entre os Handles e PURLS alternativos que vm surgindo, podem ser mencionados os seguintes: Archival Resource Key (ARK) criado pela Califrnia Digital Library usado em todos seus objetos digitais e servios (KUNZE, 2003); permite o acesso a longo prazo a informaes contidas em qualquer tipo de suporte, pois contm partes que so flexveis para suportar redirecionamento de URL, associando permanentemente um nome a um objeto especfico. 38
URN baseados no ISSN e no ISBN, como no projeto DiVA da Uppsala University na Sucia (MUELLER et al., 2003) e nos projetos EPICUR e CARMEN da Alemanha. Local Identifier Scheme da National Library of Australia para todas as publicaes no projeto PANDORA Archive, permitindo a criao automtica de identificadores permanentes incorporada no software PANDAS, fazendo com que o esquema local possa ser convertido em um sistema global.
146 N2T (Name-to-Thing) um servio de resoluo de identificadores persistentes e um consrcio de organizaes que lidam com a memria cultural (http://n2t.info/).
2.3.3.8 Repositrio uniforme do INPE
No Brasil, a biblioteca do Instituto de Pesquisas Espaciais (INPE) comeou a desenvolver em 1995 o Uniform Repository for a Library (URLib) 39 para resolver o problema da integrao de documentos produzidos por pessoas utilizando sistemas de arquivos independentes (BANON; BANON, 2005). Para gerenciar os repositrios uniformes que alimentam o acervo da biblioteca, foi desenvolvido o URLibService. A biblioteca contm documentos eletrnicos formados por colees de arquivos e diretrios depositados em vrios repositrios uniformes ou acervos locais utilizando o Apache como servidor web.
Figura 16 Interface da Biblioteca Digital Memria do INPE 40
39 Repositrio Uniforme para uma Biblioteca 40 Fonte: INPE. Disponvel em: http://bibdigital.sid.inpe.br Acesso em: 15/dez/2008
147
Assim como o ARK, no sistema de Identificao URLibService a gerao dos identificadores pode ser feita pelos prprios provedores de dados, se precisar de cadastramento junto ao resolvedor de identificao, como no caso do Handle System, estabelecendo-se um vnculo automtico entre documentos depositados em dois provedores distintos. Tambm a vantagem do URLibService de que a diferencia do DOI, pois consegue resolver [...] a distino entre um documento e suas cpias, oferecendo para o usurio final a garantia que o documento acessado sempre o mesmo, seja ele uma cpia ou no [...]. (BANON, 2006). Com o URLibService, o Inpe desenvolveu o primeiro servio de identificao global de nome no Brasil, sendo a primeira soluo nacional para os problemas de links e citaes permanentes. Assim como, tambm, o primeiro sistema de autodepsito nacional que respeita os direitos autorais e que certifica a originalidade dos trabalhos. O programa livre para instituies pblicas e associaes sem fins lucrativos (BANON, 2006). Em 2007, as instituies brasileiras como o CNPq, a Bireme e o Ibict comearam a usar em alguns de seus sistema de informao o redirecionamento que o identificador DOI estabelece, para citar artigos ou partes de artigos dos pesquisadores (Sistema LATTES) e no endereo dos artigos nas revistas na base de dados SciELO e no sistema OJS/SEER verso 2.1.
2.4 GERENCIAMENTO DA PRESERVAO DIGITAL
Como parte da construo cultural da realidade, a informao reflete as vises do mundo de uma sociedade em determinado tempo. No sculo XX, a informao tcnico-cientfica tornou-se relevante para o progresso econmico das naes. O desenvolvimento cientfico e tecnolgico trouxe consigo maior oferta de recursos de informao para a populao mundial. As novas tecnologias de informao colocaram em evidncia o papel dos meios e tcnicas digitais de gerenciamento da informao digital. O material digital, seja aquele criado em computador ou digitalizado, est presente na maioria dos servios de informao (WEBB, 2000).
148 Em vrios pases, h urgncia na definio das polticas, obrigaes e metodologias mais apropriadas para a administrao dos recursos digitais. Internacionalmente, iniciativas dos setores pblico e privado se multiplicam, tentando estabelecer metodologias e estratgias que incluem tcnicas de preservao que possam responder s necessidades de garantir a longevidade dessas informaes (Apndice C). A compreenso da preservao digital por parte das instituies responsveis por acervos culturais e histricos tem focalizado os obstculos tcnicos e a habilidade de provar a validade das solues tecnolgicas adotadas. Os modelos de sistemas da preservao digital dentro do contexto das instituies produtoras de conhecimento em C&T e das bibliotecas universitrias tm sido analisados por vrios autores. Alguns temas conexos, como a produo cientfica e aspectos especficos sobre preservao, como hardware e software envolvidos, a seleo do que ser preservado, o custo da preservao tm sido tratados, assim como existe uma nfase na necessidade de planejamento do que ser selecionado para se preservar. Desde a primeira proposta de um esquema conceitual que abordou o gerenciamento da preservao digital, feita por Daniel Greenstein em 1998, detectou-se que os requisitos da preservao digital influenciam a maneira como os recursos digitais esto sendo estruturados, documentados, armazenados, validados e as condies como eles podem ser acessados. Greenstein (1998) descreveu o gerenciamento do material digital em sete mdulos interligados, nos quais as boas prticas dependem das decises dos desenvolvedores das colees sobre aspectos como tipo de contedo e formato (Quadro 6).
149 Mdulo Submdulo Sub-submdulo Dados de Seleo e Avaliao
Dados de Criao Dados de Gerenciamento Dados Estruturais Dados de Documentao Dados de Armazenamento Dados de Validao Dados de Valorizao Dados de Cpia Restaurao da Mdia Dados de Divulgao Dados de Uso Dados de Preservao Gerenciamento de Direitos Quadro 6 Gerenciamento dos dados preservao digital Fonte: verso traduzida e adaptada de Greenstein, (1998)
O modelo de Greenstein trata dos tipos de decises que devem ser tomadas no gerenciamento de recursos digitais. Algumas delas independem do controle dos responsveis pelas colees. So informaes gerenciais sobre a estrutura do dado (como e quantas vezes ele foi formatado e codificado), informaes sobre a sua origem, suporte e locais de armazenamento, procedimentos adotados para garantir a integridade do dado (completude, funcionalidade e consistncia), permisses de uso e direitos autorais. Divididas em mdulos desde o momento da sua criao do recurso digital, passam pela avaliao da usabilidade e relevncia do contedo. O modelo de Greenstein apontou a necessidade de implementar uma estrutura para o gerenciamento de objetos digitais que possa ser usada para descrever as necessidades dos responsveis por esses registros. Sua proposta foi uma das primeiras a ressaltar a rea da preservao digital como aquela que requer maior ateno, quando se levar em considerao os custos com a manuteno dos recursos e a adoo prtica por parte dos administradores (HENDLEY, 1998). Tanto para Greenstein como para Hendley, um sistema de preservao digital podia ser visto como uma combinao de: a) capacidade de armazenamento; b) funes de insero;
150 c) colees de metadados e gerenciamento; d) estratgias de preservao e disseminao de contedos arquivados em sistemas administrados de forma centralizada; e) outro tipo de estrutura organizacional na qual os componentes do processo de preservao esto separados em servios distribudos entre as vrias instituies participantes, cada uma delas especializada em um segmento do processo. Em 2004, Lavoie e Dempsey resumiram a quatro nveis a concepo de um sistema de preservao digital. No primeiro, estariam o hardware, software e a infra-estrutura que d apoio ao armazenamento e distribuio do contedo digital. No segundo nvel, estariam includos os servios mais especializados para o gerenciamento do contedo arquivado no sistema, incluindo a criao de metadados, validao da autenticao e integridade dos materiais. A criao de indicadores, por sua vez, implementada no terceiro nvel, incluindo o monitoramento do ambiente da preservao, para acompanhar o impacto das mudanas na habilidade de acessar e usar esses contedos, assim como facilitar os processos de migrao e emulao. O ltimo nvel abrangeria os servios relacionados com a busca, navegao, solicitaes de aceso, permisses e disseminao seletiva. Essa concepo j estava influenciada pela percepo do funcionamento de um sistema de preservao baseado em repositrios digitais segundo o modelo OAIS. Com ele ficaram evidentes os aspectos mais importantes do workflow da informao a ser preservada: a entrada, o acesso, a administrao, gerenciamento de dados, o planejamento da preservao e o armazenamento com fins arquivsticos, incluindo o armazenamento da mdia e o gerenciamento de software. Os estudos sobre os sistemas de preservao digital foram surgindo na ltima dcada focando no desenvolvimento e propriedade dos softwares para repositrios digitais e no fluxo interno da gesto da informao dos objetos digitais. Um estudo que pode servir como exemplo dos trabalhos sobre a identificao das etapas de gerenciamento da preservao digital foi o realizado por Anderson e Pinfield (2004), no qual foram identificadas sete etapas no gerenciamento do ciclo de vida dos objetos digitais (Figura 17).
151
Figura 17 Ciclo de vida dos objetos digitais Fonte: Anderson e Pinfield (2004)
A primeira a da criao do documento, quando se escolhe o formato do arquivo e se determina o tipo de contedo; na segunda etapa so realizados os processos de submisso; na terceira so feitas as revises e na quarta a reteno para reviso. Nessas trs etapas (submisso, reviso e reteno) so inseridos os metadados de descoberta, tcnicos e de direitos autorais, assim como tambm o tipo de formato para converso, o identificador nico persistente e a verso para controle. No passo quatro podem ser recebidos diretamente os trabalhos criados j no passo um que marca a atribuio de qualidade para sua publicao. O passo cinco pode significar a deciso para a retirada do documento, nas mesmas circunstncias dos passos trs e sete. J no passo seis, decide-se a ao a ser realizada com o documento que enfrenta um processo de obsolescncia tcnica (migrao, emulao e outras estratgias). Mas existe ainda na comunidade da preservao digital a necessidade de ferramentas acessveis, tecnologia e treinamento no uso dos sistemas que gerenciem os objetos digitais. (LUPOVICI; MASANS, 2000; McGOVERN, 2007; ROTHENBERG, 2000). tambm aceito o pressuposto de que no existe uma 2 Submission 3 4 Revision(s) Quality Assessment and Publication 6 Technical Obsolescence Resource Discovery Metadata Technical Metadata Rights Metadata File Format Conversion Unique, Persistent Identif ier Version Control Migration, Emulation Other Preservation Action Creation 1 File Format & Content Types Determined 5 Review Retention 4 7 Withdraw
152 nica mdia de armazenamento permanente e que necessrio o desenho de sistemas que gerenciem as mudanas inevitveis de um sistema para outro. Para a Unesco (2007), mais conveniente que se invista na construo de sistemas sustentveis do que em suportes supostamente permanentes. No seu relatrio de 2007 sobre softwares livres para sistemas de arquivamento, a organizao conclui que necessrio um sistema simples e sustentvel que proporcione estratgias para gerenciar e identificar as funes de preservao. Especificamente sobre a integrao de ferramentas ao workflow das instituies, esto surgindo estudos sobre como o workflow da preservao digital, que modular, capaz de integrar de forma fcil e personalizada as novas ferramentas de preservao digital. H avanos na rea de extrao automtica de metadados no momento da submisso, mas existe a necessidade de investigar as ferramentas e os tipos de workflow que podem ser compartilhados entre organizaes. Uma das mais recentes iniciativas que tentam acabar com a barreira entre as infra-estruturas organizacional e tecnolgica o projeto europeu PLANETS 41 , coordenado pela British Library, que promete um tipo de planejamento tecnolgico e ferramentas que refletem as polticas organizacionais. O foco do projeto o processo chamado de planejamento da preservao, definido no modelo OAIS, no qual a preservao digital est centrada nas decises certas no tempo certo para garantir que a informao de valor no seja perdida. Com a mesma finalidade surgiu o projeto PLEDGE, coordenado pelo Massachusetts Institute of Technology, que promete um prottipo de mecanismo automatizado de polticas de preservao digital 42 . Aguarda-se que, com mais instituies desenvolvendo repositrios digitais confiveis, seja possvel o compartilhamento dos workflows e a diminuio dos custos. Existe um esforo em desenvolvimento do padro ISO, que vai integrar vrias iniciativas e requisitos relevantes das reas de tecnologias da informao e segurana.
A infra-estrutura tecnolgica necessria refere-se combinao de estratgias (procedimentos, protocolos, documentao, redes, medidas de segurana, workflow), o pessoal (habilidades tcnicas e arquivsticas), os equipamentos (hardware e software, mdia de armazenamento) e outros meios para alcanar o objetivo de preservar os objetos digitais. Para Kenneth Thibodeu (2002), diretor da Electronic Records Archives Program da National Archives and Records Administration as abordagens tecnolgicas da preservao de objetos digitais esto direcionadas ao acesso permanente. Ele afirma que, em contraste com tecnologias como a migrao ou arqueologia digital, surgiro cada vez mais tecnologias que focalizam a documentao necessria dos arquivos digitais para possibilitar sua reproduo no futuro. Foi na dcada de 1990 que comearam os estudos sobre a permanncia dos objetos digitais, RLG DigiNews foi o primeiro peridico cientfico a publicar artigos dedicados ao tema preservao digital, chegando a ser um dos veculos de comunicao mais consultados pela comunidade de pesquisadores da rea. Para a comunidade preocupada com a preservao digital, considerado um momento significativo a publicao em 1996 do relatrio da RLG e a CPA (McGOVERN, 2007). Nos anos que se seguiram publicao do Preserving Digital Information feita pelo CLIR e o Research Libraries Group em 1996, o crescimento considervel dos recursos de informao digital em contedo web, livros eletrnicos, peridicos on-line, mdia digital e material didtico tem dificultado a antecipao dos desafios inerentes sua preservao (SMITH, 2005). Os progressos alcanados desde o relatrio publicado pelo Task Force on Digital Archiving multiplicaram-se: a) consolidou-se o modelo de referncia para sistemas de preservao digital (OAIS) tambm chamado em portugus de Sistema Aberto de Arquivamento de Informao (SAAI),
154 b) estabeleceu-se o conjunto de atributos para repositrios digitais confiveis (TDR), que delimita o contexto organizacional da preservao digital, c) publicaram-se dicionrios de dados para metadados de preservao (PREMIS) e, d) surgiram os repositrios institucionais facilitados pelo aparecimento de novos softwares, como o Dspace. Eles tm favorecido o desenvolvimento de estratgias de preservao mais especficas, como o PRONOM para tipos de contedo digital. Juntou-se a eles a norma ISO 19005-1, publicada no dia 13 de setembro de 2005, que especifica o formato Portable Document Format - PDF16 ou PDF/A como padro universal para arquivamento de documentos eletrnicos em longo prazo. Com relao aos softwares para repositrios digitais de software livre, alguns j tm se consolidado na comunidade cientfica e suas diferenas so claras. Os mais usados (EPrints e DSpace) explicam sua orientao da seguinte maneira: a) EPrints: enfatiza particularmente o contedo de acesso livre a artigos de peridicos e teses; o workflow do EPrints est baseado numa interface web que lida com o processo de submisso; os documentos so transferidos para um armazenamento temporrio que ser moderado pela equipe do repositrio. As etapas subseqentes sero realizadas no documento e no registro dos metadados, o que inclui migrao do formato do arquivo, ajustes nos metadados ou eliminao do documento (http://www.eprints.org). b) DSpace: concentra-se no aspecto de curadoria digital em geral; o workflow organizado para simplificar o processo de submisso e reunir informao relevante no repositrio; ele inclui ferramentas para importar e exportar documentos e uma estrutura de diretrio simples, na qual os metadados Dublin Core so armazenados em arquivos XML (http://www.dspace.org). As pesquisas na rea continuam a surgir e os objetivos so cada vez mais variados. No RLG DigiNews volume 9 nmero 4 de 2005, foram mencionados 10 programas promissores de pesquisa em preservao digital. O que caracterizam esses projetos a necessidade de que a tecnologia possibilite mais procedimentos
155 automatizados de preservao digital e que existam mecanismos que integrem requisitos de auditoria no gerenciamento da preservao de objetos digitais. Tambm existem recomendaes publicadas pela National Science Foundation (NSF) nos Estados Unidos e pela Community Research & Development Information Service (CORDIS) na Inglaterra, sobre tipos de infra-estrutura que sejam proporcionais ao crescimento do tamanho dos repositrios de contedo digital. Os padres de converso digital e as melhores prticas tm evoludo, assim como as iniciativas mais importantes de metadados e protocolos de intercmbio, alm das tecnologias para mover informao digital de um hardware e software para outro. Contudo, o desenvolvimento das infra-estruturas da preservao da informao digital tem sido lento. 43 Mas um sinal de maturidade da rea , segundo Lavoie e Dempsey (2004), o entendimento de que a preservao digital no apenas uma parte tcnica que acontece como um processo isolado mas, sim como parte de um ambiente maior que compreende toda a informao digital.
2.4.2 Infra-estrutura organizacional
Existem algumas reas da infra-estrutura organizacional que precisam de definies mais claras, tais como a necessidade de integrar as polticas organizacionais para a preservao digital com as implementaes tecnolgicas e a necessidade de desenvolver e envolver pessoas com conhecimentos sobre preservao digital. Segundo Nancy Y. McGovern (2007), o pilar organizacional da preservao digital determina o tipo de procedimentos que esto sendo empregados, se ela resultado de um mandato ou uma norma institucional, seu escopo, seus objetivos e o pessoal comprometido. Na dcada de 1990, a infra- estrutura organizacional era o item menos observado pelas iniciativas de preservao digital, mostrando a ausncia de comprometimento na prpria misso
43 Na pgina Digital Curation Tools do Digital Curation Centre encontra-se uma lista completa de ferramentas e tecnologias em software livre para os processos de preservao digital: http://www.dcc.ac.uk/tools/digital-curation-tools/ Acesso em: 12/out/2008.
156 das instituies de alguma declarao relacionada com a permanncia das informaes e a falta de programas de preservao digital sustentveis. Naquele perodo, esperava-se por uma soluo nica que fosse o suficientemente forte e que servisse para inibir o desenvolvimento da responsabilidade organizacional pela preservao digital. J em 2002, com a publicao do relatrio da RLG/OCLC sobre os atributos e responsabilidades dos repositrios digitais confiveis e o desenvolvimento dos softwares abertos para repositrios e o Modelo de Referncia OAIS (SAAI), a infra-estrutura organizacional da preservao digital se fortaleceu, facilitando o desenvolvimento de polticas de preservao digital nas organizaes e o reconhecimento do papel central que tem a certificao. Como mencionado no subseo 2.2.5, o modelo de referncia OAIS/SAAI representa a expresso mais formal e compreensiva do processo de arquivamento disponvel comunidade que trabalha com preservao de objetos digitais; identifica documentos que so necessrios, tais como um acordo de submisso, formatos padro, controle de acesso fsico, administrao de bases de dados, gerenciamento de armazenamento, recuperao de desastres, evoluo do sistema, padres de migrao e outros procedimentos. O modelo proporciona uma linguagem comum e um conjunto de funes para serem discutidas e para poder mapear o desenvolvimento organizacional na questo da preservao digital. Por ser considerado um padro para arquitetura dos repositrios e arquivos digitais, o OAIS/SAAI proporciona a estrutura onde os metadados de preservao e outros padres podem ser desenvolvidos. Ele tambm possibilita que um software de repositrio possa exportar de forma padronizada seus metadados arquivados em formato XML para facilitar a migrao para outro sistema. Considerado, desde 2003, por vrios pesquisadores como a base conceitual dos repositrios de informao cientfica, o modelo OAIS/SAAI um padro ISO e a maioria dos sistemas de preservao digital est sendo reestruturada para ficar em conformidade com ele. Essas iniciativas esto tentando inserir Pacotes de Submisso de Informao (PSI) e produzindo Pacotes de Disseminao de Informao (PDI), com a finalidade de se adequar ao modelo. Como uma entidade que opera na administrao do OAIS, o planejamento da preservao tem como objetivo monitorar as mudanas tecnolgicas que podem afetar tanto os consumidores como os produtores de um repositrio digital. Nesta
157 parte do processo so realizadas anlises peridicas das ferramentas que vm surgindo, para desenvolver padres abertos de formatos e sistemas. Uma das funes de preservao do OAIS suportar a migrao e transformao dos dados com algum grau de automao (WALKER; THOMA, 2004). O desenvolvimento de futuros conversores de formatos poder ser facilitado, se mais repositrios digitais programarem seus metadados seguindo o modelo OAIS, instalando aplicativos j em funcionamento no seu repositrio (ex.: a ferramenta de converso de documentos MyMorph da National Library of Medicine e a ferramenta de validao e extrao de formato de objetos digitais JHOVE da Harvard Unversity Library), ou pelo o uso de servios de migrao de formato como o TOM (Typed Object Model) da Carnegie-Mellon University. Apesar da importncia das tecnologias a serem usadas para combater a obsolescncia dos suportes e mdias, as mudanas organizacionais continuam a ser uma das ameaas para a estabilidade da informao de longo prazo (LAVOIE; DEMPSEY, 2004). O planejamento da preservao dever considerar o uso de software livre, estruturado em linguagem de banco de dados SQL, para prover uma fcil interoperabilidade entre diversos sistemas.
2.4.3 Consolidao das iniciativas de preservao digital
Os sistemas de preservao digital se estendem para fora das instituies, usando ferramentas agregadoras, organizando comunidades de usurios de recursos digitais, incentivando o aumento do material disponibilizado nas bibliotecas digitais. Ainda assim, a preservao digital continua sendo um territrio desconhecido para muitas instituies pblicas e privadas. Organismos de pesquisa de vrios pases tm manifestado suas reservas em relao s implicaes econmicas da preservao a longo prazo, assunto que no tem sido tratado diretamente com as agncias financiadoras. Para Thibodeau (2002), entre os mais importantes desenvolvimentos na preservao digital desde 1996, est o alerta que a National Archives e a Library of Congress dos Estados Unidos (LC), tm levantado sobre a possvel perda catastrfica da informao atual. Conseqentemente, as duas agncias tm
158 conseguido obter mandatos e financiamento do Congresso daquele pas para abordar o problema da preservao digital. As instituies tradicionalmente comprometidas com a preservao da herana cultural e da histria tm empreendido alguns esforos com financiamento de governos locais. Os arquivos e bibliotecas nacionais tm manifestado o interesse oficial dos estados de documentar aspectos culturais relevantes de determinado perodo ou evento. Nos Estados Unidos, a Library of Congress tm realizado alguns dos maiores esforos (American Memory) que atraem o financiamento da iniciativa privada, mas o interesse da LC pelo crescente nmero de objetos nascidos digitais s comeou em 2000, com a iniciativa chamada National Digital Information Infrastructure Program (NDIIP) (FRIEDLANDER, 2002). Partindo da idia de que exista a necessidade latente de garantir o acesso informao de longo prazo, algumas aes tm sido propostas aos gerentes das colees digitais tanto em instituies detentoras de acervos culturais, quanto nas dos acervos cientficos. So elas: colaborao e intercmbio de experincias, adoo estratgia estruturada de preservao digital e criao de uma infra- estrutura de repositrios de preservao digital. Duas instituies que tm acompanhado o desenvolvimento das prticas da preservao digital so o International Council for Scientific and Technical Information (ICSTI) e o Grupo e Trabalho de Preservao Digital CENDI (U.S. Federal Information Managers Group). Os relatrios produzidos por essas duas instituies tm servido para acompanhar os projetos implementados por instituies das reas de C&T (HODGE; FRANGAKIS, 2004). Os dados coletados so aqueles relacionados com prticas - divididas por tipo de documento, formato, workflow estabelecido pelo sistema operacional escolhido, atividades padro - e a disponibilizao dos pacotes de software. No levantamento de 2004, foram coletados dados de mais de 50 sistemas ou projetos de preservao digital de vrios pases e instituies. As principais concluses alcanadas foram: a) um panorama do estado atual das prticas nas reas de C&T; b) a identificao dos mais importantes temas abordados; c) um conjunto de lies aprendidas e futuras aes. No Quadro 7, podem ser visualizadas as estratgias de preservao adotadas em vrios projetos ou sistemas operacionais selecionados na pesquisa do CENDI/ICSTI (HODGE; FRANGAKIS, 2004).
159 ESTRATGIAS
Poltica de Arquivamento
Migrao
Padres Abertos
Metadados de Preservao
Colaborao
Repositrio Institucional AIA X X X X AIP X X X ALEXA X X X DIAS X X X DiVA X X X X Dspace X X X X X X ESD X EROS X X X FEDORA TM
X X X X X GPO X X X IUCR X X X JSTOR X X X X LSDA X X LOCKSS X X NASA X X X NLM X X X NMM X X OCLC PANDORA X X X X X PUbMed X X X
S I S T E M A S VERS X X X X TOTAL 12 17 5 15 10 7 Quadro 7 Estratgias de preservao adotadas pelos 21 sistemas operacionais Fonte: CENDI/ICSTI Hodge e Frangakis (2004)
Os 21 projetos selecionados por Hodge e Frangakis gerenciam ampla gama de recursos de informao cientfica. No Quadro 7, so mostradas as estratgias detectadas nos diferentes projetos de sistemas de preservao digital de informao cientfica. A maioria dos projetos possua polticas de arquivamento e normas relacionadas para a criao de metadados. A estratgia de migrao foi a mais usada nos sistemas levantados. A estratgia de emulao no foi mencionada como uma das mais importantes para essas organizaes. A colaborao foi assinalada como significativa junto comunidade de desenvolvedores de sistemas de preservao digital. A Unio Europia criou o projeto Erpanet, estabelecido em novembro de 2001, tendo como finalidade unir as diversas iniciativas na rea de preservao digital. O projeto europeu publicou o Erpanet Digital Preservation Charter, uma declarao dos pases europeus que serve como fundo para a cooperao entre as diversas iniciativas, envolvendo cada um dos participantes do ciclo de vida dos
160 objetos digitais. O Erpanet apontou os motivos da importncia de participar de projetos cooperativos de preservao digital: 1) alcanar melhor administrao dos riscos; 2) participar de um marco comum de trabalho para benchmarking do acesso digital e das melhores prticas de preservao; 3) construir parcerias; 4) chamar a ateno os principais atores envolvidos com objetos digitais; 5) evitar redundncia; 6) maximizar os esforos de preservao. Nos pases do Primeiro Mundo, esto sendo criadas redes de comunicao entre especialistas de uma ou mais naes, com o objetivo de discutir temas especficos da preservao de objetos digitais de longo prazo com caractersticas locais, como o idioma. Blake (2004) narra que na Alemanha foi criada uma rede bilnge para intercmbio de experincias fora e dentro daquele pas. A experincia tem favorecido a discusso sobre estratgias e polticas de arquivamento digital. O tema da colaborao tem sido discutido tambm no contexto da interoperabilidade. nessa estrutura que esto apoiados todos os aspectos dos repositrios digitais de acesso livre. Estrategicamente, essa abertura e cooperao geram uma multiplicao de benefcios para todos os participantes, incluindo novas habilidades e experincias, modelos de negcios sustentveis, estratgias de preservao mais estruturadas etc. O uso de padres abertos e de protocolos para a interoperabilidade dos arquivos permite a incorporao de colaboradores internacionais, formalizando redes de informao que minimizam a redundncia dos recursos e custos na sua manuteno. As idias bsicas do modelo OAIS podem ser detectadas na maioria dos projetos de pesquisa de preservao digital (LeFURGY, 2002). So casos como o da Library of Congress, baseado na digitalizao usando a padronizao dos formatos e o uso de metadados de preservao; outro exemplo j mencionado o VERS da Australia National Library, que usa metodologias detalhadas para a criao de documentos digitais no gerenciamento arquivstico; cita-se tambm o CURL Exemplars for Digital Archives (CEDAR) na Inglaterra, que desenvolve metodologias baseadas no modelo de representao das propriedades dos objetos digitais; e o
161 projeto do Electronic Record Archives (ERA) dos Estados Unidos, que est utilizando o modelo OAIS nas suas propostas de gerenciamento de materiais digitais persistentes, definindo as estruturas e metadados necessrios para seu acesso e recuperao. As iniciativas nacionais de preservao digital tm surgido a partir de grandes instituies depositrias e de centros de pesquisa que vm optando pela proposta dos Arquivos Abertos e o Acesso Livre. Algumas delas j foram destacadas por Muir e por Studwell e Ghetu, em 2003. Tambm uma lista mais abrangente encontra-se no Apndice D. Entre as mais citadas na literatura esto as seguintes: 1. DIAS, projeto para software de arquivamento; 2. Digital Archive, o arquivo de documentos governamentais da National Archives; 3. HD-ROM e HD- Rosetta produto de preservao; 4. Internet Archive, projeto para software de arquivamento; 5. InterPares, projeto internacional; 6. JISC e SHERPA, plano e projeto de instituies da Inglaterra; 7. LOCKSS, projeto da Stanford University; 8. NDIIPP, plano de preservao digital da Library of Congress; 9. PADI e PANDORA, plano e arquivo web da National Library of Australia; 10. Preservation Metadata Extraction Tool, componente do programa de preservao digital da National Library of New Zealand; 11. UVC estratgia de cpia centralizada.
Os projetos mencionados tm como origem os grupos de pesquisa que, mesmo separadamente, possuem o mesmo objetivo. Alguns tm como centro de suas atividades a produo acadmica e a construo de consrcios. Com o crescimento de repositrios institucionais, espera-se que essas instituies adotem mais os sistemas distribudos e surjam mais iniciativas colaborativas. Alguns esforos esto apontando nessa direo, como o caso do projeto SHERPA (Securing a Hybrid Environment for Research Preservation and Access) na Inglaterra, que estuda implementao prtica das recomendaes para uma infra- estrutura tcnica de preservao desagregada. As funes de preservao desagregada, segundo Beagrie (2002), so servios de preservao institucionais
162 que podem dar suporte e beneficiar o planejamento de mecanismo de armazenamento distncia. As razes para o surgimento dessa proposta esto na natureza dos repositrios institucionais que, segundo James et al. (2003), apresentam as seguintes caractersticas: a) a maioria no tem como inerente os processos de preservao digital; b) no contam com pessoal suficiente com conhecimentos sobre preservao digital e, c) replicam servios e custos. Os trabalhos nas iniciativas e projetos de preservao digital continuam reproduzindo-se de forma rpida, com desenvolvimentos significativos de sistemas, pacotes de softwares, legislaes de depsito, parcerias e propostas de novos padres. Mesmo com isso, ainda existem algumas reas a serem abordadas. Na seo a seguir, trataremos dos fatores que levam sustentabilidade dos sistemas de preservao digital emergentes.
2.5 SUSTENTABILIDADE DA PRESERVAO DIGITAL
As pesquisas internacionais com os responsveis por colees digitais mostram que as organizaes ainda no podem garantir recursos para a preservao digital. Essa deficincia de recursos uma das grandes ameaas preservao digital identificadas por especialistas da rea (BEAGRIE, 2003; BRADLEY, 2004; WHEATLEY, 2003), alm de projetos e polticas insuficientes, suporte inadequado por parte das equipes, a obsolescncia tecnolgica e a falta de experincia dos responsveis. Diferentemente da infra-estrutura organizacional que fica incorporada no documento do TDR, e da infra-estrutura tecnolgica definida dentro do modelo de referncia OAIS, a parte dos recursos necessrios para a preservao digital no tem nenhum documento produzido pela comunidade que expresse qual seu escopo e seus requisitos. O que a literatura reporta que poucas instituies tm alocado recursos dos seus oramentos para os cuidados com os materiais digitais de longo prazo. A necessidade de realizar aes imediatas para preservar colees
163 digitais fica atrs do desejo de criar e disseminar novas formas de contedo digital (LAVOIE; DEMPSEY, 2004). A sustentabilidade econmica a habilidade de conduzir recursos suficientes e de forma constante para alcanar os objetivos da preservao digital. O fato de haver includo o atributo sustentabilidade financeira no documento TDR (RLG/OCLC, 2002) simboliza a primeira vez que os custos da preservao digital foram expressos explicitamente. Um avano nesse aspecto foi o fato de que, pelo menos no exterior, algumas instituies do ensino superior destinam fundos para a preservao digital (ex.: o MIT para o DSpace, University of Cornell para projetos de colees digitais). Tambm considerado um avano o fato de existirem programas de preservao digital que tm um tempo de vida maior do que os projetos de preservao digital (ex.: JISC, NEH, NSF, NHPRC). Esses programas desenvolveram polticas e receberam fundos destinados pesquisa. Alm desses avanos, a comunidade da rea tem produzido ampla literatura sobre os custos que a preservao digital envolve. Alguns desses trabalhos tratam sobre modelos econmicos (LAVOIE, 2003; SANNETT, 2002; 2003) e ferramentas para comparar custos entre a migrao e a emulao ao longo do tempo (OLTMANS; KOL, 2005) entre outros. Esses documentos tm ajudado a entender os custos, mas no tm sido suficientes para a criao de um documento produzido pela comunidade capaz de sustentar o impacto que os custos representados pelo desenvolvimento e as implementaes das estratgias de preservao podem causar em cada caso, particularmente. Para os tericos da preservao digital, a distribuio dos custos est determinada pelo contexto organizacional e est amarrada implementao tecnolgica no programa de preservao digital de uma organizao. Em resumo, seria o o que e o como da preservao digital determinando o quanto. A designao de fundos por parte das organizaes para a preservao digital e um documento por parte da comunidade que expresse os custos gerenciais de estratgias de preservao digital compem os dois aspectos que ainda se encontram em construo (LAVOIE, 2008). Cada estratgia tcnica de preservao e de acesso implica diferentes custos e cronogramas. A preservao digital requer recursos disponveis permanentemente que comeam a se delinear no momento da criao do recurso.
164 Muitos materiais so produzidos fora dos centros de informao e das bibliotecas. Nesses casos, so os editores e outros criadores de contedos que devem adotar os padres apropriados e as tecnologias que daro subsdios preservao. Segundo Feeney (1999), [...] diferentemente da situao que se aplica aos livros, o arquivamento digital requer investimentos relativamente freqentes para superar a obsolescncia rpida produzida pelas mudanas tecnolgicas. Os provedores de material digital, no correr do tempo, precisam investir para criar documentao e metadados, gerando novas formas de material para manter o acesso. Esse investimento deve ser levado em considerao no momento de discutir os direitos de uso e reuso dos objetos digitais. Do mesmo modo, entre os aspectos que devem ser identificados em qualquer estratgia de preservao, est a necessidade de contratao e de capacitao de pessoal. Se no houver nenhum plano administrativo que cubra esses itens, nenhuma manuteno de acervos de longo prazo ser bem-sucedida. Quanto preservao digital, Chilvers (2000) deixa claro que sua viabilizao est relacionada aos aspectos financeiros, gerenciais e tcnicos da instituio onde ocorrer, e tem como objetivo prolongar a vida til do dado. Existe uma lacuna entre estabelecer uma estratgia de preservao e a sua implementao. Uma vez que uma das grandes vantagens do documento digital a sua interoperabilidade com vrios outros mecanismos ao mesmo tempo, se a questo da informtica (hardware, software e obsolescncia tecnolgica, entre outros) no estiver resolvida, sofrendo constantes anlises e avanos, o documento perder uma de suas caractersticas vitais e que o distingue de outras formas de documentos. O problema maior aparece no quesito financiamento, j que a maioria dos projetos consegue recursos apenas por curto perodo de tempo, quando qualquer projeto de preservao digital requer um investimento a longo prazo. A natureza dos registros proporciona a dimenso do valor que eles podem chegar a ter no decorrer do tempo (SANTANNA, 2001). O Digital Archiving Working Group, da JISC/NPO, analisando o gerenciamento dos custos da preservao digital, sugere que os materiais digitais sejam arquivados em formatos padro, em mdia padro, e gerenciados dentro de alguns dos poucos modelos de sistema de preservao operacionais existentes.
165 Para Hendley (1998), existem algumas dificuldades no desenvolvimento de modelos para custos com a preservao digital. Segundo ele, as organizaes precisam levar em considerao a quantidade e o nvel de acesso que pretendem oferecer, pois isso influencia os custos. Tambm, o treinamento de especialistas e tcnicos deve ser contemplado nos custos das atividades da estratgia de centros de preservao digital (CHAPMAN, 2003). O custo de estruturar o que envolve esta tecnologia, para garantir o trabalho cultural e intelectual da era digital, ser ainda mais notvel se desenvolvido ainda no comeo do planejamento dos custos, para que estes sejam minimizados e efetivamente aplicados. Pontos-chave como este devem ser pensados para identificar e selecionar prticas apropriadas de custo-benefcio para cada estgio no ciclo de vida dos recursos digitais. A preservao digital pode ser considerada uma atividade economicamente sustentvel, apesar de serem insuficientes os oramentos atribudos a vrias iniciativas at hoje. A deciso de como devem ser atribudos os recursos financeiros continua influenciada pela vontade dos administradores de criar e disseminar novas formas de contedo digital e pela atribuio de fundos para projetos de curta durao. Uma perspectiva colaborativa propiciaria a distribuio dos custos entre vrias instituies, mitigando gastos com infra-estrutura e pessoal especializado. Em geral, os custos com a preservao digital, se no forem compartilhados entre instituies parceiras, podem chegar a ser significativos e at ultrapassar os requeridos para sua contrapartida em papel. Economicamente, a sustentabilidade da preservao digital depende dos seguintes fatores: a) reconhecimento dos benefcios de preservar materiais digitais seguindo critrios especficos de seleo; b) incentivos apropriados para provocar s autoridades para atuar a favor do interesse pblico; c) mecanismos que garantam a destinao de recursos para as atividades de preservao digital nas organizaes, local e coletivamente; d) uso eficiente dos escassos recursos financeiros, e e) planejamento organizado e com autoridade das atividades definidas nas polticas de preservao digital.
166 No exterior, o financiamento estatal tem sido imprescindvel para o desenvolvimento de projetos de preservao digital. Um exemplo o da Library of Congress, que em 2000, desenvolveu o National Digital Information Infrastructure and Preservation Program (NDIIP), como uma arquitetura nacional para a preservao de material digital, por meio de uma rede de parceiros formada por bibliotecas, editoras, agncias federais e do setor privado. O plano estratgico inicial aprovado com oramento de US$ 25 milhes contou com parcerias entre empresas e comunidades nacionais e internacionais nas reas de editorao, tecnologias e direitos autorais. Para 2007, o financiamento federal e as contribuies particulares chegaram a US$ 75 milhes. Agncias de fomento esto comeando a participar; fundaes como a Andrew W. Mellon Foundation tm financiado projetos de arquivamento de publicaes eletrnicas, um deles sobre os arquivos digitais disponibilizados na rede e outro que focaliza aqueles que so armazenados pelas editoras. Com as pesquisas desenvolvidas nesses projetos pode-se extrair informaes para os bibliotecrios e editores sobre a necessidade de confiar em seus parceiros no campo digital. A confiana um dos elementos fundamentais da infra-estrutura da preservao digital a ser criada em qualquer pas.
2.5.1 Sustentabilidade comercial
importante reconhecer que cada estratgia tcnica de preservao e de acesso implica diferentes custos e cronogramas. Os grandes projetos de repositrios digitais precisam de uma sustentabilidade financeira comprovada para serem considerados confiveis. O documento da RLG/OCLC (2002) recomenda que os repositrios digitais devam estar aderidos a corretas prticas de negcios e possurem planos economicamente sustentveis. O grau de sustentabilidade financeira pode estar influenciado pelo tipo de organizao que financia e pelas caractersticas dos servios de informao. As iniciativas mantidas pelos governos e com obrigatoriedade no depsito legal e guarda de informaes oficiais podem ser mais facilmente beneficiados, enquanto aquelas instituies que tenham como propsito o acesso informao (ex.: as IES)
167 podem se respaldar nas necessidades dos usurios e no desenvolvimento dos seus acervos. As empresas privadas tm estado envolvidas na preservao digital, desde que foram introduzidas as primeiras verses dos hardware e software. O interesse na preservao de dados armazenados nas primeiras verses se faz presente na oferta das novas solues. Seus efeitos nos projetos de preservao digital podem ser percebidos na estimativa dos custos na implementao desses projetos. Eis alguns dos servios comerciais de preservao digital usados no exterior so: a) Archivas, Permabits, Bamboo b) Chronopolis grid storage (SDSC, USA) c) IBM Digital Library system d) Iron Mountain, Akamai e) JSTOR f) OCLC digital archive g) Portico (Ithaka Harbors, Inc.). Em vrios pases as companhias que oferecem seus servios e aplicaes de preservao digital tm trabalhado colaborativamente com instituies de pesquisa e agncias governamentais. Por outro lado, o setor privado tem criado solues para a preservao da informao digital de arquivos de e-mail, texto completo e bases de dados, aplicveis em diferentes momentos do ciclo de vida do documento digital. Entre as dificuldades que apresenta o trabalho com as companhias privadas no campo da preservao. Dois aspectos se ressaltam: 1) ausncia do registro da guarda dos dados e dos dados estatsticos das falhas; esses dados so considerados como rotinas ou proprietrios; 2) os dados tcnicos dos registros so guardados como sendo departamentais ou pessoais e no corporativos, ficando distribudos em ferramentas e verses operadas sem controle das atualizaes. Para Gladney (2001) o problema da preservao digital na rea comercial est centrado no fato de que os beneficiados no vislumbram a utilidade dessas atividades seno at depois de muitos anos de o material haver sido salvo. Hodge e Caroll (1999) afirmam que os atores principais no percebem o problema da mesma forma: para os criadores dos documentos digitais, o envolvimento com a permanncia dos dados est reduzido apenas ao processo de arquivamento
168 (comeando a perceber a importncia dos metadados) e para os editores o mnimo de ao (procedimentos de backup) j suficiente. Alguns editores comerciais responsveis pela guarda permanente de dados individuais apiam a cobrana do acesso e armazenamento dos registros digitais. Uma tendncia das organizaes ao tratar de obter recursos para a construo de seus acervos digitais est sendo a oferta de servios com valor agregado relacionados com a preservao dos materiais armazenados. Um exemplo o OCLC, que oferece um servio para o gerenciamento de colees de bibliotecas digitais chamado ContentDM, disponvel para ser usado de forma gratuita no servidor do OCLC apenas para os associados ao consrcio Digital Co-op, que ganham descontos em outros servios, como cursos e suporte tcnico. O OCLC disponibiliza servios terceirizados de arquivamento digital no seu OCLC Digital Archive, consistindo numa inscrio anual e cobrando pelos custos de armazenamento mensalmente. A cobrana est determinada pelo nmero de gigabytes do contedo armazenado. Os participantes do Digital & Preservation Coperative tambm recebem descontos. Um caso de modelo econmico para financiamento de projetos de preservao baseados em plataforma de acesso livre o do MIT, que tem como plano (ex. DSpace) oferecer servios pagos de suporte para a criao de metadados especficos para servios de apoio a instituies que adotam o DSpace. A oferta de servios padronizados de preservao digital depender do crescimento da demanda das organizaes por formas economicamente sustentveis de atividades eficientes de preservao, dentro de sistemas distribudos. Segundo Lavoie (2004), a chave para um mercado sustentvel de servios de preservao cultivar a confiana entre aqueles que oferecem os servios e os que so potencialmente responsveis pelo uso desses servios. Finalmente, a sustentabilidade econmica da preservao digital precisa de mais dados sobre os custos reais das infra-estruturas tecnolgicas e organizacionais, e fica constatada a impossibilidade de manter um projeto de preservao digital desenvolvido localmente se no houver parcerias e distribuio dos custos com maior nmero de instituies. Esse estgio ser alcanado quando os projetos de preservao digital passarem da fase de inicial de avaliao da reformatao dos suportes fsicos, do estabelecimento de repositrios digitais e da insero padronizada de registros digitais.
169
2.6 POLTICAS DE PRESERVAO DIGITAL
Muitos criadores de material digital com informao cientfica e tecnolgica precisam ter o controle do acesso a sua produo. Por no possurem conhecimentos de estratgias de preservao, esto preocupados com o fato de os materiais eletrnicos serem fceis de copiar e redistribuir. Em contrapartida, os provedores do material no correr do tempo precisam investir para gerar documentao revisada, metadados e criar novas formas de material para manter o acesso (LAVOIE; GARTNER, 2005). A soluo ideal a aliana entre a organizao habilitada no gerenciamento dos dados digitais e os criadores, de tal forma que possam criar conhecimento do material mantendo o controle das decises sobre o contedo a ser preservado e os intervalos para essa atividade. Os sistemas de gerenciamento de contedos digitais, tais como repositrios institucionais e bibliotecas digitais de teses e dissertaes, propem-se a preservar os contedos digitais dos quais as instituies possuem os direitos autorais. Algumas delas assumem esse direito e outras obtm a confirmao dessa permisso com a assinatura dos autores desses trabalhos (ex.: a Biblioteca Digital de Teses e Dissertaes no Brasil). Em pases como os Estados Unidos (Digital Millennium Copyright Act, 1998), as legislaes nacionais requerem que seja solicitada permisso dos detentores dos direitos autorais para preservar cpias de contedos protegidos com alguma forma de direito autoral. Tanto os materiais de acesso livre como os de acesso restrito podem exigir algum tipo de permisso. No que diz respeito aos repositrios de acesso livre, todos os trabalhos depositados continuam sendo propriedade intelectual dos seus respectivos autores. Cabe a estes a responsabilidade de decidir o que deve ou no ser depositado e que documentos podem ou no ser consultados na ntegra. Nas instituies em geral, a maior parte dos documentos e publicaes tcnico-cientficas resultado das atividades de seus recursos humanos e, por isto, pode ser autodepositada e disponibilizada no repositrio. O acesso livre sem restries de copyright vivel pelos seguintes motivos: a) os autores so os que detm os direitos intelectuais das suas teses e dissertaes, da maioria dos trabalhos
170 apresentados em eventos (a menos que tenham transferido todos os direitos explicitamente), dos relatrios tcnicos, working papers etc.; b) a maioria significativa dos peridicos cientficos (aproximadamente 92%) permite algum tipo de autodepsito dos pr-prints (verses de trabalhos anteriores avaliao pelos pares e aceite para publicao) e/ou de ps-prints (verso final, depois de ter sido avaliada pelos pares aprovada para publicao) dos artigos que eles publicam (HARNAD, 2007); e c) mesmo quando autores assinaram alguma forma de transferncia de copyrights restrito, a consulta queles que detm os direitos pode resultar na autorizao (ou no mnimo na no proibio) do autodepsito no RI. A disponibilizao de documentos em acesso livre pode constituir uma infrao apenas nos casos de licena concedida a terceiros (editores, por exemplo) pelo autor/instituio, ou por conter assuntos confidenciais ou que sejam destinados comercializao (livros). Neste caso, apenas a sua referncia (e seus respectivos metadados) pode ser disponibilizada no repositrio. Um exemplo de sistema que especifica que unicamente sero depositados materiais com permisso de acesso o LOCKSS. Ele replica contedos de materiais em bibliotecas e estabelece que seja acrescentada uma declarao por parte da organizao detentora dos direitos autorais das publicaes preservadas, na qual garantida a permisso do acesso aos materiais para os leitores da instituio que hospeda o LOCKSS. Tambm, com a adoo de licenas Creative Commons os sistemas esto providenciando as permisses necessrias para a preservao digital. Para as instituies de depsito legal, como as bibliotecas nacionais, a legislao para a preservao dos documentos j est estabelecida e isso incentiva os detentores de direitos autorais a cooperar e colocar seus materiais disposio. Em janeiro de 2000 a Inglaterra foi o primeiro pas a introduzir a recomendao para o depsito legal de publicaes eletrnicas, sendo plausveis de negociao caso por caso. O projeto Internet Archive toma uma abordagem alternativa ao coletar e preservar contedos protegidos com direitos autorais sem ter solicitado permisso. A estratgia no favorece uma poltica de preservao digital porque ela fora os gerentes dos sistemas a retirar imediatamente qualquer material que seja identificado como protegido por leis de direitos autorais. A forma a ser adotada por gestores de
171 sistemas de informao seria obter e guardar a declarao expressa da permisso para preservar cada documento.
2.6.1 Permisses para preservar
A elaborao de polticas e o estabelecimento de iniciativas pioneiras de preservao digital esto colaborando para que os padres e normas que esto surgindo possam afirmar-se como estratgias confiveis e solues a serem seguidas pelas instituies responsveis pela informao cientfica em formato digital. Um dos princpios estabelecidos em convnios internacionais e em vrias legislaes nacionais a obrigatoriedade do depsito em arquivos ou bibliotecas de uma ou mais cpias dos trabalhos produzidos por instituies pblicas e privadas. Mas na maioria dos pases o depsito legal ainda no obrigatrio para os documentos digitais, apesar de, como mencionado anteriormente, esse tipo de material requerer um gerenciamento capaz de garantir que o material produzido em um pas esteja disponvel permanentemente. A meta do depsito legal garantir o acesso. Ao se estabelecer uma legislao para o depsito legal de objetos digitais, levantam-se questes ligadas ao acesso, tais como os custos e a proteo dos direitos do autor/editor (PADI, 2003). Pases como a Nova Zelndia j estenderam suas polticas aplicadas s verses impressas para os materiais eletrnicos e verses on-line. Na Noruega, a mesma legislao est voltada em primeira instncia para a preservao cultural e a proteo dos direitos autorais de qualquer [...] trabalho que possa ser lido, ouvido, transmitido e que possa ser escrito e reproduzido em formatos eletrnicos no futuro [...] (VAN NUYS, 2003, p. 16). As bibliotecas nacionais de vrios pases esto comeando a aplicar algumas normas e leis que combinam diferentes formas de desenvolvimento de colees e proteo dos direitos autorais. Elas mencionam a importncia de desenvolver rotinas para a seleo, descrio, identificao e armazenamento de todo tipo de documento digital. Uma negociao entre as bibliotecas nacionais e as
172 editoras comea a criar esquemas que permitam o depsito voluntrio, seguindo acordos bilaterais (HODGE; FRANGAKIS, 2004). Em vrios pases, com o crescimento no nmero de projetos de preservao digital, comeam a aparecer documentos e decises que representam o fortalecimento do aspecto organizacional da preservao digital. Os responsveis por esses projetos detectaram os elementos essenciais para programas de preservao digital fortes, tais como: seguir e adotar os projetos j testados, implementar as melhores prticas, trabalhar colaborativamente e documentar as polticas, procedimentos e padres adotados (PADI, 2003). Desde 1996 vem surgindo polticas de preservao digital em diferentes tipos de organizaes, universidades, arquivos nacionais, bibliotecas nacionais, etc. Algumas das mais conhecidas citadas por McGovern (2007) so as seguintes: Arts and Humanities Data Service (2004) British Library (2002) Columbia University Library (2000) Cornell University Library (2004) Inter-University Consortium for Political and Social Research (2007) Library and Archives Canada (2002) National Archives UK (2000) National Library Australia (2001) National Library of New Zealand (2003) National Library of Wales (2003) Nestor Policy Project da Alemanha (2004) North Caroline Department of Cultural Resources (2000) UK data archives (2005) Os argumentos relacionados com uma poltica de preservao digital observados nos exemplos citados e publicados no exterior podem ser exemplificados por duas das primeiras instituies a divulgar os pontos focais das legislaes propostas. O primeiro exemplo o modelo de poltica de preservao digital da NLA, promulgado em 24 de fevereiro de 2002, que se destaca pela sua natureza poltica e enfoque institucional, declarando a inteno de [...] preservar e manter documentos (digitais ou no) [...], contando com a colaborao de instituies parceiras.
173 Depois de mencionar o escopo da poltica, adota-se uma definio de preservao digital e reafirma-se que as aes sero aplicadas a qualquer tipo de material digital segundo a natureza dos documentos. O modelo a ser seguido o OAIS e ele fica explcito na declarao dos seus princpios operacionais: 1) necessidade de desenvolver prticas adequadas e coerentes para o tratamento mais apropriado dos materiais digitais; 2) uso do modelo de referncia OAIS como um exemplo para a construo e gerenciamento do seu arquivo; 3) comprometimento no uso de normas e padres internacionais no desenvolvimento de dos sistemas e da infra-estrutura para a preservao digital; 4) reconhecimento da importncia da experimentao e desenvolvimento de processos que compreendam modelos de negcios e cumprimento da norma OAIS; 5) definio do Pacote de Arquivamento de Informao a ser usada seguindo o OAIS. Alm de se comprometer a incentivar a pesquisa na rea e a dar apoio ao desenvolvimento de padres e normas, a poltica da NLA expressa o comprometimento da instituio com relao s colees digitais nesse pas. Ela abre espao para a especificao do uso de estratgias de preservao digital e do trabalho com rgos oficiais para fundamentar a sustentabilidade econmica. O segundo exemplo de poltica de preservao digital da British Library, formalizado no dia 14 de novembro de 2002. Centrada na sua misso de preservar materiais digitais, a British Library adota uma abordagem estratgica na implementao das aes de preservao de objetos digitais, entre as quais estariam as de colaborao, estudo e pesquisa das caractersticas, desafios e especificaes desses materiais. O comprometimento institucional da British Library vai at o estabelecimento de requisitos com relao a estratgias a serem implementadas, controle de formatos, projetos de digitalizao e disposio para a implementao de solues novas. As duas polticas citadas so exemplos da formalizao das intenes de programas e projetos de instituies amparadas nas leis de depsito legal que esto comeando a formular critrios para o estabelecimento do elemento preservao
174 nas solues a serem adotadas para o armazenamento de objetos digitais (FOOT, 2001).
2.6.2 Gerenciamento dos direitos de propriedade
Dentro do contexto estratgico de criao e preservao de recursos digitais, o relatrio da Arts and Humanities Data Service (AHDS) da Inglaterra ressalta o contexto das polticas aplicveis para os trs estgios dentro do ciclo de vida de um recurso digital: criao, administrao/preservao e uso (BEAGRIE; GREENSTEIN, 1998). Uma das principais concluses foi a de que as decises que podem afetar a disponibilizao dos materiais digitais precisam ser tomadas no incio do ciclo de vida do objeto digital. Para os materiais digitais, a ligao entre sua criao e a preservao muito mais importante devido a que decises sobre a forma como os objetos digitais so criados influenciam a maneira como eles podem ser preservados. Do mesmo modo, as decises tomadas no momento da preservao podem influenciar como esse material ser acessado no futuro. O gerenciamento dos direitos de propriedade intelectual de materiais digitais tem um significado mais argvel do que na mdia tradicional, pois deve considerar no apenas o contedo, mas tambm qualquer assunto relacionado ao software. Qualquer ao (cpias, encapsular contedo, emulao de software, migrao de contedo) envolve atividades que podem infringir permisses especficas dos que mantm os direitos. Esse tipo de gerenciamento cobre todos os processos que envolvem a definio e a propriedade dos direitos dos depositantes e os direitos dos usurios dos centros de informao. Greenstein (1997) define direitos autorais como aqueles que incluem direitos de propriedade intelectuais e assuntos legais relacionados com a proteo dos dados e confidecialidade. Ele assegura que os direitos inseridos em um recurso podem no apenas determinar como ele pode ser acessado e usado, mas tambm determinar o como e se eles podem legalmente ser preservados por terceiros.
175 No que se refere ao direito autoral, dois grandes acordos regulam a questo: a Conveno de Roma, que o principal tratado internacional em direito conexo, e a Conveno de Berna, que o tratado autoral do direito internacional principal. Esta ltima no faz uma iseno especfica para copiar todos os tipos de trabalho para finalidades da preservao (BERNE, 1986). Fornece, sim, uma regra geral sobre o direito de reproduo: 1. as isenes relativas ao direito de reproduo no devem ser demasiadamente amplas, devem ser incorporadas na lei para um alvo especfico e devem servir ao interesse pblico. Se uma iseno estatutria fosse adotada especificamente para finalidades da preservao, tais circunstncias seriam satisfeitas; 2. uma iseno no deve se opor explorao normal do trabalho (WIPO, 1996). No Brasil, a lei que trata desta questo a de n 9.610, sancionada em 19 de fevereiro de 1998 pelo ento presidente Fernando Henrique Cardoso. Para as unidades de informao, a definio de publicao, constante do art. 5, primordial: I - publicao - o oferecimento de obra literria, artstica ou cientfica ao conhecimento do pblico, com o consentimento do autor, ou de qualquer outro titular de direito de autor, por qualquer forma ou processo. Preservar significa copiar de alguma maneira, e o artigo 5 desta lei define reproduo como: VI - a cpia de um ou vrios exemplares de uma obra literria, artstica ou cientfica ou de um fonograma, de qualquer forma tangvel, incluindo qualquer armazenamento permanente ou temporrio por meios eletrnicos ou qualquer outro meio de fixao que venha a ser desenvolvido. J o art. 29 afirma que depende de autorizao prvia e expressa do autor a utilizao da obra, por quaisquer modalidades, tais como I - a reproduo parcial ou integral [...], e o art. 33 completa mostrando que ningum pode reproduzir obra que no pertena ao domnio pblico, a pretexto de anot-la, coment-la ou melhor-la, sem permisso do autor. No caso do armazenamento de documentos digitais em bases de dados, a lei 9.610 confirma a determinao existente de que depende da autorizao prvia do autor, pelo fato de, ao serem includos, transformar-se em uma forma de disseminao e reprografia (GANDELMAN, 1997).
176 Na Koninklijke Bibliotheek (KB) em Haia, a comisso do Institute for Information Law da Universidade de Amsterd examina os problemas relacionados ao direito autoral que poderiam impedir esforos para preservar e manter a acessibilidade de dados eletrnicos, uma vez que a preservao implica a reproduo em grande parte dos casos. De acordo com as diretrizes da KB, h dois mtodos para garantir a preservao de longo prazo de publicaes eletrnicas: 1) assegurar sua acessibilidade: a publicao pode ser retida em seu formulrio original junto com o hardware e a tecnologia necessrios para acessar, isto construindo uma "passagem" entre a velha e a nova tecnologia; 2) transferir a publicao s geraes mais novas de configuraes do hardware e software do computador, assim que a mais velha ameaar se tornar obsoleta. Isso envolve um nmero das tcnicas e procedimentos (incluindo converso e transferncia de dados) geralmente conhecidos pelo termo geral "migrao". Se a primeira opo for escolhida, a publicao eletrnica ainda assim precisar, eventualmente, ser copiada para ser preservada, j que, como todas as mdias existentes, as publicaes eletrnicas esto suscetveis deteriorao. A concluso final do Preservation of New Technology, um estudo compilado a pedido da American Commission on Preservation and Access of the Council on Library and Information Resources, que preservao significa copiar (BOERES; MRDERO, 2005). Em 2003 a NARA (U.S. National Archives and Records Administration) adotou a norma ISO 15489 para o gerenciamento dos registros eletrnicos em todo o ciclo de vida dos documentos digitais de carter oficial do governo americano. Essa norma surgiu na Austrlia (AS 4390) e est sendo usada como base para polticas de preservao de documentos digitais de vrias instituies daquele pas. A norma considera a gesto dos registros como uma seqncia integrada de processos, que vai desde quem usa para criao at seu acesso contnuo, ampliando as responsabilidades dos criadores e gerentes desses registros para todos os empregados da instituio mantenedora. O pr-requisito de preservabilidade pode ser alcanado unicamente mediante uma estratgia organizacional. Para a maioria das instituies de ensino
177 superior, a carncia de tempo, recursos e conhecimentos necessrios para garantir a preservao de sua produo intelectual de longo prazo, bem como a adoo de uma poltica de preservao poderiam facilitar o entendimento dos gestores sobre as principais concluses a que chegam os estudos atuais sobre o tema (BORES, 2004; ERPANET, 2003; FEATHER, 2004; FOOT, 2001): 1. a preservao de informao digital requer colaborao entre organizaes e pessoas envolvidas na criao e no gerenciamento; 2. a preservao comea no design de sistemas que daro suporte criao de objetos digitais; 3. deve ter-se claro o papel de cada um dos envolvidos no processo para identificar e apontar responsabilidades; 4. a preservao deve ser parte integrante de qualquer estratgia que inclua o uso de tecnologia de informao; 5. as estratgias de preservao e seus mtodos devero estar integrados em todas as atividades ou sistemas que criam ou usam informao digital. Uma poltica aceitvel de preservao digital implica observar e aplicar procedimentos que podem ser inclusive aceitos como estratgias de preservao. Entre eles esto os relativos tecnologia da informao, mais especificamente no tocante compatibilidade de hardware, software e migrao dos dados (converso para outro formato fsico ou digital, emulao tecnolgica e espelhamento dos dados), observao da integridade do contedo intelectual a ser preservado; anlise dos custos envolvidos no processo; ao desenvolvimento de uma criteriosa poltica de seleo do que ser preservado e, intimamente atrelada a isso, a observao das questes mencionadas sobre direito autoral.
2.7 MAPEAMENTO DOS CRITRIOS DE PRESERVAO DIGITAL
Entre as possibilidades de abordagem ao tema da preservao digital, est tentar identificar os critrios que sirvam como padro para comparar e julgar as melhores prticas nas organizaes. Numa rea relativamente nova e com uma variedade ainda no completamente definida de aplicaes, torna-se necessria a
178 formulao de indicadores que possam auxiliar na fundamentao de uma estratgia a ser escolhida. Devido ao escopo do tema desta tese, o estudo dos critrios de preservao digital focalizou-se nos projetos e iniciativas relacionadas com a informao tcnico-cientfica; so exemplos predominantemente resultantes de instituies de ensino e pesquisa que esto sendo consideradas como boas prticas e experincias de aprendizagem no campo dos repositrios digitais. A avaliao de qualquer prtica relacionada com os recursos digitais envolve estim-los segundo critrios prticos e tcnicos. Greenstein foi o primeiro a enfocar os critrios prticos de preservao relacionados a um conjunto de atividades que determinam a manuteno de colees digitais de informaes cientficas e culturais. Essas condies bsicas (BULLOCK, 1999) foram identificadas e aplicadas por vrios especialistas (bibliotecrios, arquivistas, gerentes de bibliotecas digitais) em diferentes iniciativas das quais partiram as primeiras polticas de preservao digital. O desenvolvimento dos programas e projetos de preservao tem apontado a necessidade de chegar a um acordo, no que seria o conjunto mnimo de critrios para o funcionamento de um repositrio de preservao da produo cientfica em formato digital. A maioria das propostas de critrios que vem surgindo menciona a influncia do modelo de referncia OAIS/SAAI, assim como, tambm, elas apresentam um conjunto de critrios para o planejamento de repositrios digitais. Alguns esboos de critrios encontravam-se presentes em propostas de preservao digital que focalizavam: o controle fsico e intelectual dos materiais para garantir sua preservao a longo prazo, com credenciamento de formatos de arquivos requeridos; a padronizao de estratgias de migrao, validao de dados e especificaes normativas para mdia fsica; a padronizao no uso de metadados de preservao. No centro dessas propostas, a maioria proveniente da rea arquivstica, j estava contido o conceito de arquivos ou repositrios digitais confiveis. A confiabilidade vem diretamente do principio arquivstico de custdia responsvel.
179 Como observa Thomaz (2007), a confiana nos repositrios digitais se desenvolve em no mnimo trs nveis: 1. a confiana de que os produtores esto enviando as informaes corretas; 2. a confiana de que os consumidores esto recebendo as informaes corretas; e 3. a confiana de que os fornecedores esto prestando servios adequados. A primeira lista de atributos e responsabilidades de repositrios digitais confiveis foi estabelecida pela Research Libraries Group (RLG) e o Online Computer Library Center (OCLC) no seu relatrio publicado em 2002. Esse conjunto de atributos est influenciado pelo modelo OAIS/SAAI e estabelece que essa obedincia ao modelo deva ser considerada o primeiro critrio a ser observado por um repositrio confivel. Para esse grupo, os repositrios confiveis devem incluir tambm, atributos que possam dar suporte a sistemas de segurana e aos procedimentos adequados e significativos. Eles apontam que todo repositrio confivel deve incluir atributos que sustentem os seguintes aspectos: a) responsabilidade administrativa; b) viabilidade organizacional; c) sustentabilidade financeira; d) adequabilidade tecnolgica e procedimental; e) sistema de segurana; f) responsabilidade de procedimentos (certificao). O relatrio da RLG e da OCLC codifica esses atributos no conjunto de responsabilidades baseado no modelo OAIS/SAAI, manifestado suas responsabilidades de custdia e definindo, assim, o que pode ser considerado como uma lista de requisitos funcionais (Figura 18).
180
Figura 18 - Modelo de Trusted Digital Repository (TDR) da RLG e OCLC
O modelo Trusted Digital Repository representa a primeira forma de expressar a infra-estrutura organizacional da preservao digital. Os atributos do TDR converteram-se em padres para a comunidade da preservao digital, pois antes deles no existia uma expresso formal do contexto organizacional da preservao digital. Uma nova verso do modelo TDR surgiu do projeto de preservao digital da Cornell University, sugerindo que o modelo a ser seguido deve sair do entendimento de dois documentos-chave: o que prope os atributos de um repositrio digital confivel (TDR) da RLG/OCLC na implementao tecnolgica, e da proposta do modelo de referncia OAIS/SAAI para a estrutura do contexto organizacional. A representao dessa integrao de propostas est no diagrama elaborado por Nancy Y. McGovern (2007) como mostra a Figura 19. Usando o diagrama desenvolvido pela University of Cornell, McGovern aborda a questo da fronteira chamada de Digital Archives Border entre os primeiros dois atributos e o restante, para esclarecer sua importncia naqueles casos em que
181 uma instituio mantm mais de um repositrio. Os primeiros dois atributos se aplicariam a todos os repositrios na instituio, j que mais de uma organizao pode chegar a gerenciar apenas um repositrio (como no caso de um consrcio).
Figura 19 - Diagrama da integrao dos dois pilares da preservao digital baseado no modelo TDR da RLG/OCLC Fonte: McGovern (2007)
Desde 2003 a Cornell University vem criando parcerias e repassando para a comunidade sua experincia com a aplicao desses princpios, colocando tutoriais on-line e cursos para gestores de projetos de preservao digital. A Cornell University foi uma das primeiras instituies de ensino que utilizaram as duas grandes propostas para repositrios confiveis; com elas foi estabelecida sua poltica de preservao digital e iniciados alguns dos seus projetos (CORNELL
182 UNIVERSITY LIBRARY, 2004). Tambm nessa universidade o trabalho seguiu alguns princpios norteadores: a) focalizar as aes na reduo de riscos; b) proteger as verses arquivveis; c) entender os componentes dos objetos digitais; d) reconhecer algum tipo de perda como inevitvel; e) estabelecer um ciclo de planejamento e manuteno. Aps a definio desses princpios, foi detectada a necessidade do trabalho colaborativo, ou seja, uma nica instituio no conseguiria atender todas suas necessidade de preservao. Todos os projetos e iniciativas mapeados buscam a realizao da sua inteno original que comum para todos eles: preservar a produo intelectual e cultural das instituies e garantir o acesso permanente informao (Apndice C). A possibilidade de se criar um modelo genrico de servios de preservao digital para repositrios institucionais usando o modelo de referncia OAIS uma das necessidades nas iniciativas pblicas de projetos e programas colaborativos. Alguns dos projetos comeam a elaborar guias e manuais para auxiliar no processo de insero de dados (ingest process), a estimular o depsito de arquivos em formatos-padro para diminuir custos operacionais de longo prazo e a recomendar melhores prticas a serem implementadas. No estgio inicial do projeto Securing a Hybrid Environment for Research Preservation and Access (SHERPA) foi realizada uma reviso crtica do modelo de referncia OAIS. Usando o modelo para identificar os direitos e as responsabilidades executadas pelo repositrio institucional, foram delineados os requisitos mandatrios e as entidades funcionais dentro do projeto de servio de preservao distribuda do SHERPA (Figura 20).
183
Figura 20 Modelo funcional OAIS no projeto SHERPA
Projetando j um possvel processo de auditoria para atribuir/certificar a concordncia com o modelo OAIS, as primeiras aes desenvolvidas pelos responsveis pelo projeto foram: a) mapear as seis entidades de um repositrio que esteja em concordncia com o OAIS (insero, armazenamento arquivstico, administrao, gerenciamento de dados e acesso) dentro de uma estrutura existente; b) garantir que a terminologia de um domnio especfico pode ser mapeada por um equivalente OAIS. O projeto SHERPA mostrou que a auditoria pode comear no processo de insero dos dados, j que os sistemas de repositrios digitais podem ser divididos em dois grupos, aqueles em que o autor ou editor deposita diretamente o contedo (ex.: DSpace), e os que usam algum tipo de coleta desde as pginas a repositrios na web (ex. LOCKSS). Os dois processos no so imunes a algum tipo de ameaa e a auditoria pode confirmar a autenticidade do contedo inserido (ROSENTHAL et al., 2005).
184
2.7.1 Atributos de repositrios digitais
Os atributos e responsabilidade dos repositrios digitais em uso atualmente no exterior esto sendo definidos dentro do contexto dos desafios relacionados com a habilidade das instituies de integrar o gerenciamento de materiais digitais na sua estrutura organizacional. Outra caracterstica desses centros ter entre seus objetivos a pesquisa e o desenvolvimento das melhores prticas para maximizar os benefcios das novas tecnologias. O reconhecimento da importncia dos atributos de preservao digital e as polticas e procedimentos para sua aplicao constituem a primeira linha de ao no estabelecimento de sistemas de gerenciamento de informao digital. Apesar do pouco tempo de implementados, os atributos de preservao digital podem ser acompanhados j no processo de escolha das ferramentas e formao dos repositrios digitais (CatalysIT, 2006; WHEATLEY, 2003) Com base na aplicao dos atributos TDR e do modelo OAIS/SAAI, os gestores desses sistemas de gerenciamento de informao digital podem propor algumas aes tcnicas e organizacionais; 1) avaliar o funcionamento das primeiras migraes para novos formatos; 2) analisar os indicadores de desempenho dos repositrios e ferramentas adotadas; 3) definir polticas de seleo e depsito e reteno de documentos; 4) definir os perfis dos responsveis e tipo de aperfeioamento para cumprir eficientemente as tarefas designadas. Para efetivar as duas primeiras aes, alguns atributos tcnicos de preservao digital tm sido usados, tais como: 1) segurana; 2) interoperabilidade; 3) qualidade e capacidade de configurao das ferramentas no workflow; 4) internacionalizao interfaces multilnges;
185 5) licena para software livre. Para as duas ltimas aes, duas responsabilidades orientadas para os aspectos organizacionais so as mais indicadas: facilitar a configurao segundo o tipo de usurio e ter o suporte da comunidade.
2.7.2 Certificao de repositrios digitais
Em pases como os Estados Unidos, Inglaterra e Alemanha j esto em funcionamento iniciativas de auditoria de arquivos digitais. Instituies nos Estados Unidos como o Research Library Group (RLG) e o National Archives and Records Administration (NARA) que criaram um grupo de trabalho sobre certificao de repositrios digitais e na Inglaterra como o Center for Research Libraries (CRL) com seu projeto de auditoria e certificao de arquivos digitais, esto interessadas em produzir um conjunto de princpios de auditoria em comum. So iniciativas que esto focalizando os benefcios e as ferramentas necessrias para a autovalorizao e auditorias terceirizadas. Sobre a capacidade de auditoria e certificao, existem iniciativas em funcionamento que vm proporcionando ferramentas para auto-avaliao, mas as organizaes precisam de meios para participar de auditorias externas. Processos de certificao podem criar maior padronizao e credibilidade dos arquivos digitais que vo ao encontro das necessidades das bibliotecas e seus usurios. Os exemplos locais e as lies aprendidas esto contribuindo nesse sentido. Com o reconhecimento da importncia das polticas de preservao, ficou implcito o papel que elas tm dentro dos requisitos de evidncia necessrios para criar mecanismos de auditoria e certificao dos documentos e dos repositrios digitais. Em 2006 a RLG/NARA publicou o documento Audit Checklist for Certifying Digital Repositories, e no ano seguinte o Center for Research Libraries CRL lanou o Trustworthy Repositories Audit & Certification: Criteria and Checklist (TRAC), demostrando que as auditorias identificam realmente os pontos fortes e fracos nos programas de preservao digital, e como elas podem ajudar a definir planos de desenvolvimento que gradativamente cumpram com o conjunto de critrios definidos para os repositrios digitais confiveis (McGOVERN, 2007).
186 A checklist da RLG/NARA define o conjunto de polticas gerenciais que so organizadas como critrios de preservao digital pela instituio, as funes do repositrio, os processos e procedimentos, a comunidade alvo a usabilidade da informao e as tecnologias e a infra-estrutura tcnica (RLG/ NARA, 2006). A adoo de ferramentas de preservao digital que podem ser personalizadas, intercambiveis e adaptadas aos workflows nos repositrios digitais est levando as instituies a abrir espaos para integrar requisitos de auditoria e de medio, dos pontos fracos e fortes dos programas de preservao digital. Entre as concluses a que chegaram os pesquisadores do RLG-NARA, no seu documento Criteria for Measuring Audit Checklist for Certifying Digital Repositories, est a de que as ferramentas usadas para fazer auditoria dos repositrios precisam ser desenvolvidas pelos prprios executores dos projetos de preservao digital. O estabelecimento de programas de certificao e de critrios para serem usados em auditorias uma necessidade identificada na comunidade da cincia da informao que lida com repositrios institucionais e que precisa de modelos de certificao dessas ferramentas (LYNCH 2003). Algumas iniciativas que usam ferramentas como JHOVE, DROID e XENA esto apresentando, alm da funcionalidade de preservar os objetos digitais na sua integrao dessas ferramentas aos softwares de repositrios digitais, elementos que propiciam a comparao dos limites e capacidades das organizaes no cumprimento dos requisitos de preservao apontados pelos modelos TDR e OAIS. Projetos como o Network of Expertise in Long-Term Storage of Digital Resources (Nestor) da University Library of Humboldt-University Berlin, que desenvolveu seu Catlogo de Critrios para Repositrios Digitais so exemplos do crescente movimento para o desenvolvimento de parmetros para medir a qualidade o confiabilidade de um repositrio. O grupo de trabalho do Nestor tem entre seus objetivos [...] formular critrios para repositrios digitais confiveis e recomendaes para procedimentos de certificao de repositrios digitais [...] (DOBRATZ; SCHOGER; STRATHMANN, 2007 s/p.). A complexidade dos sistemas de preservao digital em repositrios confiveis foi apontada pelo grupo de trabalho do projeto Nestor em 2004; ele destacou a importncia de abordar todo o processo gerencial de informao digital das organizaes onde se deseja que a confiabilidade seja confirmada (NESTOR,
187 2006). A partir da, todo o ambiente da preservao digital comeou a ser tomado em considerao, assim como a recomendao de que os resultados da auditoria fossem comunicados de forma transparente ao pblico para gerar mais confiana. Propostas como a do catlogo do projeto Nestor esto sendo usadas como instrumentos para auto-avaliao das etapas de desenvolvimento de projetos de repositrios digitais confiveis. Sua aplicabilidade internacional tem suas limitaes por razes geopolticas, mas levada em considerao internacionalmente para o estabelecimento de um processo formal de certificao ISO. Em 2007 com o lanamento do checklist da CRL Criteria for Measuring Trustworthiness of Digital Repositories and Archives: an Audit & Certification Checklist, representantes de projetos de vrios pases esto construindo uma colaborao formal para auditoria e certificao de repositrios de preservao digital (CRL, 2007). Tanto o Grupo de Trabalho do projeto NESTOR na Alemanha, quanto o DCC na Inglaterra e o CRL nos Estados Unidos coincidem nos princpios bsicos para a aplicao de critrios institucionais de preservao digital, como segue: 1) Documentao (evidncia): as metas, os conceitos, especificaes e implementaes de preservao digital de um repositrio devero ser documentadas adequadamente. A avaliao inicial do repositrio como um todo baseada na documentao pode prevenir erros e implementaes inapropriadas. 2) Transparncia: a publicao da documentao leva transparncia. Segundo a CRL, [...] apenas o repositrio que expe seu design, especificaes, prticas, polticas e procedimentos para anlise de riscos pode ser considerado confivel [...] (CENTER OF RESEARCH LIBRARY, 2007, s/p). 3) Proporcionalidade: nenhum padro ou norma deve ser tomado como nico e absoluto para avaliao de todos os aspectos de um repositrio digital, mas ela deve ser realizada baseada nos objetivos e tarefas aplicadas preservao digital. 4) Mensurabilidade: apenas para alguns casos, devido aos aspectos de temporalidade dos processos de preservao, algumas formas de controle no so viveis, mas a instituio dever informar os
188 indicadores para medir o grau de confiabilidade, segundo seu nvel de transparncia. As concluses a que esses projetos chegaram so de que a certificao dos repositrios envolve mais do que a aplicao de critrios resultantes desses princpios bsicos. Ela deve prover ferramentas para o planejamento da auto- avaliao e formas de auditorias internas e externas. O contexto de ambas geopoltico, mas o processo no varia significativamente. A comunidade de desenvolvedores desses repositrios vem confirmando a importncia do processo de auditoria com mais freqncia do que o de certificao, pois a auditoria permite que os desenvolvedores dos repositrios analisem e respondam de forma sistemtica s carncias e acertos na criao dos sistemas. No final de 2008, discute-se a aplicao de procedimentos de auditoria automatizados de contextos especficos da preservao digital, validando polticas locais definidas na aplicao de softwares para repositrios (MOORE; SMITH, 2007). Assim, espera-se tambm, a participao mais efetiva dos repositrios com informaes oficiais dos governos, a partir do momento em que o processo de padronizao da auditoria e certificao dos repositrios digitais fique formalizado numa norma ISO. Para os especialistas em preservao digital, um apoio veio ao serem formalizados os primeiros centros de curadoria digital em 2005. Duas instituies que trabalham nesse sentido so a Digital Curation Centre (DCC) na Inglaterra e a UNC Chapel Hill nos Estados Unidos. O DCC um centro que oferece servios e produtos para a comunidade que trabalha com a curadoria de materiais digitais, oferecendo apoio comunidade para trabalhar em rede e facilitar formas de acrescentar valor aos contedos digitais. Outras instituies esto discutindo a criao de programas de ps-graduao dentro das comunidades de cincia da informao, biblioteconomia, arquivologia e museologia, para capacitar seus estudantes nos trabalhos na rea da curadoria da informao digital.
189 2.8 CONCLUSES DA REVISO DE LITERATURA
A metodologia de organizao e descrio dos objetos digitais deve observar a natureza da informao a ser preservada. Isso premissa bsica para que os critrios de preservao digital sejam propostos. Porm, o conceito geral e a urgncia esto presentes na cincia da informao, em suas disciplinas, demandando a criao de sistemas nos quais os recursos humanos, tecnolgicos e procedimentais estejam em alinhamento com o estado-da-arte acerca das polticas, atributos e critrios de preservao digital. Foi apresentado o estado atual das atividades de preservao digital da informao cientfica em pases como os Estados Unidos, Austrlia, Nova Zelndia, Holanda, Inglaterra, Alemanha e Canad. Trata-se de estratgias que pretendem garantir a inalterabilidade dos registros digitais. Todos os mtodos mencionados procuram evitar o risco de criar barreiras para um uso pleno dos recursos no futuro. Para resolver esse problema, foram elaborados e testados nos ltimos anos esquemas conceituais que permitem identificar as partes integrantes do processo de preservao digital, assim como a sua padronizao em modelos de referncia para iniciativas de repositrios digitais (CCSDS, 2002). Uma percepo duradoura da preservao digital precisa abarcar vrias geraes de sistemas e tecnologias e unir as mudanas organizacionais com as necessidades de atualizao dos responsveis pelas colees digitais. As perspectivas aqui citadas tm como respaldo especialistas e organizaes, alm de tecnologias assimiladas por comunidades de usurios. No exterior, os gerentes dos sistemas de preservao digital esto se adequando aos delineamentos dados pelos modelos de repositrios confiveis e de referncia existentes. A questo da preservao digital possui vrias frentes de desenvolvimento. Das polticas s tcnicas, um grande conjunto de pontos crticos encontrado e, por isso, os profissionais interessados na manuteno das informaes sobre sua responsabilidade devem entender e se envolver com a elaborao das respostas. O interesse comum dos gestores dos mais diversos tipos de acervos em conhecer a preservao digital o motivo que leva pesquisa e o conseqente desenvolvimento de solues de aplicao na realidade.
190 Algumas leis e padres relacionados com o ciclo de vida da informao em formato digital comeam a surgir, permitindo a formulao de polticas de preservao digital estruturadas a partir da natureza da informao a ser guardada de longo prazo. Modelos conceituais esto sendo utilizados de forma a servir de base para polticas adaptadas a diferentes acervos por profissionais de formao e atividades diversificadas (arquivistas, bibliotecrios, editores, muselogos e curadores). Os estudos sobre a preservao digital tm estabelecido que a imediata implementao de polticas de preservao digital a forma mais efetiva de garantir o armazenamento e uso de recursos de informao por longos perodos de tempo. A proposta de criao de sistemas de preservao digital distribudos, que sigam modelos econmicos sustentveis est partindo de projetos de preservao de publicaes eletrnicas, que esto extraindo informaes para bibliotecrios e editores sobre a necessidade de confiar nos parceiros no campo digital, aspecto j mencionado, desde 1996, pelos primeiros especialistas a tratar do tema. No caso especfico da informao cientfica e tecnolgica, os repositrios digitais so semelhantes em algumas caractersticas bsicas no que se relaciona preservao digital. Um exemplo o DSpace Institutional Digital Repository System (projeto colaborativo da MIT Libraries e a Hewlett-Packard) orientado preservao digital (JAMES et al., 2003). O DSpace como programa livre, ao ser adotado pelas organizaes, transfere a estas a responsabilidade e os custos com as atividades de preservao (NIXON, 2002). Isto promove uma nova postura na comunidade, que garantir efetivamente o acesso permanente informao. Vrias pesquisas vm centrando-se no modelo de preservao digital dos repositrios digitais, enfocando a necessidade de atuais e futuros usurios de contar com materiais autnticos e certificados por instituies reconhecidas. A descrio em metadados, de todos os detalhes que expressem a histria de criao de um objeto digital est sendo considerada, tanto na rea da arquivologia como na de cincia da informao, uma metodologia que pode garantir a originalidade de um registro eletrnico. Os repositrios digitais esto comeando a definir os nveis de servios de preservao que podem oferecer, dependendo do contedo e do tipo de objeto. Para alguns contedos o repositrio pode comprometer-se a chegar no nvel da preservao dos bits, garantindo retornar ao autor do depsito a seqncia de bits sob demanda. Para outros registros, alguns sistemas de repositrios podem aplicar
191 estratgias de preservao como a migrao ou at trabalhar em parceria com outros repositrios usurios das mesmas ferramentas. Mas a falta de polticas de preservao na maioria dos projetos de repositrios digitais sugere a carncia de conhecimentos tcnicos sobre a importncia das estratgias de preservao de materiais digitais existentes. A literatura da rea mostra que a maioria dos projetos est nos seus primeiros estgios e apenas metade deles relata seguir alguma forma de modelo de negcios e processos de auditoria planejados (SMITH, 2008). Essa lacuna informacional por parte dos responsveis pelas polticas de implementao de informao digital precisa ser destacada. A segunda lacuna que deve ser mencionada diz respeito importncia da existncia de bibliotecas digitais e de centros especializados no estabelecimento e monitorao de estratgias de preservao digital bem-sucedidas. A amplitude do problema tratado conduziu a pesquisa bibliogrfica ao momento do questionamento sobre a transformao de atributos e responsabilidade de preservao digital para critrios bsicos formulados nas maiores iniciativas de pesquisa da rea. Embora o contexto atual dos trabalhos sobre auditoria e certificao de repositrios de preservao no proporcionem ainda elementos suficientes para perceber os benefcios obtidos na aplicao dos critrios de preservao digital adotados, espera-se que a definio de normas de auditoria e certificao seja reconhecida internacionalmente e que sua assimilao geopoltica mantenha as caractersticas interoperveis dos sistemas. As propostas de critrios de gesto de preservao digital da informao tcnico-cientfica partiram de um entendimento sobre a realidade, gerado nas observaes e anlises dos aspectos fundamentais das prticas realizadas com esse objetivo. Espera-se que a ampla gama de condies sob as quais esses critrios sejam apropriados possua alta probabilidade de aplicao. Com base na literatura analisada, pode-se afirmar que os critrios a serem propostos neste trabalho expressaro e justificaro um mtodo de abordagem para uma realidade concreta, neste caso, aquela das instituies de pesquisa no Brasil. Padres, normas e prticas de preservao so adotados, quando existe conscincia e interesse por parte dos responsveis pelos acervos em desenvolver recursos que sejam permanentemente acessados. Em nvel nacional, a definio
192 das polticas, obrigaes e metodologias mais apropriadas para a preservao dos documentos eletrnicos deve levar em considerao a implementao de pacotes de software livres a fim de verificar se atendem s necessidades das instituies de ensino e pesquisa e se esto em concordncia com os j testados padres internacionais, que promovem o arquivamento digital da produo cientfica de longo prazo (UNESCO, 2007). O trabalho exposto motivou o estudo bibliomtrico sobre a produo cientfica da rea (ver detalhes no item 3.3.1) e preparou a indagao sobre as expectativas e necessidade dos responsveis pelos acervos de informao cientfica no Brasil. A realidade a ser detectada levou a uma proposta dos critrios que devem conduzir as implementaes de sistemas de preservao digital no pas.
193 3 METODOLOGIA
O mtodo cientfico pode ser definido como o estudo de um fenmeno observvel para fins de conhecimento ou de predio, descrevendo sua estrutura e funcionamento. As pesquisas que enfatizam os processos e os significados no medidos rigorosamente so denominadas qualitativas; elas abordam a relao entre o pesquisador e seu objeto de estudo e a natureza do contexto social. A pesquisa qualitativa um processo de investigao que obtm dados do contexto onde os eventos ocorrem, em uma tentativa para descobri-los, como uma forma para determinar os processos nos quais os eventos esto localizados e as perspectivas dos indivduos que deles participam, utilizando a induo para derivar as possveis explicaes baseadas nos fenmenos observados. (GORMAN; CLAYTON, 1997 p. 23).
Para Silverman (2000), as metodologias na pesquisa social precisam de um planejamento cuidadoso e podem ser definidas de forma muito geral (qualitativa ou quantitativa) ou muito particular (por ex. anlise de discurso, grounded theory). Para Carlin (2003), desde seu incio, o campo da biblioteconomia apropriou-se de instrumentos metodolgicos de investigao e tericos de outras reas das cincias sociais, com exceo da bibliometria ou anlise de citaes. Na cincia da informao, as aes relacionadas com a preservao digital esto associadas ao contexto dos problemas de informao que uma sociedade enfrenta no momento em que decide armazenar e dar acesso ao acervo considerado importante para ser preservado. Preservar, no ambiente digital, significa permitir a existncia de longo prazo de objetos que contm informao relevante. Os levantamentos bibliogrficos e buscas em recursos de informao on- line detectaram a ausncia de argumentos tericos ou abordagens metodolgicas no estudo da preservao digital. Podemos afirmar que no existe uma interpretao nica ou teorias que expliquem o tipo de fenmeno que est sendo produzido pelas aes de preservao digital no mundo. Considerando que a temtica da preservao digital encontra-se na fase da construo de hipteses mais precisas e que os estudos atuais comeam a elucidar questes complexas sobre sua natureza, esta pesquisa pretendeu prover subsdios e elucidar conceitos associados preservao digital.
194 Na literatura da rea, os critrios de preservao digital esto sendo apontados como elementos integrantes dos sistemas de gesto de preservao digital, divididos em trs aspectos: o organizacional, o tecnolgico e o dos recursos necessrios. O aspecto organizacional est representado pela observncia do modelo de referncia OAIS na construo de sistema de gesto da preservao digital. Para tratar do aspecto tecnolgico, est sendo seguido o modelo dos TDR na estruturao de repositrios de preservao confiveis. E, para o terceiro aspecto, esto os esforos relacionados identificao de alguns critrios que contemplem os custos e a formao de recursos humanos (GRANGER, 2002; LAVOIE; DEMPSEY, 2004; LYNCH, 2003; RLG, 2002). A principal preocupao mencionada nesses estudos que os profissionais da informao responsveis pelos documentos digitais estabeleam seus prprios critrios na criao de sistemas de gesto de preservao digital em suas instituies. Esta necessidade pode ser detectada nas pesquisas que tm sido realizadas em instituies internacionais (FRIEDLANDER, 2002; HODGE; FRANGAKIS, 2004; McGOVERN, 2007). Na reviso da literatura foram citados os critrios apresentados nas principais iniciativas de preservao digital na ltima dcada. Ao considerar os tpicos tratados como reveladores dos critrios bsicos de um sistema de gesto de preservao digital da informao tcnico-cientfica e de sua possvel adequao ou no realidade brasileira, nossa pesquisa assumiu os seguintes pressupostos: 1) compreenso da gesto dos documentos digitais como um contnuo integrado de processos que envolvem todo seu ciclo de vida documental; 2) existncia de graus de completeza/completude dos sistemas organizacionais de gesto da preservao digital; 3) possibilidades de adequao dos critrios para a preservao digital; 4) percepo da necessidade de preservao digital como determinante nos critrios que definem o sistema de gesto de preservao digital a ser adotado. No caso especfico dos problemas relacionados com a contextualizao da realidade da preservao digital no Brasil e a formulao de critrios ainda no explorados, a pesquisa aponta para a unificao de abordagens qualitativas e quantitativas. Seguindo a proposta de Silverman (2000) sobre a caracterizao dos
195 mtodos de pesquisa, as tcnicas utilizadas nos projetos com metodologias quantitativas podem ter apoio dos mtodos qualitativos. Neste trabalho foram utilizadas as duas abordagens, na tentativa de explorar dados bibliogrficos e das percepes dos atores envolvidos com a preservao digital de informao cientfica no Brasil. Esta deciso foi adotada por se tratar de uma rea que no tem constitudo objeto de estudo no pas e por no haver sido produzido conhecimento anterior. Como parte de primeiro reconhecimento do objeto de estudo, partimos para o encontro das percepes dos membros da comunidade investigada que detinham algum conhecimento sobre o tema, para desse modo, instrumentalizar uma posterior abordagem alternativa. A pesquisa elaborada adotou como tema norteador a identificao dos critrios categorizados como indicadores de preservao digital da informao cientfica e tecnolgica, representados na literatura cientfica especializada, e como esses critrios so contemplados nas unidades de pesquisa do Ministrio da Cincia e Tecnologia do Brasil. Seguindo a tipologia da pesquisa cientfica de Abramo (1979), este trabalho sustenta-se na caracterizao de uma pesquisa interdisciplinar, porque envolve vrios setores do conhecimento, que usa como tcnicas a entrevista e a observao direta (LAKATOS & MARCONI, 1991) e no nvel da interpretao dos dados, como uma pesquisa exploratria e descritiva. A estratgia metodolgica adotada compreendeu quatro etapas distintas: 1) levantamento e anlise bibliomtrica da produo cientfica sobre preservao digital de informao cientfica e tecnolgica em artigos, teses, dissertaes e livros no perodo de 1996 a 2007; 2) contextualizao da realidade da preservao digital nas unidades de pesquisa do Ministrio da Cincia e Tecnologia, resultado de levantamentos, observao de prticas e anlises de documentos dessas instituies; 3) realizao de uma anlise etnogrfica de contedo publicado sobre a preservao digital no Brasil. Coleta de documentos, palestras, cursos, artigos e publicaes, observando os padres emergentes, os temas, nfases e processos mais freqentemente citados; 4) estruturao de um conjunto de critrios de preservao digital da informao tcnico-cientfica.
196
Foram consideradas como material relevante as informaes sobre padres e prticas de preservao digital de projetos que no estavam relacionados com a preservao de informao cientfica e tecnolgica, no intuito de identificar o estado-da-arte da pesquisa sobre o tema. A investigao pretendeu levantar as questes mais significativas para os envolvidos no processo de preservao digital estudando-as como experincias reais e com significados construdos socialmente. Os documentos tcnicos selecionados nos contextos pesquisados foram entendidos como representaes das percepes sobre a preservao digital dentro do processo analtico de contedo.
3.1 PROBLEMA INVESTIGADO
A pesquisa pretendeu responder seguinte indagao: quais critrios de preservao digital, usados na construo sistemas de gesto da informao cientfica e tecnolgica reconhecidos internacionalmente, podem ser adotados pelas instituies de pesquisa do Ministrio da Cincia e Tecnologia do Brasil? As respostas a essa questo oferecero um conjunto de critrios de preservao digital apropriados para subsidiar futuras iniciativas relacionadas manuteno e controle de acervos digitais relevantes para o desenvolvimento cientfico e tecnolgico do pas, assim como conhecimento sobre a necessidade de critrios de preservao digital no contexto do gerenciamento da informao cientfica e tecnolgica.
3.2 Universo de pesquisa e amostra
No Brasil, a pesquisa cientfica apoiada pelo governo nasceu na dcada de 1930, como produto de uma reforma administrativa realizada durante a ditadura Vargas. J nos anos 1950 foi criado o Conselho Nacional de Pesquisa (CNPq atualmente Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico) como
197 resposta s ameaas do uso da energia nuclear e necessidade da segurana nacional do Estado. As demandas das universidades e centros de pesquisa por mais recursos na dcada de 1960 promoveram a criao de instituies de fomento como a Finep, para diminuir a burocracia no repasse dos recursos pblicos para o desenvolvimento cientfico e tecnolgico (DIAS, 2002). A partir dos anos 1970 se consolida a formao da infra-estrutura governamental de pesquisa, com a criao de diversos centros de excelncia na pesquisa cientfica, a atividade cientfica toma uma posio hegemnica na vida intelectual do pas, e a criao do MCT conferia, sem dvida, um status poltico atividade (BURGOS, 1999). At o ano de 2000, as unidades de pesquisa do MCT encontravam-se distribudas em trs grandes grupos: quatro subordinadas diretamente ao Ministrio; dez, ao CNPq; e cinco Comisso Nacional de Energia Nuclear CNEN, do extinto Ministrio Extraordinrio de Projetos Especiais. Em julho de 2008, a estrutura organizacional do Ministrio da Cincia e Tecnologia estava dividida em quatro categorias de instituies, unidades de pesquisa, organizaes sociais, entidades vinculadas e empresas estatais, cada uma com suas caractersticas organizacionais: a) unidades de pesquisa do MCT: executam programas e projetos visando ao fortalecimento da pesquisa cientfica e tecnolgica brasileira. Essas atividades so acompanhadas pela Subsecretaria de Coordenao das Unidades de Pesquisa; b) organizaes sociais: representam instituies que abrangem laboratrios ou institutos especiais, com os quais o MCT mantm Contratos de Gesto. As atividades das organizaes sociais so promovidas, supervisionadas e avaliadas pela Subsecretaria de Coordenao das Unidades de Pesquisa, para cumprir a lei que outorga essa funo ao MCT (Lei n 9.637 de 15 de maio de 1998); c) entidades vinculadas: esto subdivididas em autarquias, fundaes e empresas pblicas; d) empresas estatais. Cronologicamente, as unidades de pesquisa tm origem variada, mas a integrao da maioria delas ao Ministrio aconteceu na ltima dcada do sculo XX. Essa integrao foi realizada por decreto oficial, algumas como autarquias federais,
198 mas a caracterizao de todas elas dentro do Ministrio mudou em diferentes pocas, at chegar ao estado atual (Quadro 8).
Categoria Instituio Localizao Fundao
UNIDADES DE PESQUISA
Instituto Nacional de Pesquisas Espaciais (Inpe) Laboratrio Nacional de Astrofsica (LNA) Observatrio Nacional (ON) Centro Tecnolgico Mineral (Cetem) Instituto Nacional de Tecnologia (INT) Centro Brasileiro de Pesquisas Fsicas (CBPF) Museu de Astronomia e Cincias Afins (MAST) Laboratrio Nacional de Computao Cientfica (LNCC) Centro de Pesquisas Renato Archer (CenPRA) Instituto Brasileiro de Informao em Cincia e Tecnologia (Ibict) Instituto Nacional do Semi-rido (Insa) Instituto Nacional de Pesquisas da Amaznia (Inpa) Museu Paraense Emlio Goeldi (MPEG) So Jos dos Campos/SP Itajub/MG Rio de Janeiro/RJ Rio de Janeiro/RJ Rio de Janeiro/RJ
Rio de Janeiro/RJ
Rio de Janeiro/RJ
Petrpolis/RJ
Campinas/SP
Braslia/DF Joo Pessoa/PB
Manaus/AM Belm/PA 1962
1985 1827 1978 1921
1949
1985
1980
1982
1954 2004
1954 1866
ORGANIZAES SOCIAIS (Lei n 9.637 de 15 de maio de 1998)
Associao Brasileira de Tecnologia Luz Sncroton (LNLS-ABTuS) Instituto de Desenvolvimento Sustentvel Mamirau (IDSM) Associao Instituto Nacional de Matemtica Pura e Aplicada (Impa) Associao Rede Nacional de Ensino e Pesquisa (RNP) Centro de Gesto e Estudos Estratgicos (Cgee)
Campinas/SP
Tef/AM
Rio de Janeiro/RJ Braslia/DF Rio de Janeiro/RJ
Braslia/DF
1987
1999
1953
1989
2001
ENTIDADES VINCULADAS AUTARQUIAS Agncia Espacial Brasileira (AEB) Comisso Nacional de Energia Nuclear (Cnen) FUNDAO Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico (CNPq) EMPRESA PBLICA Financiadora de Estudos e Projetos (Finep)
Braslia/DF
Rio de Janeiro/RJ
Braslia/DF
Rio de Janeiro/RJ
1994
1957
1951
1967 EMPRESAS ESTATAIS Indstrias Nucleares do Brasil (INB) Nuclebrs Equipamentos Pesados (Nuclep) Rio de Janeiro/RJ Itagua/RJ 1988 1975 Quadro 8 Classificao das unidades de pesquisa do Ministrio da Cincia e Tecnologia
Cada uma das 24 instituies com as suas peculiaridades em relao ao tipo de produo cientfica, caractersticas das comunidades cientficas, contexto histrico e alocao de recursos materiais e humanos apresentada no Apndice E.
199 Para fins desta pesquisa, a populao investigada resumiu-se s unidades de pesquisa do Ministrio da Cincia e Tecnologia. A amostra foi composta pelos centros de informao e bibliotecas existentes nessas organizaes. Os respondentes foram selecionados com base no seu grau de envolvimento com o gerenciamento dos documentos digitais produzidos nessas instituies, e sua seleo no foi determinada pelas suas categorias profissionais. Os setores de informao estudados realizam atividades relacionadas informao cientfica e tecnolgica em suportes digitais, especificamente, com a produo cientfica do ministrio que foi transformada para formato digital e daquela que j nasceu digital. Segundo os dados coletados no primeiro levantamento sobre os centros de informao e bibliotecas do MCT, mais tarde confirmados na pesquisa de campo, h 19 unidades de pesquisa que contam com esse tipo de servio para seus funcionrios e pblico externo. O Quadro 9 mostra a lista de unidades, o setor de informao e o total de responsveis por esses servios.
200 Unidade Setor de Informao Responsvel Total CBPF Biblioteca Bibliotecria 01 CenPRA Biblioteca/DCOG Bibliotecria 01 Cetem Biblioteca Bibliotecria e Cientista da Informao 02 Cgee Ncleo Centro de informaes Cientista da Informao 01 Cnen Centro de Informaes Nucleares Bibliotecria 01 CNPq Biblioteca Lygia Portocarrero Velloso Bibliotecria 01 Finep Servio de Informao Bibliotecrias 02 Ibict Biblioteca Bibliotecria 01 Impa Biblioteca Bibliotecrias 02 Inpa Biblioteca Bibliotecria 01 Inpe Biblioteca Bibliotecrias 02 INT Biblioteca Bibliotecrias 02 LNA Biblioteca Bibliotecria 01 LNCC Biblioteca Bibliotecria 01 LNLS- ABTLuS Biblioteca Departamento Cientfico Bibliotecria 01 Mast Biblioteca Bibliotecrias 02 MPEG Biblioteca Domingos Soares Ferreira Penna Bibliotecria 01 ON Biblioteca/DID Bibliotecria 01 RNP Biblioteca/DGI Cientista da Informao 01 Quadro 9 Local de preservao e acesso da informao cientfica em formato digital produzida nas unidades de pesquisa do MCT
Entre 2004 e 2007, a pesquisa identificou 25 responsveis por acervos digitais lotados nos centros de informao e bibliotecas. A localizao foi possvel por intermdio de consultas, realizadas via internet, incluindo-se as pessoas que tinham endereos eletrnicos disponibilizados nas pginas do MCT (amostragem no probabilstica). Tambm a indicao das pessoas que teriam algum grau de comprometimento com a preservao dos acervos em formato digital foi feita pelos funcionrios, pesquisadores, bibliotecrios, arquivistas e profissionais de informtica entrevistados durante a visita a esses centros.
201 3.3 INSTRUMENTOS DE COLETA DE DADOS
Vrios autores mencionam que a experincia e comportamentos humanos no so explicveis por fatores externos, mas podem ser compreendidos por meio da empatia comunicativa com a viso subjetiva e as razes internas do outro (MAYRING, 2002). Esse entendimento precisa do emprego de um conjunto de instrumentos que determinam a forma de abordar os fatos ao longo de um percurso para alcanar um objetivo preestabelecido. Para compreender qualitativamente as prticas reais e os mtodos mais utilizados para preservar a informao tcnico-cientfica em documentos digitais, aplicaram-se as seguintes tcnicas de pesquisa: estudo bibliomtrico, questionrio, entrevista, observao de curta durao e anlise etnogrfica de contedo. O esquema da pesquisa incluiu no primeiro estgio um levantamento bibliogrfico que se prolongou durante todo o perodo da investigao. Em seguida, utilozou-se um questionrio para mapeamento da realidade das unidades de pesquisa do MCT. Determinada qual seria a amostra do estudo e o local das visitas, partiu-se para o levantamento de dados coletados diretamente com os responsveis pelos acervos digitais dessas unidades. Na pesquisa de campo, alm da realizao de entrevistas e da observao de curta durao, reuniram-se dados documentais encontrados em arquivos, bancos de dados, relatrios e publicaes oferecidas pelos prprios entrevistados. As experincias relatadas durante as entrevistas funcionaram como parmetro para a informao, obtida pelo mtodo da observao. As informaes foram organizadas cronologicamente e includas na anlise etnogrfica de contedo.
3.3.1 Estudo bibliomtrico
Aps tratamento bibliomtrico realizado na bibliografia consultada, identificaram-se os autores e os ttulos de peridicos mais citados, os temas e as datas de publicao. Esse levantamento incluiu a organizao dos dados em dez variveis, a saber:
202 - ano; - rea; - aspecto discutido; - autor; - pas. - peridico; - proposta; - sub-tema; - tipo de autoria; - tipo de publicao; Essas variveis foram submetidas a um tratamento estatstico descritivo (anlise de freqncia). Pretendeu-se quantificar a produo individual dos principais autores em diferentes perodos e seu impacto no desenvolvimento da rea. A continuidade desse estudo fundamentalmente bibliomtrico tornou-se possvel avaliando a produo cientfica sobre o tema da preservao digital no Brasil e no exterior, considerando apenas os trabalhos citados reviso da literatura e nas listas de documentos de projetos e iniciativas da rea publicadas at 2007 (ver Apndice C)
3.3.2 Questionrios
A tcnica de coleta de dados por meio de questionrio utilizada quando se pretende atingir um nmero considervel de pessoas. O conjunto de questes formuladas deve refletir os objetivos do estudo. Para caracterizar as atividades de preservao digital identificadas nas Unidades de Pesquisa do MCT, durante o perodo de 2004 a 2007, tornou-se necessrio localizar as informaes oficiais sobre os acervos digitais nessas instituies. O levantamento incluiu as informaes oficiais nos sites do Ministrio e o envio por e-mail de um questionrio para os responsveis pelas informaes disponibilizadas na internet. Na primeira aproximao, remeteu-se via correio eletrnico, a todos os responsveis pelas bibliotecas e centros de informao do Ministrio de Cincia e Tecnologia, questionrio elaborado em colaborao com a Biblioteca de Poltica em
203 Cincia e Tecnologia (BPCT) da Coordenao-Geral de Gesto e Inovao (CGGI) do prprio Ministrio. O propsito foi conseguir levantar, com questes abertas sobre fatos (aes) e de opinio (atitudes), dados sobre as atividades relacionadas com a preservao dos seus acervos em formato eletrnico bem como identificar os responsveis e as principais atividades relacionadas com acervos digitais. (ver Apndice A).
3.3.3 Pesquisa de campo
O estabelecimento de relaes constantes entre determinadas condies pode ser obtido com a pesquisa de campo (RUIZ, 1979). Para Minayo (1992), o trabalho de campo nas abordagens qualitativas compreende duas tcnicas fundamentais: a entrevista e a observao. Elas se complementam, aumentando o controle dos dados nos estudos exploratrios (SELLTIZ et al., 1975). Na pesquisa de campo foram analisadas as aes do Ministrio da Cincia e Tecnologia para implementar (desenvolver, efetivar, planejar e utilizar) sistemas de preservao digital. Com isso, a investigao esteve centrada em descobrir: a) os objetivos e caractersticas das aes propostas no contexto do MCT com fins de preservao digital; b) as infra-estruturas e recursos adotados no MCT para a construo de sistemas de preservao digital; c) como essas infra-estruturas padronizam, armazenam e ajudam a gerenciar a informao cientfica e tecnolgica a ser preservada digitalmente. Na fase aps o primeiro levantamento, procedeu-se a visitar as unidades de pesquisa e a entrevistar os responsveis previamente identificados. Os registros obtidos ajudaram a formar o conjunto de dados oficiais sobre as colees eletrnicas institucionais. Conforme a viabilidade de deslocamento do pesquisador para algumas localidades (Belm, Petrpolis, Rio de Janeiro, Campinas, So Jos dos Campos e Itajub), observaram-se as experincias de preservao digital em andamento,
204 registrando a natureza das necessidades de preservao digital expressas nas restries situacionais de cada uma das unidades examinadas. A realizao da pesquisa de campo compreendeu a observao direta de curta durao (um a trs dias) para coleta de dados complementares acerca da realidade das prticas e necessidades de preservao digital nas unidades de pesquisa. Foram coletados dados das opinies dos atores identificados, examinando-se as percepes dos envolvidos sobre as necessidades e as prticas de preservao digital, descobrindo-se temas decorrentes, padres emergentes e processos enfatizados e adotados.
3.3.4 Entrevistas
A apropriao de um mtodo qualitativo para a compreenso das percepes dos envolvidos nas atividades de preservao digital contemplou a necessidade de entrevistas, como verificao e registro das narrativas histricas das memrias das fontes interessadas. Descombe observa que a entrevista representa uma espcie de conversao elaborada de maneira sistmica: As entrevistas so uma proposta atrativa para os pesquisadores que realizam algum projeto. Aparentemente, no envolvem muita parafernlia tcnica na coleta da informao talvez um caderno e um gravador porttil e a tcnica bsica depende da habilidade que os pesquisadores j tm para conduzir uma conversa. No necessrio contar com ferramentas complexas ou passar tempo aprendendo novas habilidades: esta uma receita particularmente tentadora. (DESCOMBE, 2003, p. 163).
Na fase exploratria, estabeleceram-se conversas orientadas com alguns dos responsveis identificados pelas pessoas que responderam aos questionrios enviados. O propsito era recolher informaes mais precisas sobre as pessoas que realmente tinham algum grau de comprometimento com a preservao dos acervos em formato digital dessas instituies. Durante a 56. Reunio Anual da SBPC, celebrada na cidade de Cuiab, Mato Grosso, em julho de 2004, realizaram-se as primeiras entrevistas semi- estruturadas (Apndice B) com alguns dos responsveis pelos centros de informao, bibliotecas e arquivos das unidades de pesquisa do MCT. Tal atividade
205 dependeu da disponibilidade dos respondentes durante o evento. Os dados obtidos permitiram identificar os responsveis pelas prticas de preservao digital existentes, os materiais e formatos mais freqentemente usados, alm de captar opinies sobre as necessidades de preservao digital nas unidades de pesquisa. Em seguida ao primeiro contato, fizeram-se visitas s unidades de pesquisa, aplicando-se entrevistas presenciais semi-estruturadas, registradas em fita magntica como recurso especial para coleta de dados, posteriormente transcritas de forma precisa para entender como a interao foi estabelecida (SILVERMAN, 2000). Durante a fase de pesquisa de campo, utilizou-se o mesmo roteiro de entrevista em profundidade (FINK; KOSECOFF, 1985) usado com o primeiro grupo de respondentes, orientado para obter informaes relacionadas com as atividades de preservao dos acervos digitais. As perguntas foram divididas em trs grupos. O primeiro relacionava a formao profissional e as caractersticas das tarefas realizadas pelos entrevistados, a saber: a) profisso; b) titulao mxima; c) tempo de servio; d) cargo ocupado atualmente; e) tempo no cargo atual. No segundo grupo, as questes dirigiam-se para a descrio das atividades desenvolvidas pelos respondentes que envolvem algum tipo de tratamento tcnico nos arquivos digitais da instituio: a) Quais atividades cientficas so realizadas pela sua instituio? b) Que tipo de produo cientfica j est em formato digital? c) Quem so os usurios dessa produo cientfica? d) Quais atividades de preservao de documentos digitais esto sendo realizadas pela sua instituio? O terceiro grupo de perguntas permitiu a coleta de opinies sobre o material a ser preservado e seus responsveis: e) Qual produo cientfica deve ser preservada pela sua instituio? f) Quem so os responsveis por essas atividades de preservao?
206 Com elas, pretendeu-se detectar variveis que no haviam sido contempladas no quadro conceitual preestabelecido pelo pesquisador, relacionadas s expectativas dos responsveis pelas colees no que se refere ao que deve ser feito para preservar seus documentos digitais. Foram entrevistadas 86 pessoas entre aquelas identificadas no primeiro levantamento para o envio do questionrio e as detectadas nas falas dos prprios respondentes durante a aplicao do primeiro grupo de entrevistas. No Quadro 10 visualiza-se a listagem completa de profissionais e pesquisadores contatados durante a pesquisa de campo.
RNP Biblioteca/DGI Informtica Comunicao Cientista da Informao Tcnico Tcnico 1 2 1 Quadro 10 Listagem de respondentes das unidades de pesquisa do MCT entrevistados na fase exploratria e de pesquisa de campo
Os respondentes foram caracterizados como representantes de setores- chave das instituies procuradas, a saber: centro de informao, biblioteca, arquivo, informtica, direo e departamentos de pesquisa. O critrio de seleo desses respondentes decorreu de serem atores com algum grau de envolvimento formal na manuteno dos acervos digitais da instituio e cujas opinies servissem para examinar as percepes sobre o tema e processos adotados. Os dados obtidos com os entrevistados permitiram estabelecer um tipo de padro no quesito necessidade de prticas de preservao digital no detectado nos questionrios, e a definio de novos nveis de aprofundamento a serem alcanados por meio da observao e a anlise etnogrfica de contedo. O instrumento de coleta utilizado nas entrevistas est no Apndice B.
208 3.3.5 Observao de curta durao
A coleta de dados por meio da observao oferece ao pesquisador a oportunidade de obter informao no apenas sobre o que os entrevistados asseguram que fazem ou pensam, mas de uma forma direta diante da realidade dos eventos descritos (DESCOMBE, 2003). Para Mayring (2002), as dimenses da observao devem ser determinadas e concretizadas na construo de um guia de observao, estruturado segundo a formalizao do contato estabelecido com os representantes do campo observado. Este plano de procedimento formulado por Mayring constante e formalizado no que ele chama de protocolos de observao, que registram as aes empreendidas pelo pesquisador, at o momento da avaliao final dos dados coletados (Quadro 11).
Determinao das dimenses de observao Construo do guia de observao
Estabelecimento do contato com o campo de observao
Ao no campo Observao participante
Anotaes no campo Protocolos de observao
Avaliao final
Quadro 11 - Plano de procedimento de observao Fonte: Mayring (2002, p. 132)
Para obter-se um diagnstico sobre a situao da preservao digital no MCT, como complemento tcnica de entrevista, empregou-se o registro dos padres de comportamento das pessoas por meio da observao direta de curta durao no participante (AAKER; KUMAR; DAY, 2004; GWATNEY, 2001). O objetivo foi levantar indcios relevantes sobre as prticas reais de preservao
209 digital, a fim de controlar o registro sistemtico das aes executadas no tratamento dos documentos digitais e a caracterizao das estratgias adotadas. O critrio considerado para a utilizao desta tcnica de observao foi o fato de ela no ser disruptiva e permitir a obteno dos dados de forma semi-direta, segundo o comportamento dos sujeitos. Dessa forma, conseguiu-se obter uma imagem das prticas dos responsveis pelos acervos digitais em determinado lugar, contexto e tempo, dependendo de uma sucesso de eventos.
210 4 ANLISE DOS DADOS
A organizao dos dados foi resultado de um ciclo repetido de interaes com as fontes bibliogrficas e com os respondentes. A primeira foi determinada por dois objetivos especficos da pesquisa, que visavam caracterizar as prticas de preservao digital e resgatar os conceitos e aplicaes usadas nas experincias nacionais e estrangeiras. As interaes com os respondentes por meio das entrevistas, a observao de curta durao buscaram identificar as necessidades de preservao digital da informao tcnico-cientfica das unidades de pesquisa do MCT, assim como conduzir o estudo para uma abordagem mais qualitativa do tema, a aplicao da tcnica de anlise etnogrfica de contedo. Dessa forma, foi possvel desenvolver os critrios de preservao digital, propostos a partir de padres encontrados nos dados coletados. Segundo Pereira (2001, p. 67) [...] a mensurao qualitativa uma medida derivada, que no se realiza diretamente sobre o fenmeno de interesse, mas sobre as manifestaes desse fenmeno [...]. Com as trs tcnicas usadas procurou-se classificar individualmente os respondentes pelas suas funes e grupos de profissionais e descrever o conjunto de observaes realizadas nos locais visitados. As estratgias de anlise mostraram como o esforo para sintetizar as informaes coletadas precisou reduzir a dimensionalidade do fenmeno com fins de produzir conhecimento sobre o tema.
4.1. ANLISE BIBLIOMTRICA
O interesse na criao de indicadores bibliomtricos sobre a produo cientfica vem acompanhando o crescimento da literatura publicada. No incio do sculo XX apareceram as primeiras aplicaes de mtodos estatsticos anlise da literatura de reas do conhecimento cientfico. Como uma nova prtica estatstica, e sem ser denominada ainda bibliometria, os resultados obtidos nos primeiros estudos proporcionaram um mtodo de anlise da prtica cientfica (ALVARADO, 2007).
211 Um dos primeiros tericos a definir o termo bibliometria, foi Pritchard como a [...] aplicao de modelos matemticos e estatsticos aos livros e a outros meios de comunicao escrita [...] (PRITCHARD, 1969, p. 25). A tcnica tem sido utilizada para identificar algumas caractersticas das publicaes cientficas, a produtividade, os paradigmas e as relaes entre disciplinas cientficas (BROOKES, 1973; IKPAAHINDI, 1985; POTTER, 2002). Para Narin (1976), a bibliometria pode ser dividida em descritiva e avaliativa. A bibliometria avaliativa estaria dedicada a analisar os aspectos qualitativos da produo cientfica atravs da anlise de citaes e publicaes. J a bibliometria descritiva estuda as caractersticas especficas de distribuio geogrfica, evoluo temporal, entre outras. Narin tambm afirma que a contagem de artigos proporciona indicadores vlidos da produo cientfica e o do desenvolvimento de temas relacionados e das instituies de origem. Para fins desta pesquisa, a necessidade de entrevistas, narrativas histricas e memrias de fontes interessadas contemplou tambm, a apropriao de um mtodo quantitativo para a compreenso das percepes dos envolvidos nas atividades de preservao digital. Os ndices estatsticos utilizados serviram para observar o fenmeno da produo cientfica sobre preservao digital na variedade dos assuntos e na regularidade dos temas mais freqentemente abordados. A anlise bibliomtrica foi usada na identificao de ligaes entre documentos e no mapeamento da literatura da rea, fornecendo informaes sobre o desenvolvimento de campos especficos e subsdios para formas de interpretao no contexto da realidade de instituies de pesquisa no Brasil.
4.1.1 Bibliometria descritiva da preservao digital
Para poder conhecer as abordagens tericas e prticas que tm sido publicadas na ltima dcada, foi realizado um estudo bibliomtrico descritivo, coletando dados de referncias bibliogrficas sobre o tema da preservao digital do perodo de 1996 at 2007. Na reviso da literatura foi constatada a ausncia de um controle da produo bibliogrfica sobre o tema na forma de bases de dados ou da
212 publicao de bibliografias da rea. Existe apenas listagem de textos relevantes em sites de iniciativas e projetos de instituies nacionais e estrangeiras. No perodo que compreendeu a elaborao desta pesquisa, a tcnica de coleta adotada foi o acompanhamento nos ltimos cinco anos das pginas de iniciativas e projetos de preservao digital onde so publicadas listagens e documentao relacionada ao assunto (ver Apndice C). Cronologicamente, as referncias foram selecionadas por serem bastante ilustrativas em relao ao desenvolvimento de alguns temas de interesse da rea. Tendo como foco a evoluo temtica da preservao digital como assunto de documentos publicados de 1996 a 2007, foram analisados 319 trabalhos apresentando os aspectos mais relevantes citados nessa produo, seus autores, tipo de autoria, tipo de documentos, origens e propostas. Tambm foi includa a produo nacional nesse perodo registrada em artigos de peridicos, captulos de livros, teses e dissertaes. Os trabalhos apresentados nos eventos da rea no foram includos nesta anlise devido a que muitos desses sites no permitiam o acesso aos documentos ou o texto integral no constava na relao de trabalhos apresentados nas pginas oficiais. Pretendeu-se, com esta anlise, responder s seguintes questes que envolvem o problema desta pesquisa: 1. Quais so os interesses dos autores em relao aos subtemas relacionados com a preservao digital? 2. Como se desenvolveram os principais subtemas relacionados com a preservao digital? 3. Quais foram as principais propostas e aspectos da preservao digital debatidos? 4. Qual o tipo de documento que est sendo publicado? 5. De qual rea do conhecimento eram as publicaes que abordaram o tema da preservao digital? 6. Que peridicos cientficos veicularam artigos sobre preservao digital? As respostas a estas questes proporcionaram uma viso do assunto no contexto internacional e nacional. O tratamento bibliomtrico realizado na bibliografia reunida tinha como objetivos:
213 a) identificar os autores e os tipos de documentos mais usados, os sub- temas, propostas, aspectos discutidos no perodo de 1996-2007; b) conhecer a produtividade dos autores e o tipo de autoria; c) identificar as reas do conhecimento que mais publicaram sobre o tema. A compilao das referncias bibliogrficas sobre o tema preservao digital permitiu insero de dados dessas variveis no programa estatstico SPSS. Com a aplicao da ferramenta SPSS Statistical Package for the Social Sciences foi possvel obter dados bibliomtricos que permitiram a contextualizao da produo cientfica da rea nos anos 1996-2007. O levantamento incluiu a organizao dos dados em dez variveis, a saber: 1. autores: foram includos os nomes de autores e co-autores da bibliografia consultada; 2. autoria: os documentos foram registrados segundo o tipo (nica e mltipla) e a ordem de autoria dos trabalhos; 3. rea: no levantamento bibliogrfico foram identificadas cinco reas do conhecimento de onde partiram as publicaes de trabalhos sobre o assunto (cincia da informao, arquivologia, biblioteconomia, cincia da computao e histria); 4. subtema: foram definidos quatro subtemas segundo a abordagem geral dos trabalhos em relao ao tema principal e o enfoque que os autores destacaram (percepes, gerenciamento, estratgias e certificao); 5. proposta: esta varivel se referiu ao assunto especfico exposto e descrito de forma mais aprofundada pelos autores nos seus textos, sendo identificados 12 tipos de propostas; 6. aspecto: esta varivel foi criada para identificar dentro dos subtemas os tpicos discutidos com maior freqncia nos trabalhos publicados, foram 14 questes discutidas resgatadas na anlise dos documentos; 7. tipo de publicao: foram identificadas no levantamento 9 tipos de publicaes (artigo; livro; tese; dissertao; relatrio; captulo de livro; texto online; norma, declarao); o tipo de documento trabalho em evento cientfico no foi includo por causa da dificuldade de acessar os contedos da maioria dos trabalhos apresentados nos ltimos anos;
214 8. peridico: este item foi destacado por se tratar da forma de publicao mais usada pelos autores da rea para divulgar seus trabalhos; foram identificados 68 ttulos (Tabela 8); 9. pas: esta varivel serviu para identificar a origem das publicaes e sua predominncia geopoltica (15 pases); 10. ano: foi utilizada para contextualizar temporalmente a produo em preservao digital. Essas variveis foram submetidas a um tratamento estatstico descritivo (anlise de freqncia) no qual foram cruzados os seguintes fatores: - subtema versus autores; - subtema versus autoria; - subtema versus pas - subtema versus ano; - proposta versus aspecto discutido; - ano versus tipo de publicao; - rea versus tipo de publicao; - pas versus tipo de publicao; - ano versus peridico.
4.1.2 Avaliao da produtividade
Quantificou-se a produo individual dos principais autores em diferentes perodos e seu impacto no desenvolvimento da rea. A seguir apresentam-se as anlises dos resultados seguindo as sete questes formuladas.
Qual o interesse dos autores em relao aos subtemas relacionados com a preservao digital?
Os autores produziram documentos sobre quatro subtemas: Percepo, Gerenciamento, Estratgias e Certificao. A mdia de produes por autor bastante baixa (Mdia = 1,29, DP = 0,79). A maioria dos autores (83,1%) teve apenas uma produo; 10,5% dos autores produziram dois documentos cada e 4% dos autores produziram trs documentos cada. Um autor produziu quatro
215 documentos (H. M. Gladney), quatro autores produziram cinco documentos cada (K. Thomaz, M. Day, NLA, OCLC/RLG) e um autor produziu sete documentos (N. Beagrie). A Tabela 1 apresenta a distribuio de autores em funo dos subtemas relacionados preservao digital. Conforme pode ser verificado, a maioria dos autores (67,1%) produziu documentos sobre Gerenciamento e Estratgias refletindo, desta maneira, maior porcentagem de publicaes nestes temas (68,7%). A tabela tambm aponta uma distribuio semelhante do nmero de pases envolvidos nestas publicaes.
Tabela 1 Produo dos autores em funo dos subtemas de interesse Subtema N o . autores % N o . pases % N o . publicaes % Certificao 35 12,4 7 20,0 38 11,9 Estratgias 89 31,4 9 25,7 104 32,6 Gerenciamento 101 35,7 8 22,9 115 36,1 Percepo 58 20,5 11 31,4 62 19,4 TOTAL 283 100 35 100 319 100
Conforme pode ser verificado na Figura 21, dos 16 pases envolvidos na produo de documentos, apenas seis pases produzem documentos em todos subtemas relacionados preservao digital, a saber: Estados Unidos, Inglaterra, Brasil, Austrlia, Alemanha e Holanda. Notadamente, os pases que mais produziram documentos foram os Estados Unidos e a Inglaterra, sendo suas produes equivalentes a 56% e 22%, respectivamente, do total de publicaes.
216
Figura 21 Subtemas e locais das publicaes
Como se desenvolveram os principais sub-temas relacionados com a preservao digital?
A Tabela 2 apresenta a distribuio de freqncia absoluta (fa p ) de trabalhos publicados em cada um dos subtemas e o tipo de autoria nas respectivas categorias.
Tabela 2 Freqncia de publicaes e autoria em funo do subtema Subtema fa p % Autoria nica % Autoria mltipla % Certificao 38 11,9 29 12 9 11,7 Estratgias 105 33,0 77 32,0 28 36,4 Gerenciamento 116 36,5 90 37,3 26 33,8 Percepo 60 18,9 46 19,1 14 18,2 TOTAL 319 100 241 100 77 100
A Tabela 2 evidencia que a maioria dos trabalhos publicados tratou dos subtemas Estratgias e Gerenciamento, perfazendo um total de 69,5%. Poucos trabalhos se dirigiram a questes relacionadas Certificao. Destaca-se que 75,8% do total de publicaes (i.e., 241 trabalhos) corresponderam autoria nica, contra 24,2% (i.e., 77 trabalhos) de trabalhos publicados por mais de um autor. Uma explicao do baixo ndice de trabalhos que tratavam os assuntos relacionados com a certificao est no fato de que os resultados dos testes de
217 aplicao de indicadores de auditoria propostos nos atuais modelos de referncia (Repository Audit and Certification - RAC, Model Requirements for Electronic Records Management - MoReq2 e o Catalogue of Criteria for Truested Digital Repositories) encontram-se em avaliao e reviso (CRL; 2007; KACZMARECK et al., 2006; NESTOR, 2006). Com relao predominncia da autoria nica, pode-se afirmar que motivada pela rpida publicao de resultados de pesquisas individuais, que regularmente demoram menos tempo em serem concludas do que as que contm resultados de grandes projetos e inciativas implementadas. A Figura 22 apresenta a tendncia de contribuio de cada subtema durante o perodo de tempo analisado.
Figura 22 Contribuio dos subtemas no perodo 1996 a 2007
A Figura 22 evidencia o aumento da contribuio da maioria dos subtemas a partir de 1997, excetuando o subtema Percepo, cuja contribuio permaneceu relativamente estvel. Destaca-se que a participao de Gerenciamento e Certificao foi muito similar ao longo de todo o perodo, sendo que, nos anos de 2000 e 2003, houve aumento significativo de publicaes nestas reas. Isto pode estar relacionado ao fato de que, para essa poca j haviam projetos estveis em diversos pases e que a pesquisa comeou a enfocar o desenvolvimento de ferramentas e repositrios confiveis (McGOVERN, 2007).
218 A tendncia de contribuio do tipo de autoria pode ser vista na Figura 23, onde se observa aumento crescente no nmero de autorias nicas durante o perodo 1996-2007, sendo que, nos anos de 2000 e 2003, registrou-se nmero expressivo de trabalhos individuais. A freqncia de trabalhos publicados por mais de um autor aumentou modestamente em 1998, e tendeu a se estabilizar at 2004, quando pode ser verificado pequeno aumento deste tipo de autoria, que retornou aos nveis anteriores no ano de 2007.
Figura 23 Freqncia do tipo de autoria em funo do ano de publicao
Quais foram as principais propostas e aspectos relacionados com a preservao digital debatidos?
Foram identificados 12 tipos de propostas no perodo analisado. Estas propostas esto relacionadas na Tabela 3. A categoria recomendao foi o tipo mais sugerido pelos pesquisadores (55,3%), seguido de projetos (15,6%). As dez categorias restantes corresponderam a 29,1% do total de propostas registradas, sendo curso e catlogo os tipos menos sugeridos pelos autores.
219 Tabela 3 - Tipos de propostas para preservao digital Tipo freqncia % recomendao 163 55,3 projeto 46 15,6 modelo 20 6,8 software 16 5,4 poltica 13 4,4 colaborao 12 4,1 manual 8 2,7 guia 6 2,0 tutorial 4 1,4 dicionrio 4 1,4 curso 2 0,7 catlogo 1 0,3 TOTAL 295 100
Uma anlise temporal da ocorrncia de propostas, observada na Figura 24, mostra que foram apresentadas recomendaes ao longo de todo o intervalo 1996 a 2007, e que o nmero de recomendaes tendeu a aumentar a partir de 1997. Em 2000 e 2003 o nmero de recomendaes foi superior aos demais anos do intervalo temporal considerado. Em segundo lugar se destacaram os projetos apresentados a partir de 1998, tendo ocorrido aumento significativo nos anos de 2000, 2003 e 2006.
Figura 24 Tipos de propostas apresentadas no perodo 1996 a 2007
220 Durante grande parte do perodo analisado tambm foram registradas propostas de manuais, software, polticas e colaboraes. As propostas menos presentes ao longo do perodo foram tutoriais, cursos, dicionrios e catlogos. Uma anlise qualitativa foi realizada para avaliar quais foram as questes debatidas no contexto das propostas apresentadas. Quatorze questes foram identificadas e podem ser vistas na Tabela 4, a seguir, que inclui a freqncia absoluta de ocorrncia e a respectiva porcentagem de cada questo. Seis tipos de questes dominaram as propostas e juntas perfizeram 71% do total de questes: iniciativa, sistemas e ferramentas de arquivamento, colees e recursos digitais, instituies e atributos e requisitos.
Tabela 4 - Questes debatidas no perodo 1996-2007 Questes debatidas freqncia % iniciativa 14,1 13,9 sistemas e ferramentas de arquivamento 12,2 12,0 colees e recursos digitais 11,9 11,7 objetos e informao digital 11,3 11,4 instituies 10,7 10,8 atributos e requisitos 10,7 10,8 metadados 6,9 7,0 publicaes eletrnicas 6,3 6,3 padres 6,0 6,0 custos 2,5 2,5 legislao 2,2 2,2 migrao 1,9 1,9 acesso 1,9 1,9 emulao 1,6 1,6 Total 100 319
O Quadro 12, a seguir, retrata a presena de cada uma das questes debatidas no contexto das propostas ao longo do perodo 1996-2007. Nesta figura, as clulas preenchidas em cor cinza indicam que a questo foi debatida no respectivo ano. Conforme ilustra esse Quatro, nove questes estiveram presentes ao longo de praticamente todo o perodo focalizado: colees e recursos digitais, objetos e informao digital, instituies, iniciativa, sistemas e ferramentas de arquivamento, atributos e requisitos, publicaes eletrnicas, padres e metadados. Dentre estas, registrou-se que questes relacionadas s colees e recursos digitais, bem como objetos e informao digital foram as mais presentes no contexto
221 das propostas ao longo dos ltimos 11 anos. Em contrapartida, observa-se que no estiveram muito presentes nas propostas discusses sobre questes relacionadas ao acesso, migrao, legislao, emulao e custos durante o mesmo perodo.
Ano Questes Debatidas 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 acesso atributos e requisitos colees e recursos digitais custos emulao iniciativa instituies legislao metadados migrao objetos e informao digital padres publicaes eletrnicas sistemas e ferramentas de arquivamento Quadro 12 - Questes debatidas em cada ano do perodo
Por fim, a Tabela 5 traz a porcentagem de ocorrncia de cada questo debatida no contexto de cada proposta apresentada no intervalo 1996-2007. A tabela mostra como o nmero de ocorrncias de recomendaes sobre todas as questes identificadas foi maior. Uma caracterstica comum desses trabalhos esteve na forma como eles cobriam toda a variedade de assuntos relacionados ao tema e, a necessidade de apresentar descries bsicas sobre o gerenciamento dos objetos digitais.
Qual o tipo de documento que est sendo publicado? A Figura 25 apresenta a tipologia de documentos verificada na amostra coletada. A porcentagem de cada tipo de documento pode ser observada junto a cada eixo da figura. A tipologia mais freqentemente utilizada pelos autores foi artigo (62%) e, em segundo lugar, textos on-line. Todos os demais tipos de documentos representaram 23% da tipologia observada, ou seja, os autores no tm preferido utilizar teses, declaraes, normas, dissertaes, captulos de livro, livros ou relatrios para divulgar seus trabalhos na rea de preservao digital.
223
Figura 25 Tipologia de documentos
Conforme pode ser constatado na Figura 26, a linha de tendncia, delineada na cor preta e pontilhada, evidencia aumento crescente do nmero total de documentos produzidos no perodo de 1996 a 2007. Este aumento iniciou marcadamente a partir de 1997, sendo que nos anos de 2000 e 2003 a produo foi significativamente superior aos demais anos do perodo.
Figura 26 Tendncia da produo de documentos no perodo 1996 a 2007
interessante observar o tipo de documento produzido no perodo de 1996 a 2007, conforme ilustra a Figura 27.
224
Figura 27 Tipo de produo em funo do ano de produo
A Figura 27 mostra que a categoria mais presente ao longo de todo o perodo foi artigo. Alm disto, verifica-se tendncia de aumento na quantidade de artigos publicados ao longo dos 11 anos de observao. A segunda categoria de publicao mais presente durante este intervalo de tempo foram os textos on-line, e a terceira categoria foram os relatrios. Nota-se, ainda, que os livros comearam a ser produzidos a partir do ano de 1999.
De qual rea do conhecimento eram as publicaes que abordaram o tema da preservao digital?
As publicaes encontradas estavam associadas a uma das seguintes reas: biblioteconomia, arquivologia, cincia da informao, cincia da computao e histria. Conforme ilustra a Tabela 6, a maioria dos trabalhos foi produzida na rea de biblioteconomia. Produes nas reas de histria ou cincia da computao so muito raras.
225
Tabela 6 Distribuio de freqncia da rea do conhecimento rea freqncia % biblioteconomia 256 80,3 arquivologia 34 10,7 cincia da informao 20 6,3 cincia da computao 5 1,6 histria 2 0,6 sem/rea 2 0,6 TOTAL 319 100
A Tabela 7, a seguir, apresenta a distribuio das publicaes em funo da rea de conhecimento. Dois valores em cada clula da tabela so mostrados: os nmeros ao lado dos parnteses indicam a freqncia de ocorrncia de cada publicao na respectiva rea de conhecimento, e o nmero entre parnteses indica a porcentagem da respectiva produo em relao ao total de produes.
Tabela 7 Tipos de publicao em funo da rea de conhecimento rea de Conhecimento Tipo de Publicao cincia da informao arquivologia biblioteconomia cincia da computao histria TOTAL artigo 11 (3,5%) 19 (6,0%) 165 (52,1%) 1 (0,3%) (0%) 61,8% captulo de livro 1 (0,3%) 4 (1,3%) 6 (1,9%) (0%) 2 (0,6%) 4,1% declarao (0%) 1 (0,3%) 2 (0,6%) (0%) (0%) 0,9% dissertao 5 (1,6%) (0%) 1 (0,3%) (0%) (0%) 1,9% livro 1 (0,3%) 4 (1,3%) 12 (3,8%) (0%) (0%) 5,4% norma (0%) 3 (0,9%) 1 (0,3%) (0%) (0%) 1,3% relatrio 29 (9,1%) (0%) (0%) (0%) (0%) 9,1% tese 2 (0,6%) (0%) (0%) (0%) (0%) 0,6% texto on-line (0%) 3 (0,9%) 40 (12,6%) 4 (1,3%) (0%) 14,8%
Conforme mostra essa tabela foram produzidos artigos em quatro reas de conhecimento, sendo que a maior parte ocorreu em biblioteconomia. A maioria dos livros, captulos de livros, textos on-line e declaraes tambm estavam associados a esta rea do conhecimento. A maior parte da produo na rea de cincia da informao consistiu de relatrios, mas tambm foram registrados alguns artigos, livros, tese, dissertao e captulo de livro.
226 Na rea de arquivologia foram encontrados os seguintes tipos de publicao: artigo, livro, captulo de livro, texto on-line, norma e declarao. Na cincia da computao foram registrados poucos textos on-line e artigos, e na rea de histria somente encontrou-se a produo do tipo captulo de livro.
Que peridicos cientficos veicularam artigos sobre preservao digital?
Como pode ser observado na tabela 8, a seguir, a concentrao de nmeros de peridicos que mais publicaram artigos sobre preservao digital esteve nos Estados Unidos e na Inglaterra. Existe alta concentrao de artigos em pequeno nmero de peridicos, a maioria da rea da biblioteconomia e cincia da informao.
Tabela 8 - Ttulo e pas de origem dos peridicos com artigos sobre preservao digital Ttulo Pas Artigos ACM Transactions on Computer Systems Estados Unidos 1 ACM Transactions on Information Systems Estados Unidos 1 Alexandria Inglaterra 1 American Archivist Estados Unidos 1 American Libraries Estados Unidos 2 Ariadne Inglaterra 13 ARL: A Bimontly Report on Research Library Issues and Action Estados Unidos 1 Arquivstica.net Brasil 3 Aslib Proceedings Inglaterra 1 Australian Academic & Research Libraries Austrlia 2 Change Estados Unidos 1 Chronicle of Higher education Estados Unidos 1 Cincia da Informao Brasil 1 Collection Management Estados Unidos 3 College & Research Libraries Estados Unidos 2 Communications of ACM Estados Unidos 1 Computers and the Humanities Holanda 2 Computers in Libraries Estados Unidos 1 Data Science Journal Frana 2 DataGramaZero Brasil 2 Digital Library Network Estados Unidos 1 D-Lib Magazine Estados Unidos 35 Documents Numerique Frana 1 EDUCAUSE Review Estados Unidos 2 El Profesional de la Informacin Espanha 1 First Monday Estados Unidos 2 Hi Energy Physics Libraries Webzine Sua 1 Information Services & Use Holanda 2 International Journal of Digital Curation Inglaterra 4 International Journal on Digital Libraries Alemanha 3 Issues in Science and Technology Librarianship Estados Unidos 1
Continua
227
Tabela 8 - Continuao Ttulo Pas Artigos Journal of Academic Librarianship Holanda 1 Journal of American Society for Information Science and Technology Estados Unidos 1 Journal of Archival Organization Estados Unidos 1 Journal of Digital Information Estados Unidos 2 Journal of Electronic Publishing Estados Unidos 4 Journal of Library Administration Inglaterra 1 Journal of Research of the National Institute of Stand Tech Estados Unidos 2 Journal of the Association of Moving Image Archivists Estados Unidos 1 Learned Publishing Inglaterra 4 Libraries and the Academy Estados Unidos 3 Library and Information Research News Inglaterra 1 Library Hi Tech Inglaterra 2 Library Journal Estados Unidos 1 Library Journal, Net Connect Estados Unidos 1 Library Management Inglaterra 1 Library Resources & Technical Services Estados Unidos 1 Library Review Inglaterra 2 Library Trends Estados Unidos 6 Multimedia Information and Technology Inglaterra 1 New Review of Academic Librarianship Inglaterra 4 OCLC Systems & Services Estados Unidos 3 On-line Journal for Cultural Studies Austria 1 Perspectivas em cincia da informao Brasil 1 Program Inglaterra 2 Reference Librarian Estados Unidos 1 Research Information Estados Unidos 2 Revista IP Brasil 1 RLG DigiNews Estados Unidos 27 SciCom Info Sucia 1 Science & Technology Libraries Estados Unidos 1 Serials Inglaterra 3 Serials Librarians Estados Unidos 4 Serials Reviews Estados Unidos 11 Technicalities Estados Unidos 1 The Botton Line: Managing Library Finances Inglaterra 1 Update Inglaterra 1 Vine Inglaterra 1
Os exemplos citados refletem a comunidade de prtica definida por representantes de arquivos, bibliotecas, museus e outras instituies de ensino e pesquisa. Foi constatada a origem geogrfica da maior parte das informaes divulgadas, as recomendaes e descries dos aspectos tcnicos da preservao digital publicadas por autores em peridicos no exterior, os quais, de alguma forma, estavam relacionados com iniciativas e projetos de instituies no Primeiro Mundo.
228 4.1.3 Temticas e questes discutidas
As referncias citadas formaram um contingente de documentos selecionados, que produziram a necessidade de delimitar o escopo da anlise bibliomtrica. Todos os trabalhos retratam uma amostragem da produo intelectual sobre os assuntos relacionados ao tema principal desta pesquisa. O estudo apontou como resultados que a definio sobre o conceito de preservao digital no mais uma preocupao para os autores e que os aspectos relacionados com a implantao e certificao de repositrios digitais esto no centro do debate nos ltimos anos. Os autores revelaram a preocupao com a necessidade de conhecimento sobre os procedimentos de armazenamento e acesso aos documentos digitais. Tambm, o estudo permitiu avaliar a produo cientfica em categorias especficas, levando em considerao os debates centrais propostos pelos autores. A definio das variveis foi o resultado da reviso da literatura que envolveu um dos objetivos especficos desta pesquisa, que identificar os critrios para o estabelecimento de sistemas de gesto de preservao digital de informao cientfica. Identificados os principais autores e fontes de informao da rea, as questes discutidas por eles focalizaram as caractersticas das iniciativas e as caractersticas das colees e objetos digitais com que eles trabalham. O aparecimento de alto nmero de trabalhos em publicaes peridicas nacionais e estrangeiras divulgando apenas recomendaes uma indicao do estgio de desenvolvimento de estudos sobre o assunto. Em vrios livros da rea da cincia da informao a preservao digital aparece como um tpico relativo ao gerenciamento de informao em bibliotecas e repositrios digitais. Tambm rara a publicao de teses ou dissertaes dedicadas ao tema da preservao digital. Pode afirmar-se que a rea da preservao digital est na sua fase de institucionalizao e legitimao.
229 4.2 ANLISE DOS DADOS DOS QUESTIONRIOS
Examinar a amostra da populao das unidades de pesquisa do MCT que possuem centros de informao e biblioteca implicou uso de mtodos de coleta de dados para constituir uma lgica de anlise. A aplicao de questionrios e entrevistas permitiu a coleta direta de informao com as pessoas envolvidas com as atividades institucionais relacionadas com a preservao dos documentos digitais. Como mostraram Fink e Kosecoff (1985), os questionrios e entrevistas so mtodos vlidos, exeqveis e que transferem credibilidade aos resultados das pesquisas, havendo apenas a necessidade de se indagar a quem as perguntas sero dirigidas, onde e com que freqncia, assim como a abordagem de anlise e a interpretao dos dados. O questionrio utilizado nesta pesquisa (Apndice A) foi produto da necessidade de contextualizar as prticas de preservao dos documentos digitais e do interesse por parte da Biblioteca de Poltica em Cincia e Tecnologia (BPCT) da Coordenao-Geral de Gesto e Inovao (CGGI) do Ministrio da Cincia e Tecnologia (MCT). A biblioteca registrava, entre seus projetos para o ano de 2004, o levantamento das atividades que as unidades de pesquisa realizavam com relao ao tratamento dos seus documentos bibliogrficos, em qualquer suporte. O questionrio foi encaminhado pela responsvel da BPCT via correio eletrnico para os endereos oficiais dessas instituies, as respostas foram analisadas conjuntamente com a BPCT e as informaes coletadas puderam ser confirmadas posteriormente, por meio das entrevistas nas sedes das unidades. A aplicao do questionrio foi uma escolha justificada pela expectativa de poder identificar o maior nmero de pessoas envolvidas com os trabalhos de preservao de documentos em todos os formatos. No quesito sobre o tratamento dos documentos digitais, esperava-se encontrar dados que pudessem auxiliar na localizao de informaes oficiais sobre esses objetos digitais. Os dados dos questionrios evidenciaram o contexto dos centros de informao do MCT, o perfil das suas equipes e as caractersticas do manejo da informao digital no mbito do Ministrio.
230
4.2.1 Caractersticas dos centros de informao
A maioria das unidades de pesquisa do Ministrio da Cincia e Tecnologia conta com centros de informao ou setor de biblioteca onde so tratados todos os materiais bibliogrficos das suas reas de competncia, produzidos por pesquisadores internos e externos instituio. Foram recebidos questionrios com respostas de responsveis por centros de informao e bibliotecas de 20 unidades de pesquisa do MCT. Os dados foram classificados para anlise em sete grupos: 1) setor responsvel pelo tratamento dos materiais; 2) tipos de materiais tratados nos centros; 3) tipo de aplicao de software usado; 4) ferramenta para indexao dos contedos; 5) tipo de acesso; 6) tratamento da produo cientfica local; 7) tratamento dos materiais digitais. As respostas das instituies apontaram as peculiaridades em relao ao tipo de tratamento dado aos registros da produo cientfica. O contexto histrico de cada unidade pode ser observado no Apndice D. O Quadro 13, a seguir, apresenta os locais das unidades de pesquisa e os materiais bibliogrficos tratados pelas respectivas unidades. Como pode ser verificado, seis unidades de pesquisa no responderam a esta questo, quais sejam: Inpa, Mast, CNPq, Cetem, Impa e Cnen. Para rastrear a localizao dos arquivos digitais, foi necessrio perguntar sobre o setor responsvel pelo tratamento segundo o tipo de material. Baseados nas respostas de treze unidades, constatou-se que, segundo a percepo dos responsveis pelos centros de informao e biblioteca, eram eles os encarregados por esse trabalho. Isso pode ser verificado no Quadro 13, uma vez que a maioria das unidades de pesquisa atribuiu s bibliotecas a responsabilidade do respectivo tratamento.
231 Tipo de material Unidade de pesquisa Monografias (livros/ anais/ teses/ dissertaes) Analticas (captulos de livros) Peridicos Artigos Comunicaes em eventos Multimeios (filmes, CDs, DVDs, fotografias etc.) TCC Trabalhos Experimentais Produo docente Outros CBPF Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca CenPRA Diviso de Comunicao e Gabinete DCOG DCOG DCOG DCOG CGEE Informao Informao Informao Informao Informao Informao Finep Biblioteca Biblioteca Biblioteca Biblioteca Ibict Processos Tcnicos Aquisio Processos Tcnicos
IDSM Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Inpe Processamento Tcnico de Livros Processamento Tcnico de Peridicos Processamento Tcnico de Livros Processamento Tcnico de Livros Memria Tcnico- Cientfica
INT Biblioteca LNA Biblioteca Biblioteca LNCC Biblioteca Biblioteca LNLS Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Biblioteca Mpeg Biblioteca Biblioteca Biblioteca Biblioteca e Arquivo Biblioteca (coleo de livros raros) ON Diviso de Informao e Documentao
RNP Centro de Informaes
Quadro 13 - Tipo de material segundo e setor responsvel no centro de informao e biblioteca
232 O Cnen contava com 14 unidades vinculadas, algumas delas com bibliotecas, mas unicamente a biblioteca sede foi includa nesta pesquisa. Um centro de informao que no foi includo foi a Coordenao de Sistemas de Informao da unidade Indstrias Nucleares do Brasil (INB). A resposta recebida ao envio do questionrio explicava que: - [...] o acervo de nossa biblioteca constitudo basicamente de normas tcnicas nacionais e estrangeiras para atender s necessidades das duas fbricas de combustvel nuclear. A produo intelectual interna se existe no est acessvel, nem consta do acervo da nossa biblioteca, tendo em vista o carter restrito de parte das atividades da INB. (Bibliotecria R2)
A segunda comparao dos resultados ocorreu com relao aos tipos de materiais e aos software utilizados para o registro em bases de dados locais. O Quadro 14, a seguir, apresenta as bases de dados usadas pelos centros de informao e bibliotecas para o registro dos materiais bibliogrficos. O Quadro inclui as respostas de 18 unidades de pesquisa. Cetem e CNPq no responderam a este item do questionrio. No Quadro, as clulas preenchidas com a palavra No significam que a unidade no utiliza o sistema de base de dados aplicado em outros materiais pela prpria unidade. Existe uma variedade de solues em funcionamento nas bibliotecas e centros de informao, representando um modelo que no permite a integrao das informaes de todas as instituies. As solues encontradas eram bases de dados proprietrias, provedores de dados de arquivos abertos, repositrios digitais e sistemas de publicao eletrnica. A falta de compartilhamento das solues adotadas deixou em evidncia as caractersticas de sistemas de gesto da informao pouco integradoras dos centros de informao e bibliotecas.
233 Tipo de material Unidade de pesquisa Monografias (livros, anais, teses/ dissertaes) Analticas (captulos de livros) Peridicos Artigos Comunicaes em eventos Multimeios (filme, CD, DVD, fotografia, etc.) TCC / Trabalhos Experimentais Produo docente Outros CBPF Sistema Prprio Sistema Prprio Sistema Prprio Sistema Prprio Sistema Prprio Sistema Prprio Sistema Prprio Sistema Prprio CenPRA SICTEC CGEE Prprio Prprio Prprio Prprio Prprio Prprio Cnen Microisis com interface desenvolvida localmente Secs Bireme (local) Anais de eventos sistema prprio (base Anais) Microisis com interface desenvolvida localmente)
IDSM Caribe Caribe Caribe Caribe Caribe Impa Horizont Horizont Inpa BIBLIOBASE BIBLIOBASE BIBLIOBASE BIBLIOBASE inpe Sophia No Sophia No Sophia Sophia No URLib Service 3
INT SYSBIBLI/PHL SYSBIBLI/PHL CD de Anais Cientfica Defesas de teses LNA Access for Windows Access for Windows No Dentro de monografias
LNCC Pergamum pergamum LNLS RM Biblios No RM Biblios No RM Biblios RM Biblios RMBiblios Delphi / SQL Server
Mast Microisis Microisis Peripuc Microisis Microisis Microisis Microisis Mpeg Caribe Caribe Caribe Caribe Caribe (coleo livros raros) ON Microisis ( sendo implantado) Pergamum No ReriPuc (sendo implantado) No No Microisis (sendo implantado) Sim RNP No No web No No No No No Access Windows
Quadro 14 Bases de dados usadas nos centros de informao e bibliotecas para o registro dos materiais bibliogrficos
234
As ferramentas de indexao utilizadas pelos centros e bibliotecas das unidades, segundo o tipo de material, podem ser vistas no Quadro 15. Somente duas unidades de pesquisa no responderam a esta solicitao do questionrio (ON e CNPq). Neste Quadro, as clulas que contm a palavra No significam que a ferramenta de indexao escolhida no foi aplicada para esse tipo de material. A maioria das unidades de pesquisa do MCT conta com algum tipo de ferramenta de indexao dos registros bibliogrficos em suas bases de dados. Esse tipo de mecanismo permite que seja realizada a correta descrio da produo cientfica internacional e local. Os dados do Quadro 15 atestam que a forma tradicional de descrio bibliogrfica continua prevalecendo nessas instituies.
235 Tipo de material Unidade de pesquisa Monografias (livros/ anais/teses/ dissertaes) Analticas (captulos de livros) Peridicos Artigos revistas Comunicaes em eventos Multimeios (filme, CD, DVD, Fotografia, etc.) TCC/Trabalhos Experimentais Produo docente Outros CBPF INSPEC No CenPRA AINFO-NTIA (EMBRAPA) AINFO-NTIA (EMBRAPA) AINFO-NTIA (EMBRAPA)
Ibict Tesauro da Cincia da Informao TCI e o Spines para reas correlatas TCI TCI IDSM INTERVOC INTERVOC INTERVOC INTERVOC INTERVOC Impa Classificao de assunto do IMPA Classificao de assunto do IMPA Classificao de assunto do IMPA Classificao de assunto do IMPA Classificao de assunto do IMPA Classificao de assunto do IMPA Classificao de assunto do IMPA
Inpa Library of Congress (LC) e Biblioteca Nacional (BN) LC e BN LC e BN LC e BN Inpe Tesauro da NASA No Tesauro da NASA Tesauro da NASA Tesauro da NASA
INT Vocabulrio controlado LNA No No No No LNCC Subject Heading da LC Subject Heading da LC
LNLS Assunto No Assunto No Assunto Assunto Assunto Ano de Publicao
Quadro 15 - Ferramenta de indexao utilizada segundo o tipo de material
236 O Quadro 16, a seguir, indica o tipo de acesso disponibilizado pelas unidades de pesquisa do MCT, segundo o tipo de material. O Mast e INT no responderam a este item do questionrio. Como observado na reviso da literatura, uma das preocupaes centrais dos envolvidos na aplicao de critrios de preservao digital o tipo de acesso e a insero de dados nos repositrios (CCSDS, 2003; DAY, 2002). Nos casos em que ainda no foi realizada nenhuma forma de padronizao em relao a metodologias de preservao digital, esperava-se que existisse uma postura institucional que estabelecesse as condies mnimas para o funcionamento de algum sistema de preservao digital. Entretanto, esta expectativa no se confirmou. No caso das unidades de pesquisa do MCT, os materiais analgicos e digitais permitem dois tipos de acesso: o bibliogrfico, que disponibiliza as informaes catalogrficas do registro; e aquele que permite o acesso ao texto completo. Observou-se que, nas instituies que permitiam algum tipo de acesso ao texto completo, isso era realizado por meio da indicao do site da revista na qual o mesmo estava disponvel. Conforme demonstrado na reviso da literatura, esse tipo de prtica no pode ser considerado de preservao digital, pois se a biblioteca apenas disponibiliza o endereo da revista ou uma cpia do texto da revista com acesso livre na Internet, no h qualquer garantia de preservao deste material.
237
Quadro 16 Tipo de acesso disponibilizado pelas unidades de pesquisa do MCT segundo o tipo de material
Tipo de material Unidade de pesquisa Monografias (livros/ anais/ teses/ dissertaes) Analticas (captulos de livros) Peridicos Artigos revistas Comunicaes em eventos Multimeios (filme, CD, DVD, fotografia, etc.) TCC/ Trabalhos Experimentais Produo docente Outros Cenpra Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Bibliogrfico Cetem Texto completo CGEE Bibliogrfico e Texto completo Bibliogrfico e Texto completo Bibliogrfico e Texto completo Bibliogrfico e Texto completo Bibliogrfico e Texto completo Bibliogrfico e Texto completo
238 As formas de tratamento da produo cientfica das diferentes unidades de pesquisa podem ser observadas no Quadro 17, a seguir. Quatro unidades no responderam a esta questo: INT, ON, CNPF e LNA. Conforme mencionado anteriormente, requisito indispensvel para o estabelecimento de um sistema de preservao digital nas instituies a necessidade de definir as formas de armazenamento e metodologias adequadas para a conservao dos materiais analgicos e digitais (FUNARI, 2005; LYNCH, 2003; PETERS, 2002). O Quadro evidencia que as unidades de pesquisa aplicam formas de classificao, armazenamento e metodologias de conservao da produo cientfica em qualquer suporte. Alm disso, destaca-se a falta de ateno que a preservao de longo prazo tem merecido nessas unidades e a necessidade da anlise dos requisitos, planejamento, concretizao e avaliao de solues tecnolgicas adequadas para a preservao dos recursos digitais. As prticas de preservao continuam sendo moldadas pelas atividades tradicionais de preservao para o material impresso, sendo que a preocupao com a preservao digital ainda no central para a maioria dessas instituies. O tipo de documento que apresenta alguma implementao de preservao digital o peridico eletrnico. Relatrios tcnicos em formato digital e outros tipos de literatura cinzenta esto comeando a ser coletados, mas sem enfrentar diretamente a preservao de longo prazo.
239 Unidade de pesquisa Classificao Forma de armazenamento Metodologia para conservao (em qualquer suporte) CBPF Especfico para a coleo p/ ano: Classificao Decimal Dewey p/ livros Especfico para a coleo em caixas: estantes Especfico para a coleo: cpias em papel e digitalizadas: higienizao e desinfestao por firma especializada CenPRA Igual a do acervo geral: papel e digital Igual a do acervo geral: papel e digital Igual a do acervo geral: banco de dados Cetem CDD CGEE Igual a do acervo geral Igual a do acervo geral Igual a do acervo geral Cnen Igual a do acervo geral Igual a do acervo geral. Especfico para a coleo: a parte mais recente est armazenada em arquivos PDF e disponibilizada via intranet. O armazenamento dos arquivos est sendo feita num servidor onde ficam os servios bibliogrficos Igual a do acervo geral Finep Especfico para a coleo: seqencial Especfico para a coleo: seqencial Especfico para a coleo: microfilme Ibict Igual a do acervo geral CDU As monografias so armazenadas em estantes metlicas, em ordem de classificao; as colees de peridicos so armazenadas em estantes metlicas em ordem alfabtica de ttulo.
IDSM Igual a do acervo geral: CDD Impa Especfico para a coleo: tabela especfica Classificao de assunto do IMPA
inpa Igual a do acervo geral Igual a do acervo geral Igual a do acervo geral Inpe Especfico para a coleo (Duas seqncias: 1. geral, 2. pelo tipo de publicao) Especfico para a coleo: arquivos (HTML, Word, PDF) Especfico para a coleo: armazenamento digital em disco rgido; CD-ROM; Optical Disc LNCC Igual a do acervo geral Igual a do acervo geral LNLS Igual a do acervo geral: Publicaes Internas, Comunicao TcnicaCT, Especificaes Tcnicas ET, Manual Tcnico MT, Memorando de Projeto MeT, Notas de cursos e Workshops NCW, Preprint, Relatrio de Bolsistas de Vero RBV, Relatrio de Bolsistas RB, Relatrio de Estagirio RE Igual a do acervo geral: o documento registrado na Intranet, recebe um nmero anual, o texto anexado e transformado em PDF e disponibilizado para consulta dos usurios. O material impresso e encadernado, arquivado por ano (ainda no disponibilizamos p/ consulta via Web)
Mast Igual a do acervo geral Igual a do acervo geral Igual a do acervo geral Mpeg Igual a do acervo geral e especfico para a coleo: acrescenta-se sigla para identificar MGCOL Base de dados igual a do acervo geral e especfica para a coleo Igual do acervo geral: alguns em armrios deslizantes RNP Igual a do acervo geral: Classificao Decimal de Dewey, 21. Ed. Categorias documentais, de acordo com nossas necessidades e especificidades de assuntos e documentos. Igual a do acervo geral: Sistemtico, por ordem de classificao.: estrutura de arquivos independentes, em diretrios e disponveis na intranet e no website. Manuteno de organizao dos arquivos eletrnicos armazenados, segundo critrios de categoria, verso e viso. Quadro 17 Formas de tratamento da produo cientfica da unidade de pesquisa
240 O Quadro 18 indica se as unidades de pesquisa aplicam mtodos de preservao aos materiais bibliogrficos. As seguintes unidades no responderam a este questionamento: Impa, LNA, MPEG, Mast, Finep e IDSM. Os responsveis pelos centros de informao e bibliotecas foram interrogados com relao ao tratamento dado aos materiais em formato digital, uma vez que, nas unidades de pesquisa, so produzidos objetos digitais. Esses podem ser pela converso de formatos ou pela produo de documentos originalmente digitais. A pesquisa identificou que aproximadamente metade das instituies realiza alguma forma de tratamento no acervo retrospectivo com vistas a formar colees digitais para o acesso por parte dos seus usurios. A digitalizao pode ser considerada como o incio da vida til de um documento digital, e por esse motivo as prticas de preservao de objetos digitais poderiam se estender ao planejamento da converso inicial de formatos. Apesar de que nenhum procedimento de preservao digital pode ser aplicado a materiais analgicos.
Quadro 18 - Mtodos de preservao aplicados aos materiais bibliogrficos nas unidades de pesquisa
Os dados do Quadro 18 apontam que reduzido o nmero de estratgias de preservao sendo implementadas nas agncias de pesquisa governamentais. Unidade de Pesquisa Aplicao de metodologia de digitalizao Aplicao de estratgia de preservao Participao em iniciativa de preservao digital CBPF Sim No No CenPRA Sim Sim No Cetem Sim No No CGEE No No No Cnen Sim No No CNPq Sim No No Ibict Sim No No Inpa No No No Inpe No Sim Sim INT Sim Sim No LNA No No No LNLS No No No ON No No No RNP No No No
241 Mas a complexidade destas estratgias no um sinal de maturidade na forma como o problema est sendo abordado. Em 2004, o Servio e Documentao e Acervo do CNPq informou no questionrio que a biblioteca encontrava-se nas condies como foi recebida do MCT, sem nenhuma classificao ou arranjo. Com a criao do Centro da Memria, o CNPq iniciou, naquele ano, um processo de digitalizao das atas do Conselho Deliberativo. Em 2006, o Cetem digitalizou as sries esgotadas das suas publicaes em verso impressa. No mesmo ano, a unidade de pesquisa CBPF comeou a desenvolver um projeto de preservao digital, que partiu do interesse dos funcionrios da Coordenao de Documentao e Informao Cientfica (CDI), mas a iniciativa no recebeu continuidade. O objetivo do projeto era desenvolver estratgias de preservao de informao digital tcnico-cientfica usando metadados. Outros projetos de digitalizao de acervos esto sendo iniciados nas unidades, mas a organizao das novas colees digitais retrospectivas ainda no foi avaliada. O fato de os centros e bibliotecas usarem solues proprietrias sugere que a maioria das instituies pesquisadas no demonstra preocupao com o estabelecimento de polticas de preservao digital nem no desenvolvimento de Pacotes de Disseminao de Informao (PDI), como a norma OAIS recomenda. O Inpe foi a nica unidade que adotou esse modelo no planejamento da sua biblioteca digital. Os dados evidenciaram, tambm, que a informao tcnico-cientfica nessas instituies carece de padronizao com relao s atividades de preservao digital. Alm disso, a pesquisa mostrou que os documentos digitais esto armazenados em bases de dados proprietrias, sem nenhum plano estratgico que garanta a longevidade da informao neles contida. Desde 2002, o Ibict trabalha com sistemas de informao que servem para a preservao digital. J em 2003, o instituto reuniu vrios especialistas para discutir o tema da preservao digital e a criao de um comit. O comit foi composto por representantes do Ibict, Biblioteca Nacional, Programa Sociedade da Informao, Bireme, Capes, Abec, Unesco e especialistas convidados. Foram criados vrios GTs, entre os quais estava o de Certificao Digital. Entretanto, a iniciativa no teve prosseguimento devido a mudanas administrativas e de diretoria.
242 O Ibict continua interessado em identificar as tendncias e apontar as atividades de preservao digital que podem ser aplicadas no contexto nacional de C&T. Foram realizados estudos sobre ferramentas para repositrios institucionais (CAF et al, 2003), concretamente, as pesquisas tiveram incio mediante a avaliao das ferramentas mais adequadas para essa finalidade. Algumas das ferramentas analisadas foram: Archimede da Layal University Library, o CDSware do CERN, o Fedora das Universidades de Virginia e Cornell e o DSpace do MIT. O Ibict acompanhou a primeira implementao do DSpace em lngua portuguesa, em 2002, realizada pela Universidade do Minho, em Portugal, que resultou na criao do seu repositrio institucional (RODRIGUES et al., 2004), o RepositoriUM. A partir de ento, o Ibict iniciou atividades de experimentao com este software. Em 2004, a Biblioteca do Superior Tribunal de Justia (STJ) recebeu assessoramento do Ibict para a criao do repositrio institucional BDJur, (BASEVI, 2004). Alm disto, o Ibict estabeleceu uma parceria com a Universidade de So Paulo (USP) que resultou na criao do Reposcom Repositrios Institucionais em Cincias da Comunicao (FERREIRA; SOUTO, 2005). A utilizao do software DSpace pelo Ibict surgiu com o projeto-piloto denominado Ridi (Repositrio Institucional Digital do Ibict) que visava recuperar a documentao de todas as atividades de pesquisa, publicando os contedos que se encontravam dispersos em vrios departamentos. Em 2007, o Instituto estava trabalhando em uma nova verso do DSpace totalmente em portugus (Brasil) e baseada na verso mais atual deste software. O produto incluiu sua reviso e a criao do pacote que est sendo repassado a outras instituies. Internacionalmente faz-se reconhecida a importncia das parcerias na realizao de atividades de preservao digital (FEENEY, 1999; LAVOIE, 2008). Elas tm possibilitado melhor compreenso dos benefcios no compartilhamento de custos e avaliaes de esforos no redundantes no estabelecimento de estratgias efetivas de preservao. Nas instituies pesquisadas, a construo da infra-estrutura considerada necessria para esse tipo de projeto ainda no foi analisada, assim como no se estimou a necessidade de contar com o apoio de instituies de fomento e de pesquisa. Essa realidade reproduz, em menor escala, as concluses do estudo realizado por Hedstrom e Montgomery para o RGL em 1998, ao afirmarem que as instituies participantes desse consrcio no tinham desenvolvido polticas nem
243 prticas de preservao digital e nem assumido a responsabilidade da preservao dos materiais em formato digital. A separao entre as propostas de preservao digital que surgem nas iniciativas internacionais e o status real da preservao digital em instituies como as unidades de pesquisa comea a ser percebida, mas a insuficincia de recursos e o planejamento inadequado das prticas para permitir o acesso de longo prazo so o maior obstculo para o estabelecimento de sistemas confiveis de preservao digital.
4.2.2 Perfil profissional das equipes
O primeiro contato com as equipes dos centros e unidades de pesquisa do MCT se deu por meio da listagem interna que a biblioteca do Ministrio dispe de todos os funcionrios desse rgo. Aps o envio do questionrio, na forma de um documento circular da biblioteca do Ministrio, as respostas comearam a serem enviadas para o pesquisador e os possveis respondentes identificados. O segundo contato ocorreu durante os eventos das associaes de cincia e tecnologia de 2004, 2005 e 2007, nos quais se reuniram representantes das unidades de pesquisa. Nesses encontros foi possvel ter uma primeira viso do contexto das unidades e dos profissionais que dispunham de informaes oficiais sobre os setores de biblioteca do MCT. As entrevistas realizadas durante os eventos de C&T com os representantes das unidades complementaram as informaes coletadas no questionrio, mais especificamente sobre os profissionais que realizavam algum tipo de manuteno dos documentos digitais nas unidades. O levantamento de dados sobre o perfil das equipes dos centros de informao e biblioteca do MCT pretendia identificar as pessoas que fariam parte da amostra de gestores da informao em formato digital do Ministrio. Como mostra a Tabela 9, as 20 instituies que enviaram suas respostas definiram suas equipes como sendo integradas por bibliotecrios, auxiliares tcnicos, analistas e arquivistas, assim como pessoal administrativo.
244 Embora o questionrio apenas permitisse a opo de escolha de resposta entre bibliotecrios e auxiliares, os respondentes manifestaram a presena dos profissionais da rea da cincia da computao como sendo uma parte importante para o desenvolvimento das atividades desses centros. O grupo de participantes da pesquisa comeou a ser definido aps a anlise do questionrio. Especificamente com relao populao, percebeu-se que havia a necessidade de agrupar os respondentes em trs categorias: o primeiro formado pela predominante presena de bibliotecrios; o segundo formado pelos auxiliares tcnico-administrativos; por ltimo, o grupo dos tcnicos de informtica e estagirios (estudantes de biblioteconomia, arquivologia e cincia da computao), que apresentaram maior mobilidade com relao ao tempo de atuao nos locais visitados.
245 Tabela 9 Servidores nas bibliotecas das unidades de pesquisa do MCT
Alm dos itens identificados na Tabela 9, nenhuma das unidades mencionou a presena, em suas equipes, de especialistas em preservao digital ou a contratao de consultores para a realizao dessas atividades. Isto pode ser explicado pela pouca divulgao no Brasil de consultorias dedicadas especificamente preservao digital de acervos bibliogrficos. Existe uma nica empresa brasileira dedicada a prestar esse tipo de servios. A empresa TECH-IN, liderada por pesquisadores da rea da cincia da informao e arquivologia com sede na cidade de Nova Lima, Minas Gerais, realiza diagnsticos e formula propostas para sistemas de gesto de preservao de Tipo de biblioteca e servidor Unidade de pesquisa Tipo de Biblioteca Servidores (Bibliotecrios) Servidores (Auxiliares) Servidores encarregados (Outros) Total CBPF Especializada 4 5 1 (analista) 10 CenPRA Abrangncia geral 1 2 1 (analista) 4 Cetem Especializada 1 1 2 (analistas) 4 CGEE Especializada 1 0 1 (analista) 2 (tcnicos de informao) 4 Cnen Especializada 2 1 1 (indexador) 4 CNPq Central/ Especializada 1 1 1 3 Finep 2 bibliotecas / 2 arquivos 4 3 1 (analista) 8 Ibict Especializada 2 2 1 (analista) 5 IDSM Especializada 1 1 0 2 Impa Especializada 2 2 1 (analista) 5 Inpa Especializada 1 0 0 1 Inpe Central / Especializada 6 2 2 (analistas) 10 INT Especializada 3 0 1 (analista) 4 LNA Especializada 0 2 0 2 LNCC Especializada 1 3 1 (analista) 5 LNLS Especializada 1 0 1 (estagirio) 2 Mast Especializada 1 1 (administrativo) 1 (arquivista) 3 Mpeg Especializada 6 4 0 10 ON Especializada 2 1 1 (analista) 4 RNP Central/ Especializada 1 (apoio do responsvel pela Biblioteca da Embrapa) 2 1 (assistente) 1 (analista) 5
246 documentos digitais. Os servios de consultoria de preservao digital que a TECH- IN oferece, esto baseados nos modelos de referncias aqui citados e engloba o trabalho de aculturizao prvia sobre o tema dos profissionais das instituies interessadas (THOMAZ, 2008). Como ser mencionado na anlise das entrevistas, algumas mudanas organizacionais das unidades de pesquisa foram decisivas para a formao de profissionais que atendessem s necessidades de preservao dos materiais digitais nos espaos de suas bibliotecas e centros de informao.
4.3 ANALISE DOS DADOS DAS ENTREVISTAS
Os objetivos especficos para a fase de pesquisa de campo propostos neste trabalho foram: OE3) identificar as necessidades de preservao digital da informao tcnico-cientfica das unidades de pesquisa do Ministrio da Cincia e Tecnologia; OE4) resgatar os conceitos e aplicaes usados nessas organizaes que caracterizam suas prticas de preservao, tendo por parmetro as condies locais que interfiram no entendimento do significado e propsito da implantao das metodologias de preservao de documentos digital. Os resultados obtidos foram a identificao das necessidades de preservao digital da informao cientfica das unidades de pesquisa do MCT, bem como conceitos usados para caracterizar suas prticas de preservao, segundo os principais envolvidos e as condies locais. A aplicao do questionrio tinha por meta estabelecer um contato inicial com os gestores dos centros de informao e bibliotecas e suas equipes. A abordagem dos dados coletados passou a ser mais qualitativa, assumindo-se que, o entendimento do significado e propsito das atividades de preservao presentes nesses institutos, seria mediado pela interpretao do pesquisador e o seu marco de referencial terico.
247 Como Richardson et al. mencionam (1999, p. 210), algumas das vantagens da tcnica da entrevista esto na postura do entrevistado, que responde com um grau maior de liberdade (diretividade da entrevista) e a expresso de respeito por parte do entrevistador manifestao da opinio do entrevistado. As narrativas histricas das memrias das fontes contatadas seguiram uma ordem cronolgica que dependeu de fatores especficos de agendamento por parte do entrevistador e dos entrevistados. As entrevistas foram gravadas em fita magntica e MP3 em encontros agendados durante eventos cientficos nacionais e em visitas s sedes das unidades de pesquisa. O primeiro roteiro de entrevista usado nos encontros com representantes das instituies, durante os trs eventos cientficos nacionais em 2004 44 , 2006 45 e 2007 46 , pretendia identificar os respondentes e avaliar o conhecimento que eles detinham sobre o tratamento tcnico dado aos arquivos digitais nas suas instituies. Tambm se registraram as opinies sobre o tipo de material que deve ser preservado, bem como foram identificados os responsveis localmente. O roteiro de entrevista com os respondentes nas sedes dos institutos passou a ser orientado segundo o perfil da pessoa contatada. Como mencionado no item 4.2.2, o questionrio apontou que os dois grupos a serem abordados nesta fase seriam os profissionais da informao (bibliotecrios, arquivistas, tcnicos) e os da computao. A aplicao do segundo roteiro de entrevista foi, portanto, dividido em duas partes dirigidas aos dois setores (biblioteca e informtica) representados pelos respectivos profissionais. Nos casos em que a pessoa contatada no era totalmente ligada s atividades de tratamento dos materiais digitais, aplicava-se o primeiro roteiro semi-estruturado. O segundo roteiro era usado apenas nos casos em que a interao se realizou com os respondentes previamente identificados. Nas respostas aos questionamentos propostos, pretendeu-se detectar novas variveis que no houvessem sido contempladas no quadro conceitual que a reviso da literatura sugeriu. Os temas e assuntos discutidos encontravam-se relacionados, em menor escala, s expectativas dos responsveis pelas colees
44 56 Reunio Anual da SBPC, 2004, Cuiab, MT. 45 XIV SNBU Seminrio Nacional de Bibliotecas Universitrias, 2006, Salvador, BA. 46 58 Reunio Anual da SBPC, 2007, Belm, PA.
248 digitais consideradas como materiais importantes para a instituio, considerando o perfil cientfico e tecnolgico. O Quadro 19 mostra o local das entrevistas com os representantes das 24 unidades de pesquisa e os tipos de entrevistas realizadas no perodo de 2004 a 2007.
Caractersticas da entrevista Unidade de pesquisa Local da entrevista Entrevistado Entrevista AEB Arquivo (Braslia, DF) Informtica (Braslia, DF) Diretoria (Braslia, DF) SBPC (Cuiab, MT) SBPC (Cuiab, MT) Tcnico Tcnico Pesquisador Tcnico Tcnico Individual Individual Individual Em grupo Em grupo CBPF SBPC (Cuiab, MT) Biblioteca (Rio de Janeiro, RJ) Biblioteca (Rio de Janeiro, RJ) Biblioteca (Rio de Janeiro, RJ) Biblioteca (Rio de Janeiro, RJ) Tcnico Bibliotecria Bibliotecria Tcnico Tcnico Individual Em grupo Em grupo Em grupo Em grupo Ceitec SBPC (Belm, PA) Pesquisador Individual CenPRA Biblioteca (Campinas, SP) Biblioteca (Campinas, SP) Biblioteca (Campinas, SP) Biblioteca (Campinas, SP) SBPC (Cuiab, MT) Bibliotecria Pesquisador Responsvel Pesquisador Pesquisador Tcnico Em grupo Em grupo Em grupo Em grupo Individual Cetem Biblioteca (Rio de Janeiro, RJ) Informtica (Rio de Janeiro, RJ) Informtica (Rio de Janeiro, RJ) SBPC (Cuiab, MT) SBPC (Cuiab, MT) Bibliotecria Responsvel Profissional de CI Tcnico Pesquisador Tcnico Individual Individual Individual Em grupo Em grupo CGEE Centro de Informao (Braslia, DF) Centro de Informao (Braslia, DF) Centro de Informao (Braslia, DF) Centro de Informao (Braslia, DF) SBPC (Cuiab, MT) Profissional de CI Tcnico Responsvel Tcnico Tcnico Tcnico Em grupo Em grupo Em grupo Em grupo Individual Cnen Biblioteca (Rio de Janeiro, RJ) Biblioteca (Rio de Janeiro, RJ) SBPC (Cuiab, MT) Bibliotecria Responsvel Pesquisador Tcnico Individual Individual Individual CNPq Biblioteca (Braslia, DF) Centro da Memria (Braslia, DF) SBPS (Cuiab, MT) Bibliotecria Responsvel Pesquisador Responsvel Tcnico Individual Individual Individual Finep Biblioteca (Rio de Janeiro, RJ) Biblioteca (Rio de Janeiro, RJ) Informtica (Rio de Janeiro) SBPC (Cuiab, MT) Bibliotecria Responsvel Bibliotecria Tcnico Tcnico Em grupo Em grupo Individual Individual Ibict Biblioteca (Braslia, DF) Informtica (Braslia, DF) SBPC (Cuiab, MT) Bibliotecria Responsvel Tcnico Tcnico Individual Individual Individual IDSM SBPC (Belm, PA) SBPC (Cuiab, MT) SBPC (Cuiab, MT) Tcnico Responsvel Tcnico Tcnico Individual Em grupo Em grupo Impa Biblioteca (Rio de Janeiro) Biblioteca (Rio de Janeiro) Biblioteca (Rio de Janeiro) SBPC (Cuiab, MT) Bibliotecria Responsvel Bibliotecria Tcnico Tcnico Individual Individual Individual Individual Inpa SBPC (Belm, PA) SBPC (Belm, MT) SBPC (Cuiab, MT) Bibliotecria Responsvel Tcnico Tcnico Em grupo Em grupo Individual Inpe SNBU (Salvador, BA) e Biblioteca (So Jos dos Campos, SP) Biblioteca (So Jos dos Campos, SP) Biblioteca (So Jos dos Campos, SP) SPBC (Cuiab, MT) Bibliotecria Responsvel
Bibliotecria Pesquisador Pesquisador Individual Em grupo Em grupo Em grupo Individual
Continua
249
Caractersticas da entrevista Unidade de pesquisa Local da entrevista Entrevistado Local da entrevista Insa SBPC (Belm, PA) SBPC (Belm, PA) Tcnico Pesquisador Individual Individual INT Biblioteca (Rio de Janeiro, RJ) Biblioteca (Rio de Janeiro, RJ) Informtica (Rio de Janeiro, RJ) SBPC (Cuiab, MT) Profissional de CI Responsvel Bibliotecria Tcnico Tcnico Individual Individual Individual Individual LNA Biblioteca (Itajub, MG) Biblioteca (Itajub, MG) Biblioteca (Itajub, MG) Biblioteca (Itajub, MG) Biblioteca (Itajub, MG) e SBPC (Cuiab, MT) Bibliotecria Tcnico Responsvel Pesquisador Pesquisador Tcnico Em grupo Individual Em grupo Em grupo Em grupo Individual LNCC Biblioteca (Petrpolis, RJ) Informtica (Petrpolis, RJ) SBPC (Cuiab, MT) Bibliotecria Responsvel Tcnico Tcnico Individual Individual Individual LNLS- ABTLuS Biblioteca (Campinas, SP) Depto. Cientfico (Campinas, SP) SBPC (Cuiab, MT) Bibliotecria Responsvel Pesquisador Tcnico Individual Individual Individual Mast Biblioteca (Rio de Janeiro, RJ) Biblioteca (Rio de Janeiro) Biblioteca (Rio de Janeiro, RJ) SBPC (Cuiab, MT) Arquivo (Rio de Janeiro, RJ) Arquivo (Rio de Janeiro, RJ) Bibliotecria Responsvel Bibliotecria Tcnico Pesquisador Tcnico Tcnico Individual Individual Individual Individual Em grupo Em grupo Mpeg Biblioteca (Belm. PA) SBPC (Cuiab, MT) SBPC (Belm, PA) Bibliotecria Responsvel Tcnico Tcnico Individual Individual Individual Nuclep Comunicao (Itagua, RJ) Comunicao (Itagua, RJ) Informtica (Itagua, RJ) Pesquisadora Tcnico Tcnico Em grupo Em grupo Individual ON Biblioteca (Rio de Janeiro, RJ) SBPC (Cuiab, MT) Bibliotecria Tcnico Individual Individual RNP Sala de Reunies (Rio de Janeiro, RJ) Sala de Reunies (Rio de Janeiro, RJ) Sala de Reunies (Rio de Janeiro) SBPC (Cuiab, MT) Profissional de CI Responsvel Tcnico Tcnico Tcnico Em grupo Em grupo Em grupo Individual Quadro 19 Listagem de entrevistados das unidades de pesquisa do MCT
Foram entrevistados 19 responsveis de 18 centros de informao e biblioteca sendo que, um instituto contava com dois responsveis, um pela biblioteca e outro pelo Centro de Memria (CNPq). Apenas dois responsveis pelas bibliotecas e centros de informao visitados no foram encontrados para a realizao das entrevistas. Uma caracterstica das 90 entrevistas realizadas que 54 delas foram individuais e 36 em grupo. Quatorze dos 19 responsveis pelos centros de informao e bibliotecas foram entrevistados individualmente, sendo que um deles foi entrevistado tambm em grupo (Inpe). Os outros cinco responsveis foram abordados em entrevistas em grupos reunidos durante os encontros cientficos e nas visitas aos locais de trabalho das 88 pessoas participantes da pesquisa.
250 O desenvolvimento das cinco entrevistas em grupo no foi definido previamente pelo pesquisador devido, a que elas aconteceram de forma espontnea por deciso dos prprios entrevistados na hora e local de abordagem. Apesar de 11 dos entrevistados de quatro das unidades de pesquisa visitada no possurem centro de informao ou biblioteca (AEB, Nuclep, Insa e Ceitec), os respondentes foram caracterizados como representantes de setores- chave das instituies procuradas, a saber: diretorias, arquivo, informtica e comunicao.
4.3.1 Perfil profissional dos entrevistados
A caracterizao dos entrevistados tem em comum o escopo das suas atividades voltado ao tratamento da informao tcnico-cientfica, embora houvesse casos em que as funes de alguns pudessem ser classificadas em um ou mais setores. Por exemplo, um pesquisador ocupar um cargo na rea de informtica e ao mesmo tempo colaborar ativamente no desenvolvimento de projetos de gerenciamento de informao (Inpa e CNEN) ou, no caso inverso, um bibliotecrio lidar com a infra-estrutura da montagem de um servidor de dados de pr-prints na instituio (Impa). Como mostrado no item sobre o universo da pesquisa (3.2), foram entrevistados 19 responsveis pelas bibliotecas e centros de informao de 20 unidades que contam com esse servio (o CNPq conta com dois responsveis, um pela biblioteca e outro pelo Centro de Memria). Estes estavam includos no grupo de 88 pessoas entrevistadas neste estudo. O Quadro 20 disponibiliza a listagem completa de profissionais e pesquisadores abordados durante a pesquisa de campo, ordenados segundo o setor onde atuam.
251 Unidade de pesquisa Setor do instituto Profisso/funo AEB Arquivo Informtica Comunicao Comunicao Diretoria Tcnico Tcnico de informtica Tcnico Tcnico Pesquisador CBPF Biblioteca Biblioteca Informtica Informtica Comunicao Bibliotecria Bibliotecria Tcnico de informtica Tcnico de informtica Tcnico Ceitec Comunicao Pesquisador CenPRA Biblioteca Biblioteca Pesquisa Pesquisa Comunicao Bibliotecria Pesquisador Pesquisador Tcnico Tcnico Cetem Biblioteca Informtica Informtica Comunicao Comunicao Bibliotecria Cientista da Informao Tcnico de informtica Pesquisador Tcnico CGEE Centro de Informao Centro de Informao Centro de Informao Informtica Comunicao Cientista da informao Tcnico de informao Tcnico de informao Tcnico de informtica Tcnico Cnen Biblioteca Informtica Comunicao Bibliotecria Pesquisador Tcnico CNPq Biblioteca Centro da Memria Comunicao Bibliotecria Pesquisador Tcnico Finep Biblioteca Biblioteca Informtica Comunicao Bibliotecria Bibliotecria Tcnico de informtica Tcnico Ibict
Biblioteca Informtica Comunicao Bibliotecria Tcnico de informtica Tcnico IDSM Servio de Informao Comunicao Comunicao Tcnico de informao Tcnico Tcnico Impa Biblioteca Biblioteca Informtica Comunicao Bibliotecria Bibliotecria Tcnico de informtica Tcnico Inpa Biblioteca Comunicao Comunicao Bibliotecria Tcnico Tcnico Inpe Biblioteca Biblioteca Pesquisa Comunicao Bibliotecria Cientista da Informao Pesquisador Pesquisador Insa Comunicao Diretoria Tcnico Pesquisador INT Biblioteca Biblioteca Informtica Comunicao Bibliotecria Bibliotecria Tcnico de informtica Tcnico LNA Biblioteca Biblioteca Informtica Pesquisa Comunicao Bibliotecria Tcnico de informao Pesquisador Pesquisador Tcnico LNCC Biblioteca Informtica Comunicao Bibliotecria Tcnico de informtica Tcnico
Continua
252
Unidade de pesquisa Setor do instituto Profisso/funo LNLS- ABTLuS Biblioteca Depto. Cientfico Comunicao Bibliotecria Pesquisador Tcnico
Mast Biblioteca Biblioteca Informtica Comunicao Arquivo Arquivo Bibliotecria Bibliotecria Tcnico de informtica Pesquisador Tcnico Tcnico Mpeg Biblioteca Editorao Comunicao Bibliotecria Tcnico Tcnico Nuclep Comunicao Comunicao Informtica Pesquisadora Tcnico Tcnico ON Biblioteca/DID Comunicao Bibliotecria Tcnico RNP Biblioteca/DGI Informtica Informtica Comunicao Cientista da Informao Tcnico de informtica Tcnico de informtica Tcnico Quadro 20 Entrevistados por setor das unidades de pesquisa do MCT
No decorrer das entrevistas tornou-se evidente que os respondentes trabalhavam em setores diferentes do mesmo instituto e em projetos relacionados com o tratamento da informao cientfica. Alm dos setores de biblioteca e arquivo, que seriam os lugares indicados para os trabalhos de preservao digital, os respondentes eram oriundos dos setores de informtica, comunicao, editorao, pesquisa relacionada temtica da instituio e diretorias. A variedade de locais de trabalho dos participantes mostra que a tcnica usada para obter informao procurou se beneficiar dos anos de experincia dos profissionais e conseguir, dessa maneira, uma perspectiva mais ampla do que a dos responsveis pelos acervos digitais. Um grupo de pessoas que no haviam sido identificadas por meio do questionrio foi o formado por 14 pesquisadores. Tratava-se de pessoas que tinham desenvolvido ou realizavam projetos relacionados com o setor de biblioteca da instituio chegando, em alguns casos, a serem responsveis pelo centro de informao (CenPRA e CNPq). Os demais mantinham participao nos setores de informtica, comunicao e pesquisa. Eles contriburam com muitas informaes contextuais, mas para este estudo foram utilizadas apenas aquelas ligadas ao tema da preservao digital. Os dados coletados e as opinies dos entrevistados permitiram estabelecer um tipo de padro no quesito necessidade de prticas de preservao
253 digital, que no havia sido detectado nos questionrios, e a definio de novos nveis de aprofundamento que pudessem ser alcanados por meio da observao e da anlise etnogrfica de contedo.
4.3.2 Anlise dos contedos das entrevistas
A metodologia de anlise do contedo das entrevistas levou em considerao a necessidade de organizar os respondentes em grupos para que, dessa forma, fosse detectado o eixo comum nas respostas dadas aos questionamentos. No Quadro 21 esto apresentados os respondentes, segundo a funo e a instituio de origem.
Quadro 21 - Funo dos entrevistados nas unidades de pesquisa
As respostas dos 88 entrevistados foram agrupados em cinco categorias de respondentes definidas, segundo a esfera de ao profissional de origem, a saber: Funo Unidade de Pesquisa Total Arquivista Mast, AEB 3 Bibliotecrio Impa, Inpe, CBPF, Mast, ON, CenPRA, Finep, LNA, INT 10 Bibliotecrio responsvel Ibict, Impa, Mpeg, Inpe, Cnen, LNCC, LNLS, Mast, Finep, CNPq, Cetem, Inpa 12 Pesquisador Inpe, Cnen, LNLS, Mast, CenPRA, LNA, Cetem, AEB, Nuclep, Insa, Ceitec 14 Pesquisador responsvel CenPRA, CNPq 2 Profissional de CI Cetm, CGEE 2 Profissional de CI responsvel RNP, INT 2 Tcnico Ibict, Impa, Mpeg, CBPF, Cnen, LNCC, LNLS, ON, CenPRA, Finep, CNPq, LNA, RNP, Cetem, INT, Inpa, CGEE, IDSM, AEB, Nuclep, Insa 24 Tcnico de biblioteca Impa, Mast, CGEE 3 Tcnico de informtica Ibict, CBPF, LNCC, Mast, Finep, RNP, Cetem, INT, CGEE, AEB, Nuclep 13 Tcnico responsvel LNA, CGEE, IDSM 3
254 1. grupo 1: formado por bibliotecrios responsveis pelas bibliotecas, bibliotecrios auxiliares, profissionais da cincia da informao e tcnicos de biblioteca (total = 28 pessoas); 2. grupo 2: integrado por tcnicos responsveis pelas bibliotecas e tcnicos em geral de diferentes reas (total = 27 pessoas); 3. grupo 3: formado por pesquisadores de vrias reas do conhecimento responsveis por bibliotecas e pesquisadores em geral (total = 17 pessoas); 4. grupo 4: com tcnicos de informtica (total = 13 pessoas); 5. grupo 5: formado por 3 arquivistas.
Constatou-se que a maioria dos respondentes do grupo 2, que tinham funes e cargos de tcnicos, foram os que evidenciaram maior participao nas entrevistas em eventos cientficos. Os dois tcnicos responsveis (CGEE e LNA) e os membros dos outros quatro grupos foram abordados principalmente nas entrevistas nas sedes das instituies. As respostas das entrevistas em grupo foram transcritas, e as manifestaes de cada um dos respondentes separadas de acordo com essa tipologia.
4.3.2.1 Sobre as prprias funes e atividades de preservao
Na cronologia das entrevistas foi possvel constatar que os contatos com os grupos ficaram muito dirigidos s caractersticas locais, e que os representantes desses grupos de entrevistados no tiveram dificuldade em mencionar algumas das suas preocupaes com relao ao material cientfico que deveria ser preservado e sobre as necessidades da existncia de projetos de preservao digital. - Os projetos do instituto tm muita documentao que no est registrada. So informaes que so importantes para a histria da instituio. Ns estamos preocupados no com o nmero, mas na preservao da memria. Os editais agora mencionam a preservao da memria, tem projetos no CNPq, no Mast e no INT, mas voc tem que ter profissionais com essa viso da necessidade. No Mast esto preocupados no apenas em preservar, mas em ensinar s pessoas sobre a preservao. (Bibliotecria responsvel 1)
255 - No temos atividade de preservao. A gente at ficou preocupada. Ns atuamos em uma rea em que tnhamos um grande especialista, mas essa pessoa faleceu e muitas coisas ficaram com ele, as informaes no foram repassadas. Hoje a preocupao existe em termos no de guardar, mas que exista um processo de continuidade do conhecimento, de a gente repassar o que produziu. (Pesquisador geral 2)
- No temos essa discusso de preservao de longo prazo. Essa competncia foi distribuda para cada secretaria de coordenao; o pesquisador pertence a essa secretaria, isso repassado para as bibliotecas da rea e nossa inteno que estejam disponibilizados eletronicamente outros trabalhos dos pesquisadores, por isso uma comisso foi constituda para ter mnimas regras dessa distribuio, uma comisso de pesquisadores. Se cada instituio tiver uma definio de como vai trabalhar com isso, ela vai ter as coisas mais arrumadas. (Tcnico geral 12)
- No necessrio fazer nenhuma atividade de preservao do material cientfico publicado por que ele pertence a grandes bancos internacionais e no precisamos mant-lo. A nica preocupao que eu tenho de manter o registro da apario do Laboratrio na mdia, a parte da pesquisa no necessria. Mas ns temos tudo muito bem catalogado, porque quando um astrnomo pede tempo de uso de telescpio, ns fazemos uma triagem de como tem sido o aproveitamento desse tempo, e se ele est publicando com esses dados ou no. A biblioteca faz essa triagem e as comisses de pedido de tempo tm uma secretaria que concentra num banco de dados todo o uso de todos os pesquisadores envolvidos em projetos. Temos outro banco de dados de manuais tcnicos preservado na nossa instituio. (Pesquisador geral 3)
- De 2000 para c j est tudo digitalizado, as teses e os artigos, os trabalhos apresentados em colquios so entregues em formato digital. A poltica foi de que, a partir de 2000, tudo tem de estar em formato digital. O que for antes disso, decidiu-se que no ia se fazer nada, apenas guardar em papel. Porque achou-se que no valia a pena. No existe nenhum projeto de preservao, at houve oramento numa poca, feito para uma empresa que estava interessada em fazer. Mas eles no se interessaram, acharam que as coisas com mais qualidade acabam sendo publicadas em revistas e que so preservadas de alguma forma. (Tcnico geral 13)
- Aqui no Centro estamos caminhando para todo mundo ter os mesmos formatos e catlogo entre as unidades vinculadas. Mas aqui no temos nenhuma coleo da biblioteca que esteja digitalizada, tudo est em papel. O projeto Memria est comeando, tudo o que foi escrito pelos pesquisadores daqui e os que os estrangeiros que escreveram sobre o Centro. O portal que vai ser lanado neste ano vai ter um link para a produo cientfica, com o que seria uma base de dados com referncias aos trabalhos desses autores. (Bibliotecria responsvel 3)
- Em termos de preservao das colees eletrnicas nunca pensei nisso, ningum nunca me cobrou nada a esse respeito. (Tcnico geral 12)
A percepo e a confirmao de que o lugar das atividades de preservao seria na biblioteca estiveram presentes nas falas, mesmo naquelas em que esse setor no existia. - O responsvel pela preservao dos relatrios dos projetos o Setor de Documentao. (Tcnico geral 2)
256 - A responsvel pela preservao a biblioteca. (Tcnico geral 4)
- A responsvel pela guarda da produo a Diretoria Tcnico Cientfica. (Tcnico geral 5)
- A responsvel pela preservao da produo cientfica a Biblioteca. Cada ano temos um ciclo de cursos e palestras. (Tcnico geral 11)
- Eu acho que tudo que ns fazemos deve ser preservado, a memria tcnica muito importante. As coisas mais antigas ainda esto em papel, isso deveria ser tratado e disponibilizado, se bem que algumas coisas no deveriam ser disponilizadas porque so projetos terceirizados. Mas importante que eles sejam preservados pela biblioteca porque at dentro do prprio desenvolvimento do centro isso no pode ser disponibilizado em congressos, mas elas podem estar disponveis para outros pesquisadores que querem utilizar essas informaes para determinado estudo. (Pesquisador geral 2)
Como outras pesquisas internacionais mostraram (WHEATLEY; BEAGRIE; BRADLEY, 2004), as organizaes no garantem recursos especficos para a preservao digital, sendo isso considerado uma das maiores ameaas permanncia dos documentos digitais. Os comentrios sobre a realidade das bibliotecas e centros de informao apontaram as condies do servio pblico como obstculo para a continuidade dos trabalhos de preservao. Isso ficou evidente nas observaes de 80% dos entrevistados. - No existe um compromisso de guardar informaes. Principalmente hoje, com esse nvel de xodo que est atingindo o servio pblico, no se consegue repor o pessoal para ter o controle melhor das coisas. Cada ano que passa parece que mais pessoas tm de fazer o papel de vrias pessoas ao mesmo tempo. Isso prejudica o trabalho, a qualidade do trabalho e o nvel da informao que est sendo preservada. (Tcnico geral 3)
- No Museu temos 30 anos de acervo do CNPq, ns disponibilizamos, criamos um livro e um CD-ROM, pessoas que querem saber a histria do CNPq consultam l. Mas somos poucas pessoas para processar tanta informao. (Tcnico de biblioteca 1)
- A biblioteca foi desativada faz tempo, mais ou menos seis anos, ela est sendo reativada aos poucos, mas perdeu-se muita coisa dentro dessa paralisao no referente renovao de publicaes, por exemplo. (Tcnico geral 3)
- Ns no temos biblioteca, quem cuida das informaes a rea da comunicao social, quem guarda cada diretoria, a guarda no centralizada. Tudo est em formato digital. Dentro da rea da administrao temos uma pessoa que responsvel por guardar todas as informaes em papel. (Tcnico geral 10)
- No Centro cada grupo de pesquisa tenta conseguir financiamento, e eles so responsveis pela preservao dos equipamentos e pela documentao desses projetos. (Tcnico geral 8)
257 As atitudes dos entrevistados com relao a essas barreiras apresentam uma noo geral de que a informao produzida nessas unidades deveria ser acessada, tambm identificaram os desafios de trabalhar em colaborao com outras unidades e centros internacionais de pesquisa. - O que importa que de fato h uma preocupao em atender de maneira rpida qualquer pedido de artigo cientfico de uma pesquisa que tenha sido realizada no Laboratrio. (Tcnico geral 4)
- A poltica do Instituto sempre foi de divulgao de seus resultados. Recebemos 12 mil pessoas anualmente. (Bibliotecrio responsvel 1)
- O projeto da Memria da Cincia do CNPq foi do vice-presidente do CNPq, que na poca esteve no Museu antes de montar esse projeto. Ele esteve conversando com os pesquisadores, pediu textos, e com essas idas ao Museu e textos ele fortificou a idia para desenvolve-la no CNPq. Se esse trabalho hoje existe, a base dele foi toda pega no Museu de Astronomia. (Tcnico de biblioteca 1)
- Ns interagimos com pesquisadores, eles entram no nosso site e encontram informaes que j temos armazenadas em fita. Quando existir o observatrio Virtual Brasileiro, que vai estar conectado ao Observatrio Virtual Mundial, a sim vai haver instituies colaborando, mas ser um trabalho gigantesco porque vai exigir que padronizemos dados com outros pases. (Bibliotecria auxiliar 1)
- Todos os memorandos tcnicos, alm de estarem no formato em papel e digital, backups esto disponveis em outras instituies. Toda a produo tcnico-cientfica est em linha; os cientistas deixam sua produo depositada na biblioteca. (Tcnico geral 4)
- A biblioteca est sendo informatizada para digitalizar o acervo de teses; ainda no temos isso, no temos oramento, nem gente suficiente. O Observatrio sedia e coordena um banco de dados ambientais para a indstria, em um projeto que envolve outras instituies de ensino e pesquisa. (Tcnico geral 11)
Em entrevistas com pesquisadores e tcnicos participantes de projetos de preservao digital, fica evidente a dificuldade encontrada por eles, pelo fato de ser uma iniciativa que comeou por interesse pessoal. - Em 1995, um pesquisador localizou um software para montar um simpsio e descobriu que ele podia ser usado para uma biblioteca digital. Migramos todos os registros que estavam no Microisis com toda a coleo dos anos 1960 a 2006, com 12.400 registros; 6 mil eram texto completo. Alguns foram digitalizados a partir de 2000. Com a obrigatoriedade de depositar a tese na Biblioteca Digital, j temos 583 teses. Agora a Biblioteca Digital, alm de ser um repositrio que guarda a memria cientfica, serve para o planejamento de gesto do instituto. Temos tudo digitalizado de cada rea do Programa Espacial. E agora estamos entrando na gesto dos arquivos. (Bibliotecria responsvel 1)
- Todo o meu tempo, como voc pode imaginar, foi absorvido para a montagem desse software; agora talvez, com muita coisa finalizando, eu vou ter mais tempo para fechar uma espcie de pacote; ele j esta disponvel na web desde o incio, o problema personaliza-lo para isso que
258 voc precisa. A pessoa precisa ter conhecimento do sistema operacional, se vai instalar em Linux, porque em Linux existem problemas de permisses, e isso delicado. Depois o software foi desenvolvido em linguagem TCL, o prprio banco de dados eu fiz no TCL uma linguagem muito simples e limpa, comparada com PERL ou PHP, ela muito enxuta e rpida, mesmo sendo uma linguagem interpretada que normalmente mais lenta. Eu no esperava que fosse funcionar, quando comecei a usar TCL, eu no tinha idia do potencial, mas at hoje est sendo bem til. (Pesquisador geral 1)
- No Instituto temos outros profissionais que trabalham com preservao digital. Tem o professor Bergamini, que trabalhou com a professora Katia Thomaz sobre a norma OAIS. Esse trabalho foi o apndice da traduo da norma ISO. O professor Banon fez a reviso que faz parte do apndice. (Bibliotecria responsvel1)
- O Laboratrio comeou para valer a fazer cincia em julho de 1997, quando o equipamento entrou em operao. As reas que vieram depois so muito recentes, tem a biologia molecular estrutural e as nanocincias, todas muito novas e com pouco acervo. (Tcnico geral 4)
- A rea muito especfica, a biblioteca no tem uma demanda muito grande do pblico externo, quem procura so poucas pessoas e as bibliotecrias do conta de fazer esse servio. Fazem o controle interno da memria tcnica quanto aos pedidos dos pesquisadores. Elas so responsveis pela divulgao da produo cientfica (Tcnico geral 6)
- Eu acho que uma das coisas mais difceis de voc determinar, igual em uma casa, o que que voc vai guardar, o que prioritrio. Como so produes de indivduos, a minha produo sempre vai ser mais importante para mim, para te dizer a verdade. uma coisa humana. (Tcnico geral 12)
4.3.2.2 Sobre o tratamento dos objetos digitais na instituio
Os entrevistados informaram os formatos dos arquivos que os pesquisadores usam mais frequentemente na produo dos documentos digitais, os quais seriam: PDF, HTML, Word, PPS, LATEX, JPG, GIF. As referncias a algum tipo de tratamento desses objetos digitais evidenciaram sugestes de solues tecnolgicas prprias, sendo que a maioria delas no considera a necessidade de concordncia com os modelos de preservao digital OAIS e TDR. - Os documentos esto em um banco de dados administrado por uma equipe de pesquisadores e coordenadores. A Diretoria Tcnico-Cientfica a encarregada desse arquivamento da produo para ser publicada tambm. Ela tem diversas linhas de pesquisa e cada programa de pesquisa tem seu arquivo. Tudo est em formato digital, impresso e em arquivos em CD e disquete. (Tcnico geral 5)
- Toda a documentao que se produz na rea de engenharia armazenada em um sistema nosso de documentao. Na rea da segurana tambm acontece, um trabalho operacional e de rotina
259 documentado e armazenado no nosso sistema interno. A gente quer resgatar algumas informaes da histria da Rede e publicar, porque para ns isso faz muita falta, e os prprios usurios desconhecem o contedo do sistema. (Tcnico geral 7)
- Na biblioteca do Centro ns temos um sistema que a memria tcnica desenvolvido por um analista que esteve aqui como bolsista, e todos nossos relatrios tcnicos, depois de digitalizados, passam pela biblioteca . O pesquisador entrega em formato Word e a secretria da coordenao transforma em formato PDF e chega para a biblioteca para padronizao. A memria tcnica comeou em 2002, mas est apenas na intranet. Os dados referenciais desde 1978 foram migrados, mas o texto completo ainda no. Tnhamos um projeto de digitalizao, mas nunca chegou verba para isso. (Bibliotecria responsvel 2)
- Antes tudo era em papel. Agora a maior parte da produo cientfica est em formato digital. O Instituto tem uma biblioteca digital com registros desde 1984, onde temos todas as publicaes editadas pelo Instituto. Temos um arquivo dos dados desde que o Instituto foi criado. Ele nasceu como um repositrio, um servio de divulgao. No final dos anos 1980, usamos o Microisis da Bireme para melhorar aquela base, nela a produo cientfica passou a ter resumo e referncias. Nessa mesma poca passamos a trabalhar toda a produo retrospectiva. Desde 2001, temos uma tabela que todo documento depositado precisa seguir; ele vai pela rea, pelo grupo e pelo tipo. Assim, o que vai aparecer para o usurio o artigo e a apresentao do material audiovisual, caso seja um trabalho em evento. (Bibliotecria responsvel 1)
Como destacado na reviso da literatura, as abordagens tecnolgicas de preservao esto direcionadas ao acesso permanente (THIBODEU, 2002). No Brasil, o Inpe se destaca pelo nmero de solues propostas para a preservao digital implementada, tanto por tipo de material como pelo tipo de mecanismo que garante o acesso permanente aos documentos. - Quando quis integrar o trabalho dos grupos de pesquisa, eu imaginei o identificador e a partir da constru a biblioteca digital, se no tivesse esse identificador no teria essa biblioteca. Primeiro usamos o e-mail como identificador, mas agora passou a ser usado o nome do computador. A diferena com o DOI e com o Handle que voc no depende de acordo com ningum. Voc pode identificar seus identificadores e no existe conflito. Qualquer um pode usar o identificador persistente, apenas deve seguir uma regra muito simples, basta seguir o nome do domnio, nome da mquina, e-mail da pessoa ou domnio do computador. Com isso voc cria uma identidade para cada trabalho depositado. O sistema permite a estruturao dos acervos. Podem ser reagrupados dois acervos. Voc pode encapsular, por exemplo, teses com dissertaes. Com os identificadores, pode-se achar o documento que foi encapsulado. (Pesquisador geral 1)
- A Biblioteca Digital est guardada hoje em 12 computadores; compramos um servidor Sun em 1998, com oramento da Fapesp, e a partir da decidimos centralizar os servidores que tem cada um dos servios da BD, sendo criada a subdiviso dos servios. No temos espelhamento, propomos isso ao MCT desde 2004, mas no houve resposta. Temos uma mquina de segurana que o Grupo de Segurana do Inpe teve a preocupao de criar. (Bibliotecria responsvel 1)
260 - Tambm temos o acervo de pre-prints, que uma tendncia interessante; estamos fazendo o trabalho e ele fica preservado. Se o autor decide o que vai fazer com ele, primeiro deposita uma cpia pr-print, e ela vai ser preservada quando ele for publicado. (Bibliotecria responsvel 1)
- As fotografias esto em parte digitalizadas, a histria oral est guardada em DVD e estamos com um estudo pronto para a produo multimdia. (Bibliotecria responsvel 1)
Para evitar que as informaes sejam corrompidas, as tcnicas de preservao devem iniciar no momento da criao do objeto digital (HODGE, 2000). Nas unidades de pesquisa, a sistematizao dos processos de tratamento dos arquivos digitais comea a ser aplicado, ainda que a maioria contemple apenas a parte que concerne ao depsito de documentos. - Toda a produo est em formato digital. (Tcnico geral 1)
- Em termos de publicaes, a nica coisa que fizemos a partir de certo momento comear a digitalizar tudo o que podia. (Pesquisador geral 2)
- A gente no recebe nada em papel tudo vem atravs de formulrio eletrnico desde 2002. Temos n procedimentos s via formulrio na pgina eletrnica. No aceitamos que ningum entregue disquete ou pelo correio. Pelo menos j evolumos bastante, os pesquisadores do laboratrio j fazem tudo no formato Latex especfico para essa rea, o que sistematizou bem o depsito dos trabalhos. (Tcnico geral 4)
- Todas as sries esto em formato digital e os livros esto sendo escaneados e convertidos para PDF e disponibilizados nas pginas do Centro. Os relatrios esto sendo armazenados em disquete, em CD. (Tcnico geral 6)
- No CNPq no se trabalha mais com papel, todas as informaes de resultados de pesquisa ficam armazenadas em formato eletrnico. (Tcnico geral 9)
Constatou-se, tambm, a noo geral existente entre os tcnicos de informtica, de que a preservao digital seria apenas alguma coisa relacionada com a manuteno de cpias de segurana. - O Servio de Documentao e Arquivo recebe e a Informtica faz uma cpia de segurana. Os responsveis pela preservao seriam as reas tcnicas, mas futuramente passar para a Informtica. (Tcnico informtica 9)
- Os backups so feitos basicamente em fitas, e elas so fisicamente guardadas em outro local no perto do servidor. Vai ter um prdio para fazer isso, temos uma outra mquina que faz um backup on-line e est em outro bloco do instituto. (Tcnico informtica 1)
- Para preservao temos duas mquinas, uma na biblioteca, outra fora do prdio, na rea de segurana de TI. Trs vezes por semana so feitas as atualizaes (backup) que ficam em outro prdio. (Tcnico informtica 10)
261 - Quem cuida do banco de dados tem a obrigao de efetuar todo o procedimento de segurana e migrar para outro banco de dados. O servidor j faz automaticamente duas vezes por dia, e uma por ms, e ns, em cima disso, fazemos periodicamente, colocando em outras mquinas. Deveria ser em outro prdio, mas hoje fica tudo na nossa diviso. Estamos fazendo cpias em CD e em DVDs. (Tcnico informtica 11)
A necessidade de sistematizar os processos que envolveriam a preservao da informao cientfica nas unidades foi percebida em poucos implementadores dos sistemas de gerenciamento de informao entrevistados. Tambm, alguns profissionais da informao esto preocupados com o uso extensivo de tecnologias e com seu registro em solues cada vez mais complexas. No Inpe, a concepo desses sistemas esteve influenciada pela percepo de repositrios que seguem o modelo OAIS, segundo os principais participantes dos projetos. - Nossa biblioteca Digital pode ser exportada por meio do protocolo OAI. Isso completaria toda a parte de gerenciamento de uma biblioteca digital, a segurana, a identificao persistente e a interoperabilidade. Quando eu tomei conhecimento, primeiro foi um empurro do Ibict, recebemos um carta do Ibict para ver se a gente poderia importar os dados, a eu fui ver o site do OAI e l estava bem explicado. A gente conseguiu implementar isso em um ms. Desde 2003, fomos dos primeiros a integrar a Biblioteca Digital de Teses e Dissertaes (BDTD). O contedo da BD poderia ser coletado tambm pelo coletador de repositrios OASIS.BR do Ibict. (Pesquisador geral 1)
- A gente ainda est em busca do modelo ideal de sistematizao de informao da produo cientfica e de como indexar essa informao, porque os prprios pesquisadores s vezes adotam modelos americanos, europeus. (Tcnico geral 4)
- O software do Inpe tem muito a ver com o modelo OAIS. Eu observei que o OAIS tinha muito conceito que j existia na nossa estrutura de biblioteca digital, e estamos reutilizando essa metodologia. Nosso sistema parte do OAIS. O OAIS muito sofisticado. (Pesquisador geral 1)
Como foi mostrado na reviso da literatura (LAVOIE; DEMPSEY, 2004), os sistemas de preservao digital estariam divididos em nveis, sendo que um deles incluiria os servios relacionados com permisses de acesso, disseminao e tudo que fosse ligado s polticas. Nas unidades de pesquisa do MCT, a necessidade de polticas relacionadas com a preservao dos documentos digitais foi percebida apenas no Inpe. - A parte da submisso foi criada com polticas de prazos a cumprir, pois temos prazos para responder a perguntas estratgicas; mas a busca da produo no uma coisa simples. Embora tenhamos essa poltica a cultura no se estabelece, voc tem que ir no corpo a corpo com o pesquisador e sempre tem que estar perguntando ou checando o Web of Science. A poltica no garantia de que o cientista vai depositar seu documento. Estamos criando um servio personalizado no site onde est
262 uma planilha usada na biblioteca digital para ele fazer o depsito l. Ns estabelecemos os campos das informaes daquilo que no tirar o tempo do pesquisador, depois a biblioteca completa as informaes que faltam. (Bibliotecria responsvel 1)
- O Inpe sempre teve polticas de editorao e de preservao, com normas tcnicas para publicao e depsito. Ns (Inpe) temos uma poltica de preservao, sempre existiu, mas ela depende do Conselho de Editorao. A nova verso que est sendo aprovada menciona trs coisas: a biblioteca digital, o manual de editorao e a obrigatoriedade de depsito para os autores. Essa obrigatoriedade j existia, mas no era explicita. (Pesquisador geral 1)
Nas instituies pesquisadas, alm de poucas contarem com pessoal especializado no tratamento de arquivos digitais, foi detectada a ausncia de um consenso claro sobre quais seriam as estratgias e os mtodos de preservao digital a serem aplicados; esses fatores aparecem como barreiras para a efetivao de aes concretas dentro do Ministrio. As explicaes para o desenvolvimento lento de projetos de preservao digital, na rea do gerenciamento da informao cientfica em agncias governamentais no Brasil, estariam associadas falta de uma aplicao direta de polticas e tecnologias que sigam padres internacionais e da formao de recursos humanos. Finalmente, por meio das entrevistas foi possvel confirmar a existncia da iniciativa individual e pioneira do Inpe, mesmo com a insuficincia de recursos e o planejamento fragmentado de atividades de preservao digital dirigidas pelo seu Servio de Informao e Documentao.
4.4 ANLISE ETNOGRFICA DE CONTEDO
O acompanhamento das diversas etapas administrativas e tcnicas que envolvem o gerenciamento dos registros digitais permitiu observar as condies sociais da sua produo e sua comparao com os projetos de preservao digital propostos na literatura. Tal anlise pode ser efetuada no mbito da cincia da informao usando uma tcnica de outra rea, como mais uma evidncia da sua convergncia com outras disciplinas e atividades.
263 Dentre as cincias sociais, a antropologia aquela que tem oferecido mais exemplos de como a impreciso permeia todas as formas de avaliao da realidade (GEERTZ, 1988). O levantamento mais perfeito, o mais rigoroso teste estatstico depende do significado que as palavras, categorias e at nmeros transmitem. A pesquisa etnogrfica uma das tcnicas de anlise qualitativa mais aproveitada por diversas reas do conhecimento na busca por interpretaes cientficas da realidade (CULYBA; HEIMER; PETTY, 2004). A tcnica Anlise Etnogrfica de Contedo (AEC) foi concebida na rea de cincias da comunicao, como abordagem para o estudo da origem e uso de conceitos formulados nas mdias. Na rea de jornalismo, as pesquisas que aplicaram a tcnica assumiram como propsito a formulao de conceitos em notcias sobre eventos transmitidos nas mdias como jornais. Os documentos ou materiais divulgados so definidos como representaes simblicas de informaes ligadas a situaes complexas. Por ser um tipo de Anlise Qualitativa de Documentos (AQD), a AEC envolve exemplos tericos e emergentes de documentos de bases de informao, desenvolvimento de protocolos para anlise sistemtica e constantes comparaes. Diferentemente da anlise de contedo tradicional, a AEC interage com as informaes sem ficar restrita a amostras. A pesquisa qualitativa de anlise etnogrfica de contedo usa mtodos de investigao indutivo e dedutivo (ALTHEIDE, 1987), combina a observao com outros mtodos para triangulao dos dados, para garantir a completa e acurada descrio de relaes e interaes que ocorrem entre membros de um grupo (EWING et al., 2003). Entre as vantagens dessa tcnica, citam-se as seguintes: a) observaes no precisam ser estruturadas ao redor de uma hiptese; b) em termos de validade, junto com a observao, ela pode servir para coletar informao profunda sobre determinado tema ou comportamento; c) preocupa-se com uma realidade que no pode ser quantificada, buscando a compreenso e no a explicao. A anlise etnogrfica de contedo, definida como [...] the reflexive analysis of documents [...] (PLUMMER, 1983), faz parte do grupo de modalidades de pesquisa qualitativa que surgiu na segunda metade do sculo XX, junto com a
264 observao participante e a grounded theory (DENZIN; LINCOLN, 2000). Nessas duas tcnicas, o pesquisador quer chegar o mais perto possvel do seu objeto, no intuito de abrir nova perspectiva dentro da situao observada (GLASER, 1978). Por tratar o processo de amostragem como uma comparao constante, cujas descobertas so usadas para delinear categorias especficas e narrativas descritivas, a anlise etnogrfica de contedo est enquadrada no campo da pesquisa etnogrfica. Nessa abordagem, os dados coletados seguindo alguma forma de protocolo estruturado podem trazer tona questes cruciais e temas no- aparentes em uma primeira aproximao, permitindo o retorno aos dados quando novas perguntas vo surgindo. Tambm, segundo Altheide (1987), a anlise etnogrfica de contedo pode ser contrastada com a anlise de contedo, no sentido de esta partir de pressuposies positivistas de objetividade e da amostragem esttica dos dados. Seguindo a proposta deste trabalho e um dos seus objetivos especficos que o de resgatar os conceitos e aplicaes usadas para caracterizar as prticas de preservao digital (Objetivo especfico 4), utilizou-se a tcnica de anlise etnogrfica de contedo para examinar as percepes dos envolvidos e, dessa forma, descobrir temas decorrentes, padres emergentes e processos enfatizados e adotados. Tanto na anlise bibliomtrica como na pesquisa de campo, os documentos publicados por pesquisadores de trs unidades de pesquisa do MCT foram englobados, considerando seus trabalhos como contribuies na formulao de definies e recomendaes gerais, para os interessados no tema de preservao digital. Cabe destacar que, apenas os trabalhos de uma dessas unidades partiram da aplicao prtica de projetos de preservao digital.
4.4.1 Observaes de campo
Tericos como Selltiz et al. (1975, p. 70) recomendam, como tcnicas de coleta de dados apropriadas a estudos exploratrios, o exame de registros de conhecimentos existentes, a entrevista no estruturada e a observao. Para fins
265 desta pesquisa e partindo de uma abordagem essencialmente qualitativa, cada objetivo especfico deste estudo precisou de mtodos e tcnicas adequadas. O objetivo da observao das prticas de preservao digital implementadas nessas instituies de pesquisa pblicas brasileiras era coletar dados complementares sobre as percepes e aes relacionadas s necessidades de preservao digital e comparar os resultados com os obtidos em outros estudos citados na bibliografia. A pesquisa de campo, que consiste na observao atenta de um objeto (ou fenmeno) de interesse do pesquisador, envolve tcnicas de coleta e apresentao de dados e discusses qualitativas dos resultados. A pesquisa de campo nas sedes dos centros de informao confirmou e incrementou os dados recebidos nos questionrios enviados via correio eletrnico. Foram coletadas fotografias, cpias de textos impressos sobre as instituies e depoimentos gravados. As observaes nos locais visitados foram registradas em forma de notas e dirios. Durante as visitas s 20 sedes das unidades de pesquisa do MCT, tornou- se possvel observar, por curto perodo de tempo, os responsveis pelos centros de informao e suas equipes, em grupo e individualmente, procurando obter maior quantidade de dados, apoiando-se no interesse dos entrevistados pelo tema da pesquisa. As visitas permitiram uma forma de interao com a maioria das pessoas identificadas, sendo que todas elas foram agendadas e os respondentes avisados sobre o teor das visitas. Os encontros com os entrevistados se deram nas instalaes das bibliotecas e centros de informao, nas salas dos pesquisadores e de reunies. A maioria dos responsveis pelos centros entrevistados mostrou as instalaes e apresentou suas equipes. Na maioria dos casos, foi possvel visitar os setores de arquivo, informtica e as diretorias. Nos setores de arquivo visitados constatou-se, tambm, no haver nenhuma atividade de preservao digital expressa por parte das equipes abordadas. Nos setores de informtica foi possvel observar o local de armazenamento dos arquivos digitais, algumas das rotinas de cpias de segurana e uso de bases de dados. De maneira geral foi percebida: a ausncia da aplicao de um plano estratgico de preservao digital; o uso mnimo de padres
266 internacionais de interoperabilidade e inexistncia de mecanismos que garantissem a inalterabilidade dos registros digitais. Nas unidades de pesquisa, as atividades relacionadas com a migrao de formatos e com as cpias de segurana foram as mais apontadas pelos analistas de sistemas e de suporte tcnico. Com exceo de uma unidade, nenhuma havia adotado alguma soluo tecnolgica especificamente voltada preservao dos documentos digitais. As prticas de migrao para as novas verses de software que foram mencionados refletiram a dependncia nas solues proprietrias. Nos casos em que houve adoo de software livre e que existia preocupao na aquisio de algum grau de interoperabilidade entre os sistemas, os responsveis pelos centros manifestaram seu interesse em que essas solues pudessem chegar a ser usadas na aplicao de estratgias de preservao de longo prazo da informao cientfica (Protocolo OAI, LOCKSS, DSpace, SEER). Registraram-se algumas contribuies por parte de grupo tcnico e de representantes das diretorias, ainda que no lidassem diretamente com a preservao dos documentos digitais. Elas mostraram outras vises do problema relacionadas conservao de bens culturais ou de aparelhos tecnolgicos usados e solues encontradas para o acompanhamento gerencial de projetos, a saber: - Todos os projetos e relatrios que passam pelo crivo da Fundao deveriam ser preservados (Tcnico geral 2).
- Os trabalhos dos pesquisadores devem ser preservados. Eu acho que o levantamento histrico feito do acervo do Museu, que conta a histria no s da astronomia, mas das cincias no Brasil, um acervo que veio do Observatrio Nacional e que foi todo tratado, e isso tem de ser digitalizado. (Tcnico geral 1).
- Tudo deveria ser preservado, principalmente a rea de arqueologia, uma das reas mais fortes do Museu. Os curadores das colees nos departamentos e servios ligados s coordenaes so os que lidam com a conservao. (Tcnico geral 1).
- O que deveria ser preservado no Centro so as diretrizes de atuao, os guias de procedimentos de trabalho (Tcnico geral 3).
- O Centro criou desde 1992 um sistema de gesto de acompanhamento de projetos, um sistema que permite o controle do fluxo da informao no centro gerenciado pela rea de planejamento. (Tcnico geral 3).
Outro aspecto constatado nas visitas foi a pouca meno a padres de metadados que contemplem a preservao digital nas solues tecnolgicas
267 adotadas. Mesmo nas instituies que denotaram algum grau de preocupao com a preservao dos documentos digitais o foco se dirigia para a aquisio de material digital e a promoo de algum tipo de acesso. - Esse o compromisso bsico de todo pesquisador que tem um projeto aprovado no Laboratrio, ele no pode se negar a apresentar o resultado do trabalho dele e deixar uma cpia na biblioteca. (Tcnico geral 11)
- O acesso aos documentos na nossa memria tcnica depende do tipo de documento, pode ser restrito; a informao aparece na nossa intranet, mas a permisso chega na biblioteca e a gente consulta pesquisadores se podem ser acessados. (Bibliotecrio responsvel 5)
- Os textos completos no so colocados na pgina do Laboratrio porque so muito pesados. Quando algum pede um artigo, a biblioteca envia o documento. (Tcnico geral 6)
Com a observao nas unidades de pesquisa esperava-se encontrar percepes e aes que mostrassem a viso local sobre a preservao digital. A documentao recolhida nas instituies visitadas permitiu acompanhar a alocao de recursos materiais e humanos nos centros de informao e bibliotecas, e suas atividades relacionadas com as colees digitais de informao cientfica. Tambm, foi constatada a natureza dos projetos planejados (Ibict, CBPF) e implementados (Inpe), com os efeitos das intermitncias das polticas institucionais nas prioridades de suas administraes.
4.4.2 Os documentos
Na pesquisa de campo foram obtidos materiais publicados nas unidades de pesquisa e do MCT, procurando encontrar conceitos ligados ao contexto da preservao digital. Identificaram-se apenas trs tipos de documentos: de divulgao, oficiais e bibliogrficos.
268 4.4.2.1 Materiais de divulgao
As unidades com mais de uma dcada de existncia tm publicado materiais sobre o histrico da instituio. Durante a pesquisa de campo se teve acesso a esses materiais. Percebeu-se que alm da ausncia de um tratamento padronizado no uso e divulgao de informaes consideradas histricas, os temas relacionados com a preservao digital no estiveram presentes. Alm das informaes nas pginas dos portais das unidades na internet, as instituies j publicaram algum tipo de informao descrevendo a histria da fundao e suas transformaes no tempo. Essas informaes esto contidas em livros (Inpa), teses e dissertaes (MPEG, LNLS, Cetem, LNA, Ibict) que mencionam fatos histricos e pessoas destacadas na instituio. Nos materiais de divulgao analisados a preservao de suportes de informao analgicos e instrumentos de pesquisa foram citados, mas no foi encontrada nenhuma descrio de procedimentos relacionados manuteno de arquivos digitais. Existe um nico material distribudo pela Coordenao de Documentao em Histria da Cincia do Mast (MUSEU DE ASTRONOMIA E CINCIAS AFINS, 2007), mencionando o oferecimento do quinto curso de segurana de acervos culturais em maio de 2007. Ele destaca que, no terceiro dia, a estrutura do curso incluiria contedo sobre preservao digital. A palestra abordou: definies, obsolescncia das mdias digitais, metadados e projetos internacionais em andamento.
4.4.2.2 Documentos oficiais
Em termos de publicaes oficiais que mencionam o tema, h um documento (INSTITUTO BRASILEIRO DE INFORMAO EM CINCIA E TECNOLOGIA, 2003) assinado pela diretora do Ibict, instituindo um comit tcnico de estudos sobre preservao de documentos em arquivos digitais. Nele so relacionadas as necessidades de estabelecer propostas para a criao de polticas e
269 diretrizes nacionais de preservao de documentos digitais no mbito da Biblioteca Digital Brasileira (BDB), programa institucional mantido pelo rgo. O comit teve apenas uma reunio geral, mas foram criados grupos de trabalho para discusso de assuntos ligados preservao digital. O nico documento encontrado como resultado de reunies foi o do GT de Certificao digital, no qual so propostas a criao de um sistema de certificao digital e a expedio de um selo brasileiro de preservao digital (INSTITUTO BRASILEIRO DE INFORMAO EM CINCIA E TECNOLOGIA, 2003b). No Inpe foi localizado o documento que caracteriza a poltica de editorao e preservao da produo intelectual do instituto. Em 2005, em forma de resoluo, o diretor da instituio, assessorado pelo Conselho de Editorao e Preservao da Produo Intelectual do Inpe, determinou que o Servio de Informao e Documentao definisse as [...] caractersticas do sistema de software no que se refere, em particular, ao item preservao por longo prazo [...], assim como [...] supervisionar submisses e migrar/atualizar contedos. (INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS, 2005, p. 2).
4.4.2.3 Material bibliogrfico
O levantamento bibliogrfico inicial da pesquisa ajudou a identificar os autores brasileiros que escreveram sobre o tema no perodo de 1996 a 2007, entre os quais servidores do Cnen, do Inpe e do Ibict. Na seleo dos documentos produzidos nas unidades, foram includos trabalhos apresentados em eventos que no foram tratados na anlise bibliomtrica (item 4.1). A Tabela 10 mostra os materiais bibliogrficos coletados nas trs instituies referidas.
270 Tabela 10 - Produo bibliogrfica sobre preservao digital no MCT (1998-2007)
Tipo de documento Unidade de pesquisa Artigo Captulo Dissertao Livro Trabalho em evento Cnen 1 1 0 0 2 Ibict 2 0 1 0 3 Inpe 4 0 0 1 6 TOTAL 7 1 1 1 11
Percebeu-se que os trabalhos em eventos foram os materiais bibliogrficos a que mais vezes recorreram os autores para divulgar os resultados das suas pesquisas. Esta evidncia pode ter origem na rapidez da divulgao que esse formato permite. Em segundo lugar esto os artigos que conseguem ter uma abrangncia mais ampla de subtemas e com nmero maior de propostas. Por ltimo, com um nico registro cada, esto os captulos de livro, dissertaes e livros, sendo que o nmero de casos pode ser atribudo ao prprio tipo de formato que requer perodo de tempo considervel para sua produo (ver Apndice E). Seguindo a caracterizao que Altheide (1987) prope para o que seria um formato de apresentao dos contedos, os registros encontrados que mencionavam assuntos ligados preservao digital, continham poucas referncias aos subtemas e propostas mais frequentemente citados na literatura da rea. Os assuntos discutidos no saram dos limites das recomendaes gerais, com apenas uma soluo tecnolgica aplicada localmente.
4.4.3 Questes discutidas
Seguindo a abordagem da AEC, falar de um padro de aparecimento e uso dos conceitos relacionados com a preservao digital precisaria envolver os contextos onde eles surgiram. Os dados bibliogrficos expostos podem ser agrupados em duas categorias, segundo o contexto da abordagem do tema por parte dos pesquisadores das trs unidades de pesquisa do Ministrio. A primeira categoria seria aquela em que a preservao digital aparece como parte de uma discusso terica que expe a carncia de propostas nacionais para abordar a problemtica. A segunda categoria
271 estaria conectada com as caractersticas locais prprias de uma implementao de solues de preservao de documentos digitais. O primeiro grupo foi composto por trabalhos provenientes de duas unidades que ainda no implementaram metodologias de tratamento de preservao de objetos digitais. No Ibict, a etapa de estudos e prospeco de tecnologias ainda no deu continuidade implementao de estratgias reconhecidas internacionalmente, tais como, consrcios de repositrios DSpace, rede de bibliotecas LOCKSS ou a preservao desagregada de repositrios EPrints, entre outras. No Cnen no h ainda o planejamento para a criao, armazenamento e acesso s colees digitais locais. Como informou um pesquisador dessa instituio: - Tem as coisas que so nossas que estamos colocando na coleo digital e que no tem planejamento em termos de preservao digital; a nica coisa que tem que estamos guardando em formato pdf, no tem mais nada. Em termos de segurana, temos um servidor novo e as cpias de backup. Temos um prottipo de memria tcnica que certamente vai conter uma poltica de preservao digital no futuro. O importante agora dar acesso. (Pesquisador geral 5)
As decises sobre a implementao desse tipo de projeto so tomadas pelas diretorias desses institutos. O respondente apontou que:
- Fica at entranho, porque na verdade eu trabalho aqui, lido com esse negcio, mas uma coisa isolada, uma formao acadmica que acaba sendo no aproveitada. (Pesquisador geral 5)
De forma parecida, na nica instituio do grupo que implementou um projeto de preservao digital e que contou com o apoio da diretoria, o pesquisador que em primeiro lugar props um sistema de preservao digital manifestou o carter de iniciativa individual na busca da soluo. Segundo ele: - O software no era para essa misso, foi desenvolvido de forma independente em 1998, ele comeou a ser usado para gerenciar as teses e os eventos. No estava muito definido o que era. Ele um software gratuito para as instituies pblicas, j houve um interesse privado, mas esperamos que, com o projeto de lei sobre o acesso livre que torna obrigatrio o desenvolvimento de repositrios, o interesse seja maior. (Pesquisador geral 1)
Nos trs institutos onde o tema da preservao digital foi abordado, as formulaes dos subtemas e aspectos discutidos estiveram presentes em todos os tipos de documentos analisados: artigo, dissertao, captulo de livro, livro, assim como em trabalhos em eventos.
272 O que poderia ser considerado como padro de surgimento e uso dos termos relacionados com a preservao digital estaria na meno deles dentro de definies, propostas de recomendaes e detalhamento tcnico de aplicaes destacados na produo bibliogrfica desses pesquisadores, como mostra o Quadro 22.
Unidade de pesquisa Documentos Experincias citadas Subtemas e propostas Aspectos discutidos Cnen Artigos, captulo de livro, trabalho em evento Iniciativas e projetos internacionais Definies, estratgias, recomendaes Sistema de arquivamento, padres, acesso Ibict Artigos, dissertao, trabalhos em eventos Iniciativas e projetos internacionais Definies, estratgias, recomendaes Objetos digitais, instituies, legislao Inpe Artigos, livro, trabalhos em evento Projeto local Descrio de projeto, software, manual, poltica Iniciativa, sistema de arquivamento, padres
Quadro 22 Contedo dos documentos produzidos por servidores do MCT sobre preservao digital
No mbito do MCT surgiram algumas das primeiras definies de preservao digital em portugus. No mesmo perodo j haviam sido publicados trabalhos em Portugal relacionados com o tema. Em ambos os pases, os conceitos foram tradues de formulaes feitas por pesquisadores de lngua inglesa (FERREIRA, 2006, RODRIGUES, 2003; BORBINHA, 2001). As recomendaes mencionadas nos textos analisados tambm seguem as propostas de autores em publicaes estrangeiras. Elas vo desde aquelas relacionadas formao dos responsveis, at a indicao de procedimentos e tecnologias para o gerenciamento da preservao de documentos digitais. Finalmente, os contextos mencionados em que surgem formulaes locais sobre o tema, so reas do Ministrio nas quais se buscam solues para os problemas que os documentos digitais apresentam. A pergunta sobre como estava sendo percebida a preservao digital nas unidades de pesquisa do MCT pode ser respondida afirmando que o problema est na inexistncia de experincias prticas e na ausncia de decises institucionais, que no tm emergido por parte das diretorias.
273 Uma amostra da produo sobre o tema e de como o Inpe conseguiu dentro da instituio estabelecer o primeiro projeto e poltica de preservao digital do Ministrio, est disponvel no Apndice E.
4.5 DETERMINAO DE CRITRIOS
Um critrio uma idia a partir da qual decidimos ou valorizamos alguma coisa ou algum. Isso implica requerer de indicadores que ajudem a visualizar algumas aes concretas para poder avaliar se o critrio est sendo atendido ou no. Para o dicionrio Houaiss ele seria uma norma de confronto, avaliao e escolha. A definio mais usada de critrio que ele sirva de base para que pessoas e coisas possam ser comparadas ou julgadas. Por isso, um critrio de preservao digital uma regra que permite a fundamentao racional da escolha, deciso e deliberao de uma entidade, com relao ao servio de informao de preservao que ele presta sua comunidade. O objetivo central desta tese foi propor um conjunto de critrios de preservao digital que possam ser usados na elaborao de projetos de servios de gesto de informao de carter cientfico nas unidades de pesquisa do MCT. Considerando os argumentos expostos na reviso de literatura, configurou-se um conjunto de pressupostos para tentar entender os problemas crticos relacionados permanncia das informaes digitais. Assim a formulao dos critrios de preservao digital de informao cientfica partiram, num primeiro momento dos seguintes pressupostos: 1) a gesto dos documentos digitais um contnuo integrado de processos que envolvem todo o ciclo de vida documental; 2) existncia de graus de completude dos sistemas organizacionais com relao gesto da preservao dos documentos digitais; 3) a percepo de que as necessidades de preservao digital so determinantes na definio desses sistemas; 4) os critrios de preservao digital so plausveis de serem adequados ao contexto das organizaes.
274 A primeira etapa de uma possvel adequao de critrios bsicos de preservao digital observou a definio dos tpicos tratados na literatura que revelaram a importncia do tema (ver item 2.7). A produo cientfica das reas de arquivologia, biblioteconomia e cincia da informao indicou alguns dos tpicos que podem ser abordados no estudo da preservao digital, entre os quais: a) alcances das estratgias (THIBOBEAU, 2002; BEAGRIE, 2003); b) arquitetura das solues (LAVOIE; GARTNER, 2005; LAZORCHAK, 2005); c) metodologias apropriadas (HODGE; CARROLL, 1999); d) motivaes e necessidades dos usurios (WOODS, 2002); e) percepes e aes dos gestores (WEBB, 2000; GLADNEY, 2006). O contexto explorado na pesquisa de campo evidenciou que qualquer implementao de solues para a preservao de documentos digitais precisa contemplar todas as atividades que envolvem o ciclo de vida do objeto digital. A literatura da rea mostrou que, j na fase inicial da criao das colees digitais (tenham sido nascidas digitais ou digitalizadas), devem ser observados alguns critrios de preservao ao estabelecer as primeiras aes para sua permanncia: a. avaliao dos contedos; b. identificao dos requisitos de metadados; c. avaliao da capacidade dos metadados serem coletados; d. cotejamento da soluo selecionada com as funes dos modelos de referncia existentes; e. seleo de software e aplicativos automatizados de estratgias de preservao. Em um primeiro momento, gestores dos centros de informao e bibliotecas, como as do MCT, precisariam decidir quais so os critrios de preservao digital que devem ser observados nas suas unidades para garantir a persistncia dos documentos digitais em seus sistemas de informao. O julgamento de qual soluo adotar pode surgir da observncia desses critrios, determinando, assim, o tipo de resultado que se quer obter. Na literatura se encontra a definio de diversos tipos de elementos, princpios, propriedades, atributos, requisitos e critrios contemplados, quando se deseja criar um tipo de servio de informao orientado preservao de longo prazo (BROWN, 2003; CONARq, 2006; CORNELL UNIVERSITY LIBRARY, 2003;
275 CRL, 2007; RLG/NARA, 2006; 2007; RLG/OCLC, 2002). Como descrito, os grupos de pesquisa que fizeram esse tipo de formulao vm testando e propondo regras baseados em modelos de referncia (OAIS, TDR, TRAC, Moreq, DRAMBORA, e- Arq) nas suas prprias iniciativas e projetos. Todos os esforos de elaborao de normas para definir padres de preservao digital tm o nico propsito de que a informao contida nos sistemas de informao permanea acessvel por longo perodo de tempo. Quando se estabelece um servio de informao orientado a esse propsito, a instituio deve informar quais so os critrios que ela est seguindo. O levantamento realizado nas unidades de pesquisa do MCT deu a conhecer que, com exceo do Inpe, seus centros de informao e bibliotecas no esto aplicando nenhuma metodologia de preservao digital no tratamento dos seus documentos digitais de informao cientfica. Comparando com outros estudos no Brasil, e dos grupos de estudo que comeam a surgir em instituies de ensino superior (PUC-Rio, UNICAMP, UFPB, UniRio, UFMG), a situao no diferente, como demonstra a pesquisa de Thomaz (2004), ao analisar o ambiente de arquivamento de informao digital em organizaes pblicas brasileiras de mdio e grande porte. No caso das unidades de pesquisa do MCT, o conjunto de critrios para o estabelecimento de sistemas de informao orientados preservao digital a ser proposto pode ser usado para avaliar as atribuies de responsabilidade, a confiana que ele deve possuir e a acessibilidade que esse tipo de sistemas de informao deve permitir. A determinao da lista de critrios foi elaborada segundo as principais formulaes de requisitos bsicos existentes e que esto sendo testados, assim como a predisposio que os sistemas devem mostrar auditoria externa para confirmao da concordncia com os modelos de referncia reconhecidos internacionalmente (BULLOCK, 1999; DIGITAL CURATION CENTRE; DIGITAL PRESERVATION EUROPE, 2007; MoReq2, 2007; OCLC-CRL, 2007; RLG, 2007; RLG/OCLC, 2002). Os dois modelos de referncia reconhecidos internacionalmente para serem seguidos pelos sistemas de gerenciomento de informao cientfica em objetos digitais so OASIS e TDR. Com base neles estabeleceu-se o conjunto de
276 critrios que englobam os aspectos gerenciais e institucionais necessrios para o funcionamento desses sistemas.
4.5.1 Critrios institucionais
Os critrios institucionais so aqueles que servem para informar os filtros que o sistema de preservao digital possui, com relao a garantir sua permanncia organizacional e de recursos constantes para seu funcionamento. Eles representam uma referncia que os usurios tm de que existe uma entidade institucional que responder pela guarda, manuteno e acesso aos documentos depositados nesses sistemas. Ao mesmo tempo, o grupo de critrios institucionais de preservao digital refere-se completude da estrutura funcional do sistema de informao estabelecido, segundo seus componentes tecnolgicos e de papis necessrios a seu funcionamento, assim como garantia da consistncia das informaes arquivadas. As seis categorias de critrios institucionais propostas, lideradas pelo critrio de confiabilidade so as seguintes: 1. Confiabilidade 2. Responsabilidade poltica 3. Sustentabilidade econmica 4. Incluso em repositrios digitais 5. Transparncia 6. Acessibilidade de longo prazo
Os critrios institucionais, que englobam as caractersticas necessrias para o funcionamento de um sistema de preservao digital, permitem determinar as prticas de preservao e as condies institucionais que afetam a forma como enfrentada a preservao da informao em formatos digitais. Os indicadores dos critrios institucionais de preservao do conhecimento cientfico, ao serem sistematizados e incorporados s funes dos gestores da informao digital local, podem servir para medir a produtividade dos
277 centros de informao e bibliotecas, focalizando a utilizao da informao e reutilizao do conhecimento das novas geraes de cientistas.
4.5.1.1 Confiabilidade
Um critrio institucional que determina os aspectos que a comunidade observa quando se estabelece um servio de preservao digital o da confiabilidade. Ele envolve questes sobre os formatos aceitveis para depsito, armazenamento e esquema de segurana aplicado, temas que devem ser tratados abertamente com todos os participantes do projeto de preservao, incluindo seus usurios potenciais (BENNETT, 1997). O critrio da confiabilidade est intimamente relacionado com a adoo de padres internacionais, usados como elementos para a certificao de que as colees digitais observam todos os fatores condicionantes de preservao. Esto contidos no critrio confiabilidade os indicadores que expressam as garantias que a instituio prov de que o servio prestado adequado s necessidades da comunidade-alvo. O cumprimento deste critrio conferido algumas vezes aos servios terceirizados ou uso de solues no oriundas da instituio. Observa-se o estabelecimento de uma dependncia fsica na manuteno dos acervos digitais quando a confiana de que o servio cumpre funes de preservao de longo prazo no compete ao centro de informao ou biblioteca. Nesses casos, independentemente da soluo adotada, a instituio deve estabelecer os graus de responsabilidade e informar o critrio que est sendo cumprido. Cabe aos gestores a tarefa de identificar e revisar as informaes de empacotamento dos dados dentro dos sistemas tecnolgicos adotados e sua concordncia com o modelo de referncia OAIS (CCSDS, 2002). O armazenamento estaria determinado pela maneira como foram organizadas as informaes de contedo, a informao descritiva e as permisses de acesso. Um sistema de preservao digital deve possuir, em sua estrutura, dispositivos que permitam a guarda das informaes sobre a segurana, direitos autorais, tipos de acessos e possibilidades de auditorias. A confiabilidade tambm deve ser
278 considerada nas medidas de segurana, observadas na construo dos repositrios digitais. Essas medidas podem garantir que os materiais depositados mantero sua autenticidade no decorrer do tempo.
4.5.1.2 Responsabilidade poltica
A apreciao do critrio institucional responsabilidade poltica, efetuada por meio da avaliao das polticas de implementao ou pelo tipo de parcerias que ela envolve, pode ajudar a identificar as variveis organizacionais que determinam a presena ou no de aes concretas ante aos riscos de perdas da produo cientfica local. A partir das resolues oficiais divulgadas como poltica de preservao digital, que incluem as funes e atributos que cabem s instituies ou setores responsveis por adotar os critrios de preservao assumidos, possvel detectar tambm a importncia da informao registrada nesses sistemas. A verificao da observncia de critrios pode confirmar se a instituio tem na sua misso manter repositrios de informao confiveis (TDR, 2002). A natureza da declarao da poltica, resoluo ou mandato de preservao digital evidente nas primeiras bibliotecas nacionais a determinarem suas polticas, como a National Library of Australia ou a British Library. Nesta ltima, a formulao dos critrios para o estabelecimento do elemento preservao nas solues adotadas est contida nos seguintes indicadores: 1) desenvolvimento de um sistema de armazenamento e gerenciamento de materiais digitais a longo prazo; 2) caractersticas das funes do sistema a ser desenvolvido e do material a ser depositado; 3) propriedades do sistema para ser considerado desejvel aos propsitos para os quais foi criado (tipo de dados, automao dos processos, formatos armazenveis, tipos de back-ups);
279 4) utilizao de solues temporrias, at o estabelecimento do sistema definitivo. 47
No caso dos repositrios institucionais de acesso livre, a preservao digital no prioridade em sua criao, mas quando os critrios de preservao so observados, os repositrios adquirem carter de responsabilidade que as organizaes no manifestam quando disponibilizam um servio de acesso livre. Ao publicar sua poltica de preservao digital, as instituies informam que seus repositrios possuem a habilidade tcnica para manter e demonstrar a autenticidade e integridade dos objetos preservados. Afirmam, tambm, seu compromisso em criar servios de preservao digital como, por exemplo, os servios que esto sendo acompanhados pelo Directory of Open Access Repositories (OpenDOAR) 48 da University of Nottingham.
4.5.1.3 Sustentabilidade econmica
O critrio de sustentabilidade econmica til na avaliao do grau de responsabilidade de um sistema de preservao, segundo o tipo de apoio que recebe internamente e das instituies de fomento. Este critrio inclui consideraes sobre a parte do oramento anual dedicado a atividades de preservao digitais, tais como migrao, atualizao, criao de metadados, entre outras. Os possveis modelos de negcios dos sistemas de preservao digital ainda esto sendo estruturados, influenciados principalmente pela natureza das instituies de ensino e pesquisa, e pela forma como esto sendo percebidos pelas agncias oficiais, responsveis pelo fortalecimento da capacidade de cada pas na rea de cincia e tecnologia. Algumas tcnicas para reduzir custos com os sistemas de preservao digital apontam para a necessidade de identificar os componentes do sistema que requerem maior quantidade de investimento, em cada uma das etapas do ciclo de vida dos objetos digitais (CHAPMAN, 2003; ROSENTHAL et al, 2005).
47 NA: verso traduzida e adaptada da Poltica da British Library disponvel em: http:// Acesso em 12/set/2008) 48 URL: http://www.opendoar.org. Acesso em 20/out/2008.
280 A unio de experincias entre as instituies que desenvolvem projetos de preservao digital representa parte fundamental do critrio de sustentabilidade econmica. A importncia das parcerias reconhecida internacionalmente (JIS/NPO, 1995), porque elas possibilitam melhor compreenso dos benefcios no compartilhamento de custos e avaliaes de esforos no redundantes (CLOONAN, 2001; NATIONAL LIBRARY OF AUSTRALIA, 2003). Devido ao grande volume de informao e natureza da tecnologia digital, as parcerias entre criadores de materiais digitais podem definir qual a parcela de responsabilidade e as atribuies que lhes correspondem (BESSER, 2007).
4.5.1.4 Incluso em repositrios digitais
Um dos primeiros passos na direo da preservao dos objetos digitais a sua transferncia para um repositrio digital. A responsabilidade desse processo compartilhada pelo depositante e pela instituio que oferece esse servio. No modelo de referncia OAIS, os materiais so transmitidos aos repositrios por meio dos Pacotes de Submisso de Informao (PSI), como forma de garantir a persistncia dos documentos. Com eles so implementadas as decises sobre as caractersticas essenciais dos materiais digitais, sua preservao e acesso, independentemente da tecnologia aplicada (LeFURGY, 2002). Seria recomendvel que os sistemas de gesto da informao cientfica incorporassem todas as regras e descrio da consistncia dos materiais que esto nos PSI em relao tecnologia adotada na criao dos documentos digitais. O critrio de incluso pressupe que a instituio possui uma coleo prpria de documentos digitais que contm a produo cientfica local. Esse indicador essencial do carter cientfico dos dados proporciona validade aos contedos do sistema adotado, certificando a conformidade desses registros com as normas e padres. Tais padres devem ser reconhecidos nas polticas estabelecidas para incluso e na declarao das polticas de direitos autorais adotadas. Na estrutura de arquivamento do OAIS, o critrio incluso estaria representado dentro do Pacote de Submisso de Informao (PSI) como a descrio
281 que serve para avaliar os mecanismos adotados para garantir a autenticidade dos objetos digitais. As tcnicas de assinatura digital e de marca dgua digital tambm esto sendo usados com essa finalidade. A coleo digital a ser preservada dever conservar o seu formato original e informar qualquer modificao ou transformao futura (LYNCH, 2000). O servio de preservao digital deve oferecer garantias de que os formatos das colees nele depositadas sero atualizados periodicamente, usando software livre e minimizando o acesso fsico s mdias. A habilidade de manter a completitude dos dados pode ser detectada usando tcnicas de verificao dos pacotes de software para repositrios como o DSpace (MOORE; SMITH, 2007) e o LOCKSS.
4.5.1.5 Transparncia
Os repositrios digitais so ferramentas necessrias para os produtores, disseminadores e usurios de documentos digitais. Projetos direcionados preservao digital em repositrios insitucionais devem atender a pr-requisitos e serem parte de um processo transparente de disponibilizao de longo prazo dos objetos digitais. Os responsveis pela aplicao dos padres e normas reconhecidos internacionalmente so os desenvolvedores desses projetos. A formulao do critrio transparncia tem como propsito a observncia dos processos bsicos de um sistema de gesto da preservao digital nas instituies. Desde a adoo de uma soluo de software livre, como a Unesco (2007) e o projeto Open Access Repositories in New Zealand (OARINZ) recomendam (CATALYST, 2006), at o uso compartilhado de esquemas de metadados de preservao. Em alguns casos, a transparncia na recuperao de dados depositados nos sistemas de preservao digital pode depender da soluo tecnolgica adotada (JAMES et al., 2003). Contar com a documentao dos procedimentos garantia de que todos os arquivos sero recuperados de forma organizada. Uma forma de garantir a autenticidade dos registros e dar certeza aos usurios de que o texto recuperado est inalterado considerar os componentes de sistemas usados para extrao de metadados e auditoria de documentos (ex.: Data
282 Time Stamping ou DTS), ou recorrer a mecanismos de auditoria em rede, como o LOCKSS realiza (ROSENTHAL et al., 2005). Atender necessidade de que os sistemas contenham mecanismos de auditoria e que sejam compatveis com as propostas de certificao valoriza o trabalho dos gestores responsveis e expe a preocupao com a memria institucional (RLG/OCLC, 2002). Parte integrante do critrio transparncia so os processos de certificao. Eles so um dos itens indispensveis quando se planeja realizar trabalhos colaborativos com redes de repositrios e bibliotecas digitais que usem os mesmo padres de metadados e de intercmbio de dados (WATERS; GARRETT, 1996). O desenvolvimento das redes de preservao digital mostra que, sem essa condio, no poder haver uma integrao e colaborao entre projetos de preservao fora e dentro das instituies (OCL/CRL, 2007). Certificar um sistema de preservao sob a norma OAIS significa que a instituio mantedora revela suas interfaces internas nas especificaes de cada um dos pacotes de informao definidos por uma norma (SIP, AIP, e PDI). Projetos de preservao digital, como o Nestor da Alemanha, o Digital Curation Center na Inglaterra e os da RLG e NARA apontam para uma aplicao colaborativa dos critrios de forma a expor qualquer risco e o registro das decises assumidas. A medio do indicador certificao encontra-se em discusso entre os especialistas da rea, para quem a certificao pode representar ou no um processo em vrios nveis que refletem os graus de competncia e confidencialidade da instituio (AMBACHER, 2007). Com o crescimento do nmero de repositrios em funcionamento, se faz necessrio o estabelcimento de programas nacionais de certificao de repositrios digitais de informao cientfica apoiem seus mecanismos de avaliao e medio em normas internacionais.
4.5.1.6 Acessibilidade de longo prazo
Os gestores dos sistemas de preservao digital devero incluir informaes sobre o tipo de tratamento especfico para cada coleo e se ele
283 precisar de um aplicativo especial para ser reusado. O planejamento da manuteno da acessibilidade deve informar qual estratgia ser considerada nos casos de mudana de software e os termos e condies para uso dos materiais. O item acesso em um repositrio digital direcionado pelo modelo de referncia OAIS ajuda a identificar os servios e processos que possibilitam aos usurios visualizar os acervos. A acessibilidade do sistema de preservao digital permite medir as facilidades de uso que ele proporciona aos usurios, a dimenso das tarefas realizadas e o grau de conhecimento que eles tm das funes do sistema. Nos projetos de preservao digital em funcionamento freqente encontrar um tipo de guias e manuais de usurio, oferecendo material referencial bsico que visa obteno da certificao da acessibilidade manual ou automtica (BEAGRIE; JONES, 2006; KACZMAREK et al., 2006). Como mencionado, a acessibilidade de um sistema de preservao digital depende, tambm, da sua capacidade de ser interopervel. Essa condio alcanada por meio do uso de ferramentas de software livres, possibilitando a alterao de qualquer parte do sistema sem nenhuma conseqncia nas suas funcionalidades. A interoperabilidade representa um desafio para os repositrios digitais, pois oferece a possibilidade de trabalhar colaborativamente com outros servios de preservao digital, trazendo ganhos para as organizaes ao transferir contedos entre repositrios solucionando, dessa forma, suas necessidades de cpias de segurana remotas e replicaes. O critrio de acessibilidade de longo prazo pode ser medido por meio de indicadores de desempenho que proporcionam os dados sobre a eficincia do sistema no atendimento de usurios e suas expectativas de tempo e tipo de resposta. Tambm, o contexto tcnico de conectividade entre links (linkage) impe a preservao da integridade dos objetos digitais, levando em considerao suas relaes com outros recursos e criando contextos mais amplos que identificam caractersticas da rede a que pertencem.
284 5 CONCLUSES E SUGESTES
Considerando a proposta geral desta pesquisa de formular um conjunto de critrios necessrios implementao de sistemas de gesto de preservao de informao cientfica em documentos digitais, pode-se afirmar que esse objetivo foi alcanado na definio dos critrios institucionais de preservao digital para as unidades de pesquisa do MCT. A definio desses critrios foi resultado do estudo das principais propostas de requisitos, padres e normas internacionais encontradas na literatura das reas da cincia da informao e arquivologia. O levantamento bibliogrfico possibilitou ressaltar a natureza multidisciplinar da preservao digital, envolvendo essas duas cincias com outras teorias das reas humanas e aplicadas. Quatro foram os objetivos especficos, desta pesquisa, a saber: 1. caracterizar as prticas de preservao digital da informao cientfica; 2. identificar os critrios para sistemas de gesto da preservao digital; 3. identificar as necessidades de preservao digital; 4. identificar os conceitos e aplicaes usadas que podem interferir ou no na implementao de procedimentos padronizados de preservao digital da informao cientfica. Os dois primeiros objetivos foram alcanados na anlise das experincias com projetos de preservao citados na literatura. O levantamento bibliogrfico proporcionou uma aproximao aos resultados de experincias internacionais de projetos e pesquisas da rea, levando constatao da origem das prticas e da identificao dos fatores que compem os critrios necessrios para o funcionamento de um sistema de preservao digital. Os dois objetivos restantes foram alcanados por meio da pesquisa de campo, que possibilitou a deteco das necessidades que os setores de informao devem preencher e as condies nas quais surgiu a primeira experincia com sistemas de preservao digital no MCT. Como a pesquisa envolveu uma populao restrita responsveis por centros de informao e bibliotecas do MCT e suas equipes no possvel generalizar os resultados obtidos. Contudo, a pesquisa possibilitou trazer considerao a abordagem dos critrios de preservao digital, envolvendo os
285 sistemas de informao cientfica. No se pode deixar de apontar que o nvel de tratamento administrado s possveis variveis contidas nos indicadores desses critrios foi consoante ao limitado nmero de experincias dentro do Ministrio da Cincia e Tecnologia A verificao das prticas de tratamento dos materiais digitais levou seleo dos critrios dirigidos, principalmente, aos dirigentes e responsveis pelos centros de informao e bibliotecas do MCT. Resumindo, os critrios de preservao propostos so: 1) confiabilidade, integrada pelo conjunto de requisitos tcnicos e gerenciais que garante a integridade dos formatos, a permanncia do armazenamento dos dados e a segurana em todas as etapas do servio; 2) responsabilidade poltica, que obriga a instituio a assumir uma parcela de controle na manuteno dos acervos digitais; 3) sustentabilidade econmica, que define as aes necessrias para a continuidade do servio; 4) incluso em repositrios digitais, que estrutura instncias de validao de dados, seu carter cientfico e da abrangncia dos servios; 5) transparncia, que explicita e documenta as especificaes tcnicas para a recuperao, auditoria e certificao dos contedos; 6) Acessibilidade de longo prazo, que visa a manuteno tcnica do sistema, suas condies de interoperabilidade, desempenho e linkage com outros objetos e servios em rede. Como observado na literatura, a importncia relativa que dada ao tema da preservao digital pode variar em funo da rea ou subrea cientfica considerada. Por exemplo, a arquivologia e a cincia da informao podem ter diferenas com relao ao foco dos trabalhos, mas mostram as mesmas necessidades de esquemas e modelos de preservao digital. Na reviso da literatura observou-se que uma porcentagem elevada de trabalhos cientficos, baseados em experincias com projetos de preservao digital, dedica-se a publicar, ainda, recomendaes sobre todas as opes existentes de tratamento de materiais digitais. Entre as explicaes possveis para esse fato, est a recentidade de projetos e iniciativas e as incertezas sobre a durabilidade desses sistemas.
286 Tecnicamente, o tratamento adequado dos documentos digitais corresponde, ainda, descrio detalhada dos seus componentes fsicos e imateriais e padronizao no uso dos seus sistemas e formatos. Tal afirmao pode ser confirmada na consulta bibliografia deste trabalho e no resumo das atividades de preservao em vrios pases do mundo nos ltimos dez anos escrita por pesquisadores, como McGovern em 2007. As alternativas de tratamento dos objetos digitais apresentadas precisam ser avaliadas e discutidas para que os gestores desses acervos possam chegar a uma concluso adequada sobre qual estratgia seguir. A literatura apresentada proporcionou alternativas para discutir os atributos, critrios e normas de funcionamento de sistemas de informao para a preservao digital. As experincias internacionais apontam a necessidade urgente de estratgias de preservao aplicadas aos materiais que esto sendo produzidos nas instituies preocupadas com a memria patrimonial e a herana cultural. A maior dificuldade registrada nesses projetos e iniciativas est concentrada na parte organizacional e tecnolgica das solues encontradas. A formao de recursos humanos necessrios para o funcionamento desses sistemas comea a ser definida em instituies de ensino e pesquisa, onde repercute o interesse para que os cursos e ementas de disciplinas das reas de cincia da informao, arquivologia e museologia abordem essa necessidade nos seus contedos. A constatao da reduzida relevncia que as instituies conferem s atividades de preservao digital pode explicar porque no foram identificadas experincias semelhantes na rea do governo brasileiro que lida com a informao cientfica e tecnolgica, assim como o pequeno nmero de trabalhos que sirvam de referncia para a implementao desse tipo de servio no Brasil. A fim de avaliar as noes que os gestores dos acervos digitais dessas instituies de pesquisa tinham sobre a preservao digital, foram selecionados alguns depoimentos coletados na pesquisa de campo realizada com essa finalidade, assim como se props uma classificao do seu contedo adaptada do modelo da anlise etnogrfica de contedo sugerida por Altheide (1987). Os dados coletados diretamente com os responsveis dos centros de informao e suas equipes, em datas e lugares diferentes, por meio de questionrios e entrevistas, confirmaram a carncia de conhecimentos sobre o tema. Pode-se
287 conjecturar que a percepo dessas pessoas sobre a preservao de documentos digitais corresponde quela mantida pelo respectivo rgo. O Inpe foi a nica unidade de pesquisa que desenvolveu uma soluo tecnolgica nessa direo, incluindo a formulao de uma poltica para padronizar as atividades de depsito e acesso. O Inpe adotou o modelo de arquitetura de arquivamento digital OAIS em seu projeto de biblioteca digital e apresentou preocupao quanto ao desenvolvimento de Pacote de Disseminao de Informao (PDI), como a norma recomenda. Nas outras unidades, houve apenas a confirmao da existncia de atividades relacionadas com a migrao de formatos e com as cpias de segurana, mostrando que os setores responsveis no esto seguindo nenhum critrio de preservao digital. Com base no exposto, constatou-se que a manifestao da necessidade de preservao a longo prazo dos objetos digitais e de maior integrao entre os sistemas de informao cientfica aponta para a adoo institucional de normas e padres de preservao digital. Os participantes do projeto do Inpe expressaram que a aderncia a esses padres deve apoiar-se na adequao de critrios para o desenvolvimento de repositrios digitais confiveis. Pode-se afirmar que, considerando a ampla divulgao de ferramentas de software livre para a construo de repositrios digitais e de exemplos relevantes como a do prprio Inpe e das iniciativas apoiadas pelo Conarq, a postura dos responsveis pelos centros de informao e biblioteca comea a mudar, assim como a percepo sobre o tratamento das colees digitais. Posde-se afirmar, que a preservao digital mais do que um processo tcnico, ela um processo social e cultural pelo fato de que nela se aplicam critrios. tambm um procedimento legal porque define os direitos e privilgios necessrios para a manuteno permanente dos registros cientficos. Considerando as observaes anteriormente expostas, pode-se concluir que os objetivos desta tese foram alcanados. Espera-se que esta pesquisa oferea subsdios para que instituies que lidam com informao cientfica em formato digital possam identificar os critrios mnimos que podem ser observados nos programas, polticas e projetos de preservao digital. A confirmao da mudana na percepo dos gestores dos centros de informao e bibliotecas sobre os assuntos ligados preservao digital poderia se
288 constituir em tema de estudos a serem realizados no futuro. Nestes poderiam ser comparadas informaes oficiais e os projetos, alm de administrar metodologias semelhantes quelas desenvolvidas na presente tese. Como foi observado, percepes individuais e institucionais podem ser analisadas e sua constatao comparada em perodos de tempo considerveis. Isto permite acompanhar a variao da percepo dos gestores e as aplicaes das polticas nos diferentes setores das instituies. Existe, nas reas da cincia da informao e arquivologia no Brasil, a necessidade de estudos que tratem no apenas da natureza dos objetos digitais, mas tambm de definio de polticas institucionais que incluam a preservao desses objetos como bens materiais de contedo cientfico relevante. necessrio desenvolver pesquisas sobre a aprendizagem e aplicao de normas e padres a serem cumpridos pelos integrantes das equipes que gerenciam os sistemas de informao. Estas pesquisas poderiam adotar perspectivas da cincia da informao sobre as competncias dos profissionais da rea ante os novos recursos de informao digital, especialmente nas tarefas e rotinas de funcionamento de sistemas de preservao. O Brasil precisa, nas reas que lidam com informao e atividades de desenvolvimento cientfico, de canais oficiais para a identificao, comunicao e avaliao da preservao digital de longa durao. O modelo distribudo de centros de preservao digital no Brasil pode ser semelhante queles desenvolvidos pelas iniciativas observadas na comunidade internacional durante a ltima dcada: formulao de polticas que envolvam o uso de tecnologias e padres testados e adaptados em projetos de colees digitais. A organizao desses centros no pode desconsiderar a sua dimenso internacional, pois, no momento em que se escolhe determinado conjunto de critrios de preservao, ele deve ser integrado aos outros repositrios que adotem critrios semelhantes. O desenvolvimento de conjuntos de critrios para a reteno de longo prazo de materiais produzidos por pesquisadores de instituies pblicas dever incluir uma discusso detalhada sobre a implementao de polticas para repositrios digitais, metadados de preservao para formatos especficos de documentos e consideraes sobre o gerenciamento dos direitos autorais no ambiente digital.
289 Recomenda-se, finalmente, que projetos, programas e polticas de gesto de informao cientfica a serem estabelecidos nos rgos pblicos identifiquem sua orientao, segundo critrios reconhecidos internacionalmente.
290 REFERNCIAS
AAKER, D. A.; KUMAR, V; DAY, E. G. S. Marketing research. Hoboken , NJ : John Wiley & sons, 2004.
ABRAMO, P. Pesquisa em cincias sociais. In: HIRANO, S. (Org.). Pesquisa social: projeto e planejamento. So Paulo: T. A. Queiroz, 1979. p. 21-88.
ALEMNEH, D. G.; HASTINGS, S. K.; HARTMAN, C. N. A metadata approach to preservation of digital resources: the University of North Texas Libraries: experience. First Monday, v. 7, n. 8, Aug. 2002. Disponvel em: <http://firstmonday.org/issues/issue7_8/alemneh/index.html>. Acesso em: 8 ago. 2006.
ALTHEIDE, D. Ethnographic content analysis. Qualitative Sociology, v. 10, n. 1, p. 65-77, Spring 1987.
ALVARADO URBIZAGSTEGUI, R. A bibliometria: histria, legitimao e estrutura. In: TOUTAIN, L. M. B. B. (Org.). Para entender a cincia da informao. Salvador: EDUFBA, 2007. p. 185-217.
AMBACHER, B. Government archives and the digital repository audit checklist: modern record program. JoDI, v. 8, n. 2, 2007.
AMERICAN INSTITUTE OF PHYSICS. Publishing services. 2003. Disponvel em: <http://www.aip.org/publishing/services/cs_archleg.html>. Acesso em: 18 jun. 2006.
ANDERSON, S.; PINFIELD, S. Preserving e-prints: scaling the preservation mountain. In: DPC-CURL SEMINAR ON INSTITUTIONAL REPOSITORIES, 2004, London. Proceedings London: [s. n.], 2004.
ARMS, W. Digital libraries. Cambridge: MIT Press, 2000.
BANON, G. J. F. Biblioteca Digital da Memria Tcnico-Cientfica do INPE. So Jos dos Campos: INPE, 2006. Disponvel em: <http://urlib.net/dpi.inpe.br/banon- pc2@1905/2005/12.07.19.19>. Acesso em: 24 out. 2008.
______; BANON, L. C. Ferramentas on-line associadas a uma biblioteca digital para publicao em eventos: Projeto XII SBSR. In: SIMPSIO INTERNACIONAL DE
291 BIBLIOTECAS DIGITAIS, 3., 2005, So Paulo. Anais... So Paulo: INPE, 2005. Disponvel em: <http://urlib.net/sid.inpe.br/iris@1912/2005/12.02.12.24>. Acesso em: 24 out. 2008.
BASEVI, T. BDJur Consortium: Juridical Digital Library: implementing DSpace in the Brazilian Judiciary. In: ICCC CONFERENCE ON ELECTRONIC PUBLISHING, 9., 2005, Leuven , Be. Proceedings Leuven, Be: Katholieke Universiteit de Leuven, 2005.
BEAGRIE, N. A continuing Access and digital preservation strategy for the Joint Information Systems Committee (JISC). London: JISC, 2002. Disponvel em: <http://www.jisc.ac.uk/index.cfm?name=pres_continuing>. Acesso em: 14 jan. 2007.
______. National digital preservation initiatives: an overview of developments in Australia, France, the Netherlands, and the United Kingdom and of related international activity. Washington: Council on Library and Information Resources and the Library of Congress, 2003. Disponvel em: <http://www.clir.org/pubs/reports/pub116/pub116/pub116.pdf>. Acesso em: 28. out. 2006.
______; GREENSTEIN, D. A strategic policy framework for creating and preserving digital collections. London: Kings College, 1998. Disponvel em: <http://ahds.ac.uk/managing.htm>. Acesso em: 28 out. 2006.
BEARMAN, D. Electronic evidence: strategies for managing records in contemporary organizations. Pittsburgh: Archives and Museum Informatics, 1994.
BELKIN, N. J. Information concepts of information for Information Science. Journal of Documentation, London, v. 34, n.1, p. 55-85, 1978.
BELLOTTO, H. L. Arquivos permanentes: tratamento documental. 2. ed. rev. e ampl. Rio de Janeiro: FGV, 2004.
BENNETT, J. C. A framework of data types and formats, and issues affecting the long term preservation of digital material. London: British Library, 1997. (JISC/NPO studies on the preservation of electronic materials, 50). Disponvel em: <http://www.ukoln.ac.uk/services/papers/bl/jisc-npo50/bennet.html>. Acesso em: 25 mar. 2007.
292 BERNE Convention for the Protection of Literary and Artistic Works, of September 9, 1886. Disponvel em: <http://www.wipo.int/treaties/en/ip/berne/index.html>. Acesso em: 30/out/2002
BESSER, H. Collaboration for electronic preservation. Library Trends, v. 56, n.1, p. 216-229, 2007.
______. Digital longevity. In: SITTS, M. K. (Ed.). Handbook for Digital Projects: a management tool for preservation and access. Massachusetts: Northeast Document Conservation Center, 2000. p. 155-166.
BLAKE, M. German network of expertise in digital preservation. Electronic Library, v. 22, p. 368-369, Apr. 2004.
BOERES, S. A. A. Poltica de preservao da informao digital em bibliotecas universitrias brasileiras. 2004. 167 f. Dissertao (Mestrado em Cincia da Informao e Documentao) - Faculdade de Economia, Administrao, Contabilidade e Cincia da Informao e Documentao, Universidade de Braslia, Braslia, 2004.
______; MRDERO ARELLANO, M. A. Polticas e estratgias de preservao de documentos digitais. In: CINFORM, 4., 2005, Salvador, BA. Proceedings... Salvador, BA: Dilogo Cientfico, 2005. Disponvel em: <http://dici.ibict.br/archive/00000263>. Acesso em: 16 fev. 2007.
BORBINHA, J.; CORREIA, A. M. R. Deposit of scientific and technical gray literature in Portugal: a case study. In: INTERNATIONAL CONFERENCE ON ENTERPRISE INFORMATION SYSTEMS, 2001, Setubal, Portugal. Proceedings Setubal, Portugal: ICEIS Press, 2001. p. 8-19.
______. Metadata: conceito e sua relevncia para as bibliotecas. In: CONGRESSO NACIONAL DE BIBLIOTECRIOS, ARQUIVISTAS E DOCUMENTALISTAS, 7., 2001, Porto. Actas... Porto: [s. n.], 2001.
BRADLEY, K. APSR sustainability issues discussion paper. Canberra: National Library of Australia, 2004. Disponvel em: <http://www.apsr.edu.au/documents/APSR_Sustainability_Issues_Paper.pdf>. Acesso em: 18 ago. 2006.
293 BROOKES, B. C. Numerical methods of bibliographical analysis. Library Trends, v. 22, n. 1, p. 18-43, July, 1973.
BROWN, A. Selecting file format media for long term preservation. UK: The National Archives, 2003.
BRUCE, H. Personal, anticipated information need. Information Research, Washington, v. 10, n. 3, Apr. 2005. Disponvel em: <http://informationr.net/ir/10- 3/paper232.html>. Acesso em: 9 jan. 2006.
BUDAPEST OPEN ACCESS INITIATIVE. [site]. 2002. Disponvel em: <http://www.soros.org/openaccess/read.shtml>. Acesso em: 18 jun. 2006.
BULLOCK, A. Preservation of digital information: issues and current status. Ottawa: National Library of Canada, 1999. Disponvel em: <http://www.collectionscanada.ca/9/1/p1-259-e.html>. Acesso em: 28 jul. 2005.
BURGOS, M. B. Cincia na periferia: a luz sncroton brasileira. Juiz de Fora: EDUFJF, 1999.
CAF, L. et al. Repositrios Institucionais: nova estratgia de publicao cientfica na rede. In: ENCONTRO NACIONAL DE INFORMAO EM CINCIAS DA COMUNICAO, 13., 2003, Belo Horizonte. Anais Belo Horizonte: [s.n.], 2003.
CAMILEON: Creative archiving at Michigan e Leeds: emulating the old on the new. United States: JISC and National Science Fundation, 2001. Disponvel em: <http://www.si.umich.edu/CAMILEON/>. Acesso em: 19 ago. 2006.
CANDS ROMERO, J. El papel de los metadados en la preservacin digital. El Profesional de la Informacin, v. 15, n. 2, mar./abr. p. 126-136, 2006.
CAPLAN, P. Building a digital preservation archive: tales from the front. VINE, v. 34, n. 1, p. 38-42, 2004.
CARLIN, A. P. Aspects of spatial arrangement in libraries. In : LASK, T. (Ed.). Constructions sociales de l'espace, les territoires de l'anthropolgie de la communication. Lige: Ls ditions de l'Universit de Lige, 2003. p. 87-99.
294 ______. Disciplinary debates and bases of interdisciplinary studies: the place of research ethics in library and information science. Library and Information Science Research, v. 25, n. 1, p. 3-18, Spring 2003.
CATALYST. Technical evaluation of selected open source repository solutions on behalf of CPIT. Version 1.3 approved. Wellington, New Zealand: [s. n.], 2006.
CEDARS PROJECT TEAM. Cedars Guide to Preservation Metadata. The Cedars Project, 2002.
CENTER FOR RESEARCH LIBRARIES. Trustworthy Repositories Audit and Certification (TRAC): criteria and checklist (TRAC). 2007. Disponvel em: <http://www.crl.edu/content.asp?l1=13&l2=58&l3=162&l4=91>. Acesso em: 14 mar. 2005.
CHAPMAN, S. Counting the costs of digital preservation: is repository storage affordable? Journal of Digital Information, v. 4, n. 2, 2003.
CHEPESUIK, R. The future is here: Americas libraries go digital. American Libraries, v. 2, n. 1, p. 47-49, 1997.
CHILVERS, A. H. Managing long-term access to digital data approach: a metadata approach. Inglaterra: Loughborough University, 2000.
CHUDNOV, D. DSpace durable digital documents. Serials, v. 14, n.3, Nov. 2001.
CLOONAN, M. V. W(h)ither preservation? Library Quarterly, Chicago, v. 71, n. 2, p. 231-242, Apr. 2001.
COLEMAN, J.; WILLIS, D. SGML as a framework for digital preservation and access. Washington: Commission on Preservation and Access, 1997.
COMMISSION ON PRESERVATION AND ACCESS AND THE RESEARCH LIBRARIES GROUP. Preserving digital information: report of the task force on archiving of digital Information. Washington, 1996. 64 p.
CONSULTIVE COMMITTEE FOR SPACE DATA SYSTEMS (CCSDS). Producer- archive interface methodology abstract standard. Washington: Blue Book, 2002. Disponvel em: <http://ssdoo.gsfc.nasa.gov/nost/isoas/CCSDS--651.0-R-1-draft.pdf>. Acesso em: 27 jan. 2004.
______. Reference model for an Open Archival Information System (OAIS). Washington: Blue Book, 2002. Disponvel em: <http://public.ccsds.org/publications/archive/650x0b1.pdf> Acesso em: 10 mar. 2006.
CONSELHO NACIONAL DE ARQUIVOS. Carta para a preservao do patrimnio arquivstico digital. Rio de Janeiro: UNESCO, 2004. Disponvel em: <http://www.arquivonacional.gov.br/conarq/cam_tec_doc_ele/preservacao/cartapres ervacao.asp>. Acesso em: 6 abr. 2006.
CORNEL UNIVERSITY LIBRARY. Digital preservation management: implementing short-term strategies for long-term problems. 2004. Disponvel em: <http://www.library.cornell.edu/iris/tutorial/dpm/>. Acesso em: 16 nov. 2005.
COSTA, M. F.; COSTA, M. F. B. Metodologia de Pesquisa: conceitos e tcnicas. Rio de Janeiro: Intercincia, 2001.
COUNCIL ON LIBRARY AND INFORMATION RESOURCES (Library of Congress). Capturing analog sound for digital preservation: report of a roundtable discussion of best practice for transferring analog discs and tapes. Washington, 2006.
COX, J.; COX, L. Scholarly publishing practice: the ALPSP report on academic journal publishers: policies and practices in online publishing. United Kingdom: John Cox Associates, 2003. Disponvel em: <http://www.arl.org/sparc/IR/ie.html>. Acesso em: 25 out. 2006.
CROW, R. The case for institutional repositories: a SPARC position paper. Washington, D.C.: Scholarly Publishing & Academic Resources Coalition. 2002. DIsponvel em: <http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf>. Acesso em: 2 set. 2008.
CROWE, R. The case for institutional repositories: a SPARC position paper. Washington: The Scholarly Publishing & Academic Resources Coalition, 2002. Disponvel em: <http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf>. Acesso em: 14 jul. 2008.
CULYBA, R. J.; HEIMER, C. A.; Petty, J. C. The ethnographic turn: fact, fashion, or fiction? Journal Qualitative Sociology, v. 27, n. 4, p. 365-389, Dec. 2004.
296 CUNHA, M. B. Desafios na construo de uma biblioteca digital. Cincia da Informao, Braslia, v. 28, n. 3, set./dez. 1999. Disponvel em: <http://www.ibict.br/cienciadainformacao/rst/viewarticle.php?id=323>. Acesso em: 28 jul. 2004.
DAY, M. E-print services and long-term access to the record of scholarly and scientific research. Ariadne, n. 28, June 2001. Disponvel em: <http://www.ariadne.ac.uk/issue28/metadata/>. Acesso em: 11 ago. 2006.
______. The Final Cedars Workshop: a report from Manchester, RLG DigiNews, v. 6, n. 2, Apr., 2002. Disponvel em: <http://www.rlg.org/preserv/diginews/diginews6- 2.html#conference>. Acesso em: 18 jul. 2006.
______. Metadata for digital preservation: an update. Ariadne, n. 22, Dec. 1999. Disponvel em: <http://www.ariadne.ac.uk/issue22/metadata/intro.html>. Acesso em: 18 ago. 2006.
______. Preservation metadata. In: GORMAN, G. E.; DORNER D. G. (Ed.). Metadata applications and management. London: Facet Publishing, 2004, p. 253- 273.
DEFENSE TECHNICAL INFORMATION CENTER. Technical metadata for the long-term management of digital materials: preliminary guidelines. 2002. Disponvel em: <http://dvl.dtic.mil/metadata_guidelines/TechMetadata_26Mar02_1400.pdf.>. Acesso em: 27 jan. 2006.
DENZIN, N. K.; LINCOLN, Y. S. (Ed.). Handbook of qualitative research. 2. ed. Housand Oaks, CA: Sage, 2005.
DEPARTMENT OF THE PREMIER AND CABINET (DPC). A security management framework for online services. [Perth, W. A.]: CAMS and Department of Commerce and Trade, 2000. Disponvel em: <http://www.egov.dpc.wa.gov.au/documents/security_management.doc>. Acesso em: 6 dez. 2006.
DESCOMBE, M. The good research guide: for small-scale social research projects. 2nd ed. Maidenhead, Gran Bretaa: Open University Press, 2003.
DIAS, J. L. M. FINEP: trinta anos de projetos para o Brasil. Rio de Janeiro: FGV, 2002.
297 DIGITAL PRESERVATION COALITION. Dpc Forum on Web Archiving. Disponvel em: <http://www.dpconline.org/graphics/events/060612web-archiving.html>. Acesso em: 1 set. 2006.
______; DIGITAL PRESERVATION EUROPE. Digital Repository Audit Method Based on Risk Assessment (DRAMBORA). Disponvel em: <http://www.repositoryaudit.eu/download/>. Acesso em: 20 out. 2007.
DOBRATZ, S.; SCHOGER A.; STRATHMANN, S. The nestor catalogue of criteria for trusted digital repository evaluation and certification. JoDI, v. 8, n. 2, 2007. Disponvel em: <http://journal.tdl.org/jodi/issue/view/34>. Acesso em: 14 maio 2005.
DOLLAR, C. M. O impacto das tecnologias de informao sobre os princpios e prticas de arquivos: algumas consideraes. Revista do Arquivo Nacional, v. 7, n. 1/2, p. 3-38, jan./dez. 1994.
DSPACE. Format Support. [S. l.]: MIT Libraries & Hewlett-Packard Company, 2002.
DUKART, J. R. Electronic document archival dilemma. E-doc, v.16, n. 5, p. 43, 2002.
ERPANET/CODATA INTERNATIONAL ARCHIVING WORKSHOP ON THE SELECTION, APPRAISAL AND RETENTION OF DIGITAL SCIENTIFIC DATA, 2003, Lisbon, Portugal. Atas Lisbon, Portugal: Biblioteca Nacional de Portugal, 2003.
EWING, G. et al. Role and experience determine decision support interface requirements in a neonatal intensive care environment. Journal of Biomedical Informatics, v. 36, p. 240, 2003.
FALK, H. Digital archive developments. The Electronic Library, v. 21, n. 4, p. 375-379, 2003.
FEATHER, J. (Ed.). Managing preservation for libraries and archives. Aldershot, Hants: Ashgate, 2004.
FEENEY, M. Towards a national strategy for archiving digital materials. Alexandria, v. 11, n. 2, p. 107-121, 1999.
298 ______. (Ed.). The digital culture: maximising the nation's investment: a synthesis of JISC/NPO studies on the preservation of electronic materials. London: British Library Board, National Preservation Office, 1999.
FENTON, E; SCHONFELD, R. Digital preservation library periodicals expenses: variance between non-subscription costs for print and electronic formats on a life cycle basis. In: TASK FORCE MEETING, Portland, OR, 2003. Proceedings... Portland, OR: CNI, 2003.
FERREIRA, M. CRIB: a service oriented architecture for digital preservation outsourcing. Portalegre, Portugal: University of Minho, 2006.
______. Introduo preservao digital: conceitos, estratgias e actuais consensos. Portalegre, Portugal: Universidade do Minho, 2006. Disponvel em: <https://repositorium.sdum.uminho.pt/bitstream/1822/5820/1/livro.pdf>. Acesso em: 20 jan. 2007.
______.; BAPTISTA, A. A.; RAMALHO, J. C. A foundation for automatic digital preservation. Ariadne, n. 48, Aug. 2006.
FERREIRA, S.; SOUTO, L. Dos sistemas de informao federados federao de bibliotecas digitais. Revista Brasileira de Biblioteconomia e Documentao, v. 2, n. 1, 2006. Disponvel em: <http://www.febab.org.br/rbbd/ojs- 2.1.1/index.php/rbbd/article/view/3/20>. Acesso em: 25 jan. 2005.
FINK, F; KOSECOFF, J. How to conduct surveys: a step-by-step guide. [S. l.]: SAGE Publications, 1985.
FOOT, M. M. Building blocks for a preservation policy. London: National Preservation Office London, 2001. Disponvel em: <www.bl.uk/services/preservation/upos.pdf>. Acesso em: 17 mar. 2006.
______. Towards a preservation policy for European research libraries. Liber Quarterly, v. 9, n. 3, p. 323-328, 1999.
FRESKO, M. Digital Preservation Guidelines: The State of the Art in Libraries, Museums and Archives, 1998. Disponvel em: <ftp://ftp.cordis.lu/pub/ist/docs/digicult/study1.doc> Acesso em: 15 fev. 2008.
299 FRIEDLANDER, A. The national information infrastructure preservation program: expectations, realities, choices and progress to date. D-Lib Magazine, v. 8, n. 3, Apr. 2002. Disponvel em: <http://www.dlib.org/delib/september95/04friedlander.html>. Acesso em: 14 abr. 2005.
FUNARI, P. P. A. Os Arquivos no Sculo XXI: polticas e prticas de acesso s informaes. In: CONGRESSO NACIONAL DE ARQUIVOLOGIA, 1., 2004, Braslia,. Anais... Braslia: Universidade de Braslia, 2004.
______. A diversidade cultural e a gesto, preservao e acesso a documentos digitais. Campinas, SP: Siarq Unicamp, 2005. Fruns Permanentes da UNICAMP: conhecimento e tecnologia da informao, gesto e preservao de documentos digitais.
GANDELMAN, H. De Gutemberg Internet: direitos autorais na era digital. Rio de Janeiro: Record, 1997.
GEERTZ, C. Works and lives: the anthropologist as author. Stanford, CA: Stanford University Press, 1988.
GILLELAND-SWETLAND, A. Setting the stage. In: BACA, M. (Ed.). Introduction to metadata: pathways to digital information, 2000. Disponvel em: <http://www.getty.edu/research/institute/standards/intrometadata/2_articles/index.htm >. Acesso em: 28 jul. 2006.
______. Enduring paradigm, new opportunities: the value of the archival perspective in the digital environment. Washington: Council on Library and Information Resources, 2000. Disponvel em: <http://www.clir.org/pubs/reports/pub89/pub89.pdf>. Acesso em: 25 jun. 2006.
______.; EPPARD, P. B. Preserving the authenticity of contingent digital objects: the InterPARES Project. D-Lib Magazine, v. 6, July/Aug. 2000. Disponvel em: <www.dlib.org/dlib/july00/eppard/07eppard.html>. Acesso em: 15 ago. 2006.
GLADNEY, H. M. Critique: attributes of a trusted digital repository. Saratoga, CA: HMG Consulting, 2001. Disponvel em: <http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.18.6694>. Acesso em: 12 abr. 2006.
______. Principles for digital preservation. Communications of the ACM, v. 49, p. 111-116, Feb. 2006.
300 GLASER, B. G. Theoretical sensitivity: advances in the methodology of grounded theory. Mill Valley: Sociology Press, 1978.
GORMAN, G. E.; CLAYTON, P. Qualitative research for the information professional: a practical handbook. London: Library Association Publishing, 1997.
GRAHAM, P. S. Long-term intellectual preservation. In: ELKINGTON, N. E. (Ed.). Digital imaging technology for preservation. Mountain View, California: Research Libraries Group, 1998. p. 41-57.
GRANGER, S. Emulation as a digital preservation strategy. D-Lib Magazine, v. 6, n. 10, Oct. 2000. Disponvel em: <http://www.dlib.org/dlib/october00/granger/10granger.html>. Acesso em: 5 ago. 2006.
______. Digital preservation and deep infrastructure. D-Lib Magazine, v. 8, n. 2, Feb. 2002. Disponvel em: <http://www.dlib.org/dlib/february02/granger/02granger.html>. Acesso em: 28 set. 2006.
GRAY, J. Cachorros de palha: reflexes sobre humanos e outros animais. Rio de Janeiro: Record, 2005.
GREENAN, M. ERPANET OAIS: Training Seminar Report. Glasgow, United Kingdom: Erpanet, 2003. Disponvel em: <http://www.erpanet.org/www/products/copenhagen/ERPANET%20OAIS%20Traini ng%20Seminar%20Report_final.pdf>. Acesso em: 14 jul. 2006.
GREENSTEIN, D.; GEORGE, G. Digital reproduction quality: benchmark recommendations. RLG DigiNews, v. 5, n. 4, 1998. Disponvel em: <http://www.rlg.org/preserv/diginews/diginews5-4.html#featured>. Acesso em: 28 jul. 2006.
______. Managing digital collections: part II: in search of guidance. AHDS Publications, 1998. Disponvel em: <http://www.ahds.ac.uk/about/publications/index.htm> Acesso em: 12 jun. 2005.
GREENSTEIN, S. M. Lock-in and the costs of switching mainframe computer vendors: what do buyers see? Oxford: Industrial and Corporate Change, 1997.
301 ______. Universal service in the digital age: the commercialization and geography of U.S. internet access. Cambridge, MA: National Bureau of Economic Research, 2008. Disponvel em: <http://ideas.repec.org/p/nbr/nberwo/6453.html>. Acesso em: 14 out. 2007.
GWATNEY, M. C. Reality versus the ideal: a case study of three elementary school library media specialists performing their jobs. Knowledge Quest, v. 29 n. 5, p. 36- 42, May/June 2001.
HAHN, K. The state of the large publisher bundle: findings from an ARL Member Survey. ARL Bimonthly Report, n. 245, Apr. 2006. Disponvel em: <http://www.arl.org/newsltr/245/bundle.html>. Acesso em: 5 jun. 2007.
HANNA, M. Born digital: live digital? maybe. Quarterly Newsletter of the Interactive council for Scientific and Technical Information, v. 38, June 2001. Disponvel em: <http://www.icsti/forum/38/>. Acesso em: 21 jan. 2006.
HARNAD, S. Acesso Livre: por qu? Belm, PA: SBPC, 2007. Disponvel em: <http://users.ecs.soton.ac.uk/harnad/Temp/brazilb.ppt#626>. Acesso em 1 nov. 2008.
______. Free at last: the future of peer-reviewed journals. D-Lib Magazine, v. 5, n. 12, Dec. 1999. Disponvel em: <http://www.dlib.org/dlib/december99/12harnad.html>. Acesso em: 19 maio 2005.
______. Comunicao pessoal. Belm, PA. 9 jul. 2007
______. [Mensagem para lista de discusso]. 2003. Disponvel em: <http://users.ecs.soton.ac.uk/harnad/Hypermail/Amsci>. Acesso em: 18 set. 2007.
______. Online, continuous, metrics-based research assessment. Technical Report, ECS, University of Southampton [Unpublished]. Disponvel em: <http://eprints.ecs.soton.ac.uk/12130/>. Acesso em: 4 ago. 2006.
______. The self-archiving initiative: freeing the refereed research literature online. Nature, v. 10, Apr. 2001. Disponvel em: <http://www.ecs.soton.ac.uk/~harnad/Tp/nature4.htm>. Acesso em: 16 jan. 2006.
302 HARVARD UNIVERSITY LIBRARY. Proposal for a study of electronic journal archiving. 2000. Disponvel em: <http://www.diglib.org/preserve/ejp.htm> Acesso em: 18 jun. 2006.
HAYNES, D. Responsibility for digital archiving and long term access to digital data: a JISC/NPO. London: Library Information Technology Centre, London, 1997. (Study with the Electronic Libraries (eLib) Programme on the Preservation of Electronic Materials)
HEDSTROM, M. Digital preservation: a time bomb for digital libraries. 1996. Disponvel em: <www.uky.edu/~kiernsm/DL/hedstrom.html>. Acesso em: 19 jul. 2006.
______; MONTGOMERY, S. Digital preservation needs and requirements in RLG members institutions. Mountain View, CA: RLG, 1998.
HENDLEY, T. Comparison of methods e costs of digital preservation: British Library research and innovation report. London: British Library and Innovation Centre, 1998. Disponvel em: <http://www.ukoln.ac.uk/services/elib/papers/tavistock/hendley/hendley.html>. Acesso em: 18 set. 2006.
HILDRETH, C.R. Preserving what we really want to access, the message, not the medium: challenges and opportunities in the digital age. In: HELAL, A. H.; Weiss, J. W. (Ed.). INTERNATIONAL ESSEN SYMPOSIUM, 18., 1995, Essen. Proceeding Essen: Germany University library, 1996. p. 76-95.
HIRTLE, P. Editorial: OAI and OAIS: whats in a name? D-Lib Magazine, v. 7, n. 4, Apr. 2001. Disponvel em: <http://www.dlib.org/dlib/april01/04editorial.html>. Acesso em: 25 ago. 2007.
HITCHCOCK, S. Metalist of open access e-print archives: the genesis of institutional archives and independent services. ARL Bimonthly Report, n. 227, p. 4-11, Oct. 2003.
______; et. al. Digital preservation service provider models for institutional repositories. D-lib Magazine, v. 13, n. 5/6, May/June 2007. Disponvel em: <http://wwwdlib.org/dlib/may07/hitchcock/05hitchcock.html>. Acesso em: 13 fev. 2006.
303 HODGE, G. M. Best practices in digital archiving: a life cycle approach. D-Lib Magazine, v. 6, n. 1, Jan. 2000. Disponvel em: <http://www.dlib.org/dlib/january00/01hodge.html>. Acesso em: 18 jun. 2006.
______; CARROLL, B. C. Digital electronic archiving: the state of the art and the state of the practice. [S. l.]: International Council for Scientific and Technical Information Information Policy Committee and CENDI, 1999. Disponvel em: <http://www.icsti.org/Dig_Archiving_Report_1999.pdf>. Acesso em: 18 mar. 2005.
______; FRANGAKIS, E. Digital preservation and permanent access to scientific information: the state of the practice. [S. l.]: International Council for Scientific and Technical Information and CENDI, 2004. Disponvel em: <http://www.dtic.mil/cendi/publications/04-3dig_preserv.html.>. Acesso em: 14 maio 2006.
IBM. Digital Information Archiving System. 1996. Disponvel em: <http://www- 5.ibm.com/nl/dias/>. Acesso em: 19 fev. 2007.
IKPAAHINDLI, L. An overview of bibliometrics: its measurements, laws and their applications. Libri, v. 35, n. 2, p. 163-177, June 1985.
INERA Incorporated. E-journal archive DTD feasibility study. [Prepared for the] Harvard University Library, Office of Information Systems, E-Journal Archiving Project, 2002. Disponvel em: <http://www.diglib.org/preserve/hadtdfs.pdf>. Acesso em: 15 set. 2006.
INSTITUTO BRASILEIRO DE INFORMAO CIENTFICA E TECNOLGICA. Contribuio para polticas de ICT. Braslia: IBICT, 2001.
______. Ordem Interna n. 009/02, de 13 de novembro de 2002. Braslia, DF, 2002.
______. PresDigi: sistema brasileiro de preservao de documentos em arquivos digitais. Braslia, DF, 2003. (proposta preliminar para discusso [por] Miguel ngel Mrdero Arellano e Piotr Trzesniak).
INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS. Resoluo n 204.01. Caracteriza a Poltica de Editorao e Preservao da Produo Intelectual do INPE.
304 JAMES, H. et al. Feasibility and requirements study on preservation of e-prints. 2003. Report Commissioned by the Joint Information Systems Committee (JISC).
JISC. Open access briefing paper, joint information systems committee. 2005. Disponvel em: <www.jisc.ac.uk/index.cfm?name5pub_openaccess>. Acesso em: 6 ago. 2007.
JONES, M. Digital preservation activities in the U.K: building the infrastructure. In: WORLD LIBRARY AND INFORMATION CONGRESS: General Conference and Council, 69., 2003, Berlin. Proceedings Berlin: IFLA, 2003.
KACZMAREK, J. et al. Using the audit checklist for the certification of a trusted digital repository: as a framework for evaluating repository software applications: a progress report. D-lib Magazine, v. 12, n. 12, Dec. 2006. Disponvel em: <http://www.dlib.org/dlib/december06/kaczmarek/12kaczmarek. html>. Acesso em: 9 set. 2005.
KUNZE, J. Towards electronic persistence using ARK identifiers. Oakland, CA: University of Califrnia, 2003. Disponvel em: <http://bibnum.bnf.fr/ecdl/2003/proceedings.php?f=kunze>. Aceso em: 27 jan. 2004.
LAKATOS, E. M.; MARCONI, M. A. Fundamentos de metodologia cientfica. 3. ed. So Paulo: Atlas, 1991.
LAVOIE, B. Implementing metadata in digital preservation systems: the PREMIS activity. D-Lib Magazine, v. 10, n. 4, Apr. 2004. Disponvel em: <http://www.dlib.org/dlib/april04/lavoie/04lavoie.html>. Acesso em: 28 ago. 2005.
______. The incentives to preserve digital materials: roles, scenarios and economic decision-making. Columbus, OH: OCLC, 2003.
______. Meeting the challenges of digital preservation: the OAIS reference model. OCLC-Newsletter, n. 243, p. 26-30, Jan./Feb. 2000.
______. The open archival information system reference model: introductory guide. Dublin, USA: Office of Research OCLC, 2004. Disponvel em: <http://www.dpconline.org/docs/lavoie_OAIS.pdf>. Acesso em: 24 abr. 2006.
______. PREMIS with a fresh coat of paint: highlights from the revision of the PREMIS data dictionary for preservation metadata. D-Lib Magazine, v. 14, n. 5/6,
______; DEMPSEY, L. Thirteen ways of looking at - digital preservation. D-Lib Magazine, v. 10, n. 7/8, jul./ago., 2004. Disponvel em: <http://www.dlib.org/dlib/july04/lavoie/07lavoie.html>. Acesso em: 28 abr. 2005.
LAZORCHAK, W. M. The ghost in the machine: traditional archival practice in the design of digital repositories for long-term preservation. Chapel Hill: University of North Carolina, 2005. Disponvel em: <http://etd.ils.unc.edu/dspace/bitstream/1901/93/1/butchlazorchak.pdf>. Acesso em: 28 mar. 2006.
LAWRENCE, G. W. et al. Risk management of digital information: a file format investigation. Washington: Council on Library and Information Resources, 2000.
LEE, K. et al. The state of the art and practice in digital preservation. Journal of Research of the National Institute of Standards and Technology, v. 107, n. 1, p. 93-106, Jan./Feb. 2002. Disponvel em: <http://nvl.nist.gov/pub/nistpubs/jres/107/l/j71lee.pdf>. Acesso em: 16 jul. 2006.
LeFURGY, W. G. Building preservation partnerships: The Library of Congress National digital information infrastructure and preservation program. Library Trends, Washington, v. 54, n. 1, p. 163-172, 2005.
______. Levels of service for digital repositories. D-Lib Magazine, v. 8, n. 5, May 2002.
LESK, M. Practical digital libraries: books, bytes and bucks. San Francisco, CA: Morgan Kaufmann Publishers, 1997.
LEVACOV, M. Bibliotecas virtuais: (r)evoluo? Cincia da Informao, Braslia, v. 26, n. 2, p. 125-135, maio/ago. 1997.
LEVY, D. M. Heroic measures: reflections on the possibility and purpose of digital preservation. In: ACM
306 CONFERENCE ON DIGITAL LIBRARIES, 3., 1998, Pittsburgh, Pennsylvania. Proceedings New York: ACM Press, 1998.
LOCKSS. Lots of copies keep stuff safe. 2003 Disponvel em: <http://lockss.stanford.edu/index.html>. Acesso em: 28 maio 2005.
LUPOVICI, C.; MASANS, J. Metadata for the long term preservation of electronic publications. Den Haag: NEDLIB Consortium, 2000. Disponvel em: <http://www.kb.nl/nedlib/results/preservationmetadata.pdf>. Acesso em: 25 set. 2005.
LYMAN, P. Archiving the world wide web: in building a national strategy for preservation: issues in digital media archiving. Washington: Council on Library and Information Resources, 2002. Disponvel em: <www.clir.org/pubs/reports/pub106/web.html>. Acesso em: 14 mar. 2006.
LYNCH, C. Institutional repositories: essential infrastructure for scholarship in the digital age. ARL Bimonthly Report, n. 226, Feb. 2003. Disponvel em: <http://www.arl.org/resources/pubs/br/br226/br226ir.shtml> Acesso em 2/nov/2008.
MARCUM, D. B.; FRIEDLANDER, A. Keepers of the crumbling culture: what digital preservation can learn from library history. D-Lib Magazine, v. 9, n. 5, May 2003. Disponvel em: <http://www.dlib.org/dlib/may03/friedlander/05friedlander.html>. Acesso em: 7 jul. 2006.
MRDERO ARELLANO, M. . Preservao de documentos digitais. Cincia da Informao, Braslia, v. 33, n. 2, maio/ago 2004.
______. Preservao digital: uma preocupao dos editores de revistas cientficas eletrnicas no Brasil. In: ENCONTRO NACIONAL DE EDITORES CIENTFICOS, 9., 2007, Ouro Preto, MG. Proceedings... Ouro Preto, MG: [s. n], 2007.
______. Publicao cientfica e arquivos abertos. In: SEMINRIO NACIONAL DE BIBLIOTECAS UNIVERSITRIAS, 13., 2004, Natal. Anais... Natal: UFRN, 2004.
______; ANDRADE, R. S. Preservao digital e os profissionais da informao. DataGramaZero, v. 7, n. 5, out. 2006.
307 MARTIN, J.; COLEMAN, D. Change the metaphor: the archive as an ecosystem. The Journal of Electronic Publishing, Michigan, v. 7, n. 3, Abr. 2002. Disponvel em: <http://www.press.umich.edu/jep/07-03/martin.html>. Acesso em: 28 nov. 2005.
MAYRING, P. Introduo pesquisa social qualitativa: uma introduo para pensar qualitativamente. 5. ed. Weinheim: Beltz, 2002
MELLOR, P. CAMILEON: Emulation and BBC Domesday. RLG DigiNews, v. 7, n. 2, Apr. 2003.
______; WHEATLEY, P.; SERGEANT, D. M. Migration on request: a practical technique for preservation. In: ECDL: EUROPEAN CONFERENCE ON RESEARCH AND ADVANCED TECHNOLOGY FOR DIGITAL LIBRARIES, 6, 2002, London. Proceedings London: University of Leeds, 2002. Disponvel em: <http://www.si.umich.edu/CAMILEON/reports/migreq.pdf>. Acesso em: 14 jul. 2005.
MESSERSCHMITT, D. Opportunities for Libraries in the NSF Cyberinfrastructure Program. 2003. Disponvel em: <http://www.loc.org/standards/mets/>. Acesso em: 14 out. 2006.
MCGOVERN, N. Y. A digital decade: where have we been and where are we going in digital preservation? RLG DigiNews, v. 11, n. 1, Apr. 2007. Disponvel em: <http://digitalarchive.oclc.org/da/ViewObject.jsp?objid=0000070519&reqid=8514>. Acesso em: 28 ago. 2005.
MINAYO, M. C. S. O desafio do conhecimento. So Paulo: Hucitec; Rio de Janeiro: Abrasco, 1992.
MOEN, W. The Metadata approach to accessing government information. Government Information Quarterly, v. 18, n. 3, p. 155-165, 2001.
MOORE, R. W.; SMITH, M. Assessment of RLG trusted digital repository requirements. 2005
______; ______. Automated validation of trusted digital repository assessment criteria. JoDI, v. 8, n. 2, 2007. Disponvel em: <http://journal.tdl.org/jodi/issue/view/34>. Acesso em: 21 ago. 2006. MORGAN, C. Metadata and deposit protocols. 2000. Disponvel em: <http://bic.org.uk/Cliff%20Mrgan>. Acesso em: 28 ago. 2005.
MORRIS, S. Open access: how are publishers reacting? Serials Review, v. 30, n. 4, p. 304-307, Nov. 2004.
MUELLER, E., et al. The DiVA Project: development of an electronic publishing system. D-Lib Magazine, v. 9, n. 1, Nov. 2003. Disponvel em: <http://www.dlib/november03/muller/11muller.html>. Acesso em: 14 set. 2006.
MUIR, A. Digital preservation: awareness, responsibility and rights issues. Journal of information science, v. 30, n. 1, p. 73-92, 2004.
MULLEN, A. GILS metadata initiative at the state level. Government Information Quarterly, v. 18, n. 3, p. 167-180, Autumn 2001.
MUSEU DE ASTRONOMIA E CINCIAS AFINS. 5 curso de segurana de acervos culturais: de 7 a 11 de maio de 2007, Coordenao de Documentao em Histria da Cincia, Rio de Janeiro, 2007. 1 folder.
NATIONAL ARCHIVES OF AUSTRALIA. Recordkeeping metadata standard for commonwealth agencies. Version 1.0. 1999. Disponvel em: <http://www.naa.gov.au/recordkeeping/control/rkms/rkms_pt1_2.pdf>. Acesso em: 16 jul. 2005.
NATIONAL LIBRARY OF AUSTRALIA. Digital preservation policy. 2002. Disponvel em: <http://www.nla.gov.au/policy/digpres.html>. Acesso em: 16 nov. 2005.
_______. Guidelines for the preservation of digital heritage. Paris: UNESCO, 2003. Disponvel em: <http://unesdoc.unesco.org/images/0013/001300/130071e.pdf>. Acesso em: 25 nov. 2006.
______. Archiving web resources: issues for cultural heritage institutions. 2004. Disponvel em: <http://www.nla.gov.au/webarchiving/program.html>. Acesso em: 27 ago. 2005. NATIONAL LIBRARY OF NEW ZEALAND. Initiative. 2007. Disponvel em: <http://www.natlib.govt.nz/en/whatsnew/4initiatives.html#extraction>. Acesso em: 20 fev. 2007.
NATIONAL SCIENCE FOUNDATION. Revolutionizing science and engineering through cyberinfrastructure: report of the National Science Foundation Blue-Ribbon Advisoty Panel on Cyberinfrastructure. Washington: National Science Goundation, 2005. Disponvel em: <http://www.communitytechnology.org/nsf_ci_report/>. Acesso em: 24 fev. 2006.
NESTOR WORKING GROUP ON TRUSTED REPOSITORIES CERTIFICATION. Catalogue of criteria for trusted digital repositories. 2006. Disponvel em: <http://edoc.hu-berlin.de/series/nestor-materialien/8en/PDF/8enpdf>. Acesso em: 6 nov. 2006.
NIXON, W. The evolution of an institutional e-prints archive at the University of Glasgow. Ariadne, n. 32, jul. 2002. Disponvel em: <http://www.ariadne.ac.uk/issue32/eprint-archives/>. Acesso em: 14 abr. 2006.
OCLC RESEARCH. Preservation metadata working group II: implementation strategies. 2003. Disponvel em: <http://www.oclc.org/research/pmwg/>. Acesso em: 27 nov. 2004.
OCLC/RLG. Data dictionary for preservation metadata: final report of the PREMIS Working Group. Dublin, OH: OCLC, 2005.
______. Preservation metadata for digital objects: a review of the state of the art. 2001. Disponvel em: <http://www.oclc.org/research/projects/pmwg/presmeta_wp.pdf>. Acesso em: 28 jul. 2006.
______. Preservation metadata working group: a metadata framework to support the preservation of digital objects. Dublin, Ohio: Online Library Computer Center, 2002. Disponvel em: <http://www.oclc.org/research/pmwg/pm_framework.pdf.>. Acesso em: 14 ago. 2006.
310 OCLC/RLG PREMIS WORKING GROUP. Implementing preservation repositories for digital materials: current practice and emerging trends in the cultural heritage community. Dublin, Ohio: Online Computer Library Center, 2004. Disponvel em: <http://www.oclc.org/research/projects/pmwg/surveyreport.pdf>. Acesso em: 2 ago 2006.
OKUBO, Y. Bibliometric indicators and analysis of research systems: methods and examples. Paris: OCDE/GD, 1997.
OLTMANS, E; KOL, N. A comparison between migration and emulation in terms of costs. RLG DigiNews, v. 9, n. 2, 2005.
PEREIRA, J. C. R. Anlise de dados qualitativos: estratgias metodolgicas para as cincias da sade, humanas e sociais. 3. ed. So Paulo: Universidade de So Paulo, 2001.
PETERS, T. Digital repositories: individual, discipline-based, institutional, consortia, or national? Journal of Academic Librarianship, v. 28, n. 6, p. 414-417, Nov. 2002.
PINFIELD, S. Creating institutional e-print repositories? Serials, v.15, n.3, p. 261- 264, nov. 2002, Disponvel em: <http://eprints.nottingham.ac.uk/archive/00000064/00/serials2002.pdf>. Acesso em: 29 de jun. 2006.
______; GARDNER, M.; MACOLL, J. Setting up an institutional e-print archive. Ariadne, n. 31, Mar./Apr. 2002. Disponvel em: <http://www.ariadne.ac.uk/issue31/eprint-archives/intro.html>. Acesso em: 29 jun. 2006.
______; JAMES, H. The digital preservation of e-prints. D-Lib Magazine, v. 9, n. 9, Aug. 2003. Disponvel em: <http: www.dlib.org/dlib/september03/pinfield/09pinfield.html>. Acesso em: 4 fev. 2006.
PINHEIRO, L. V. R.; LOUREIRO, J. M. M. Traados e limites da cincia da informao. Cincia da Informao, Braslia, v. 24, n. 1, p. 42-53, jan./abril 1995.
311 PLUMMER, K. Documents of life: an Introduction to the problems and literature of a humanistic method. London: George Allen & Unwin, 1983.
POTHEN, P. Digital curation: digital archives, libraries and e-science. York, UK: Digital Preservation Coalition and the British National Space Centre, 2001. Disponvel em: <http://www.dpconline.org/graphics/events/richtext/digital- seminarrepdg.html>. Acesso em: 4 dez. 2004.
PUBLIC RECORD OFFICE VICTORIA - PROV. Victorian Electronic Records Strategy. Melbourne: 1999. Disponvel em: <http://www.prov.vic.gov.au/vers/published/final/final.pdf>. Acesso em: 10/dez/2007.
POTTER, M. Researching long term digital preservation approaches in the dutch digital preservation testbed (Testbed Digitale Bewaring). RLG DigiNews, v. 6, n. 3, June 2002. Disponvel em: <http://www.rlg.org/preserv/diginews/diginews6-3.html#feature2>. Acesso em: 5 fev. 2006.
PRITCHARD, A. Statistical bibliography or bibliometrics? Journal of Documentation, London, v. 25, n. 4, p. 348-349, Dec. 1969.
QUENAULT, H. VERS: building a digital record heritage. In: BIENNIAL CONFERENCE AND EXHIBITION OF THE VICTORIAN ASSOCIATION FOR LIBRARY AUTOMATION, 12., 2004, Austrlia. Paper presented at VALA 2004: breaking boundaries: integration and interoperability. Disponvel em: <http://www.vala.org.au/vala2004/2004pdfs/13Quena.PDF>. Acesso em: 3 nov. 2007.
REICH, V. A. Diffused knoledge immortalizes itself: the LOCKSS Program. High Energy Physics Libraries Webzine, n. 7, Jul. 2003. Disponvel em: <http://library.istl.org/02-fall/article1.html>. Acesso em: 14 jun. 2006.
______; ROSENTHAL, D. S. H. LOCKSS: a permanent web publishing and access system. D-Lib Magazine, v. 7, n.6, Jun. 2001.
RESEARCH LIBRARIES GROUP. Attributes of a trusted digital repository for digital materials: meeting the Needs for research resources. Mountain View, CA: RLG, 2001. Disponvel em: <http://www.rlg.org/longterm/attributes01.pdf>. Acesso em: 17 jul. 2006. ______. Audit checklist for certifying digital repositories. 2006. <http://www.rlg.org/en/page.php?Page_ID=20769>. Acesso em: 4 maio 2005.
312 ______. Working group on preservation issues of metadata: final report, research libraries group. Mountain View, CA: RLG, 1998. Disponvel em: <www.rlg.org/preserv/presmeta.html>. Acesso em: 12 dez. 2005.
RIBEIRO, D. O processo civilizatrio. Rio de Janeiro: Civilizao Brasileira, 1975.
RICHARDSON, R. J. et al. Pesquisa social: mtodos e tcnicas. 3. ed.rev. e ampl. So Paulo: Atlas, 1999.
______. Open Archival Information System (OAIS). Resources. 2002. Disponvel em: <http://www.rlg.org/longterm/oais.html>. Acesso em: 2 dez. 2005.
RLG-NARA. Audit checklist for certifying digital repositories. [S. l.]: RLG-NARA Task Force on Digital Repository Certification, 2006. <http://www.rlg.org/en/pdfs/rlgnara- repositorieschecklist.pdf>. Acesso em: 15 nov. 2005.
RLG/NARA TASK FORCE ON DIGITAL REPOSITORY CERTIFICATION. Trustworthy repositories audit and certification. 2007. Disponvel em: <http://www.crl.edu/PDF/trac.pdf>. Acesso em: 30 mar. 2007.
RODRIGUES, E. et. al. RepositriUM: criao e desenvolvimento do Repositrio Institucional da Universidade do Minho. In: CONGRESSO NACIONAL DE BIBLIOTECRIOS, ARQUIVISTAS E DOCUMENTALISTAS, 9., 2004., Estoril, Portugal. Anais Estoril, Portugal: [s. n.], 2004.
RODRIGUES, M. L. T. S. Preservao digital de longo prazo: estado da arte e boas prticas em repositrios digitais. 2003. Dissertao (Mestrado em Estudos de Informao e Bibliotecas Digitais) - Departamento de Cincias e Tecnologias da Informao, Lisboa, 2003.
RONDINELLI, R. C. Gerenciamento arquivsticos de documentos eletrnicos. Rio de Janeiro: FGV, 2002. 160 p.
ROSENTHAL D. S. H. et. al. Requirements for digital preservation systems: a bottom-up approach. D-Lib Magazine, v. 11, n. 11, Nov. 2005. Disponvel em:
ROTHENBERG, J. Avoiding technological quicksand: finding a viable technical foundation for digital preservation. Washington: Council on Library and Information Resources, 1999. Disponvel em: <http:// www.clir.org/pubs/reports/rothenberg/contents.html>. Acesso em: 26 jul. 2006.
______. Ensuring the longevity of digital documents. 1995. Scientific American, 272 (1), pp. 24-29. Disponvel em: <http://www.clir.org/pubs/archives/ensuring.pdf>. Acesso em: 16 nov. 2006.
______. An experiment in using emulation to preserve digital publications. Netherlands: Koninklijke Bibliotheek Den Haag, 2000. Disponvel em: <http://www.kb.nl/coop/nedlib/results/emulationpreservationreport.pdf.>. Acesso em: 9 jun. 2005.
______. Metadata to support data quality and longevity. In: IEEE METADATA CONFERENCE, 1., 1996, Silver Spring, Md. Proceedings Silver Spring, Md.: NOAA Complex, 1996. p. 16-18. <http://www.computer.org/conferences/meta96/rothenberg_Paper/ieee.data-quality. html>. Acesso em: 29 nov. 2005.
RUIZ, J. . Metodologia cientfica: guia para eficincia nos estudos. So Paulo: Atlas, 1979.
RUSSELL, K; SERGEANT, D. The Cedars Project: implementing a model for distributed archives. RLG DigiNews, v. 3, n. 3, June 1999.
SANNETT, S. Toward developing a framework of cost elements for preserving authentic electronic records into perpetuity. College & Research Libraries, v. 63, p. 388-404, Sep. 2002.
______. The cost to preserve authentic electronic records in perpetuity: comparing costs across cost models and cost frameworks. RLG DigiNews, v. 7, n. 4, Aug. 2003.
314 SANT'ANNA, M. L. Os desafios da preservao de documentos pblicos digitais. Revista IP, ano 3, n. 2, dez. 2001. Disponvel em: <http://www.informaticapublica.mg.gov.br/revista0302/ip0302santanna.pdf>. Acesso em: 18 fev. 2006.
SARACEVIC, T. Information science: origin, evolution and relations. In: VAKKARI, P., CRONIN, B. (Ed.). Conceptions of library and information science. Los Angeles: Taylor Grahan, 1992.
SAWYER, D. M. Framework for digital archiving: OAIS reference model. 2002. Presentation delivered at the OCLC Steering by Standards Teleconference on the OAIS Imperative: Enduring Record or Digital Dust? Columbus, Ohio, Apr. 19, 2002.
SAYO, L. F. Preservao digital no contexto das bibliotecas digitais: uma breve introduo. In. MARCONDES, Carlos H. et al. (Org.). Bibliotecas digitais: saberes e prticas. Salvador: EDUFBA; Braslia: IBICT, 2005. p. 115-146.
SEARLE, S.; THOMPSON, D. Preservation metadata. Pragmatic First Steps at the National Library of New Zealand. D-Lib Magazine, v. 9, n. 4, Abr. 2003. Disponvel em: <http://www.dlib.org/dlib/april03/thompson/04thompson.html>. Acesso em: 24 jan. 2006.
SELLTIZ, C. et al. Mtodos de pesquisa nas relaes sociais. So Paulo: EDUSP, 1975.
SILVERMAN, D. Doing qualitative research: a practical handbook. London: Sage Publications, 2000.
SIMPSON, D. Contracting out for digital preservation services: Information leaflet and checklist. [S. l.]: Digital Preservation Coalition, 2004.
SINCLAIR, K. The VERS standards. 2003. Disponvel em: <http://vers.imagineering.com.au/erecord_library/library.htm#voapstandard>. Acesso em: 2 abr. 2006.
SMITH, A. Long term archiving of digital documents in physics. In: INTERNATIONAL UNION OF PURE AND APPLIED PHYSICS, 2001, Lyon, France: American Physical Society, 2001. Report of the Meeting sponsored by the Working Group on Communication in Physics. Disponvel em: <http://publish.aps.org/IUPAP/Itaddp_report.html>. Acesso em: 13 jul. 2005.
315 SMITH, K. Institutional repositories and e-journal archiving: what are we learning? The Journal of Electronic Publishing, v. 11, n. 1, Winter 2008. Disponvel em: <http://hdl.handle.net/2027/spo.3336451.0011.107>. Acesso em: 16 maio 2005.
SMITH, M. Practical preservation activities. In: WORKSHOP ON LONG-TERM CURATION WHITIN DIGITAL REPOSITORIES, 2005. Resumos Cambridge, UK: MIT Libraries, 2005.
STAPLES, T; WAYLAND, R; PAYETTE, S. The Fedora Project: an open source digital repository management system. D-Lib Magazine, v. 9, n. 4, Apr. 2003. Disponvel em: <http://www.dlib.org/dlib/april03/staples/04staples.html>. Acesso em: 14 nov. 2005.
STEENBAKKERS, J. F. Preserving electronic publications. Information Services & Use, v. 22. p. 89-96, Jan. 2002.
______. Setting up a deposit system for electronic publications: the NEDLIB guidelines. NEDLIB Report Series 5, 2000. Disponvel em: <http://www.kb.nl/coop/nedlib/results/NEDLIBguidelines.pdf>. Acesso em: 14 set. 2005.
STEPHENS, D. O; WALLACE, R. C. Electronic records retention: new strategies for data life cycle management. Lenexa, KS: ARMA International, 2003.
STINSON, D; AMELI, F; ZAINO, N. Lifetime of KODAK Writable CD and Photo CD Media. Rochester, NY: Eastman Kodak Company, Digital & Applied Imaging, 1995.
SUBER, P. How should we define open access? 2003. SPARC Open Access Newsletter. Disponvel em: <https://mx2.arl.org/Lists/SPARC- OANews/Message/96.html> 2003. Acesso em: 18 de jun. de 2006.
SUTTON, S. Conceptual design and deployment of a metadata framework for educational resources on the Internet. Journal of the American Society for Information Science, v. 50, n. 13, p. 1182-1192, 1999.
SWADE, D. The problems of software conservation. History and Computing, v. 4, n. 2, 1992. Disponvel em: <http://www.cs.man.ac.uk/CCS/simulate/sim_home.htm>. Acesso em: 14 ago. 2006.
316 TANSLEY, R., et al. The Dspace Institutional digital repository system: current functionality. In: CONFERENCE ON DIGITAL LIBRARIES, 2003, Los Alamitos, CA. Proceeding Los Alamitos, CA: IEEE. p. 89-97.
TASK FORCE ON THE ARCHIVING OF DIGITAL INFORMATION. Preserving digital information: report of the task force on archiving of digital information. Washington: Commission on Preservation and Access, 1996. Disponvel em: <http://www.rlg.org/ArchTF/>. Acesso em: 28 jul. 2004.
TEPER, T. H.; KRAMER, B. Long-term retention of electronic theses and dissertations. College & Research Libraries, v. 63, n. 1 p. 61-72, 2002.
TERRIO, R. Electronic metaphors and paper realities. Progressive Librarian, v. 21, p. 28-37, 2002.
THIBODEAU, K. Overview of technological approaches to digital preservation and challenges in coming year: what does it mean to preserve digital objects? Washington: Council on Library and Information Resources, 2002. Disponvel em: <http://www.clir.org/pubs/reports/pub107/thibodeau.html>. Acesso em: 27 jan. 2004.
THOMAS, D. Digital preservation at the National Archives. London: The National Archives, [2003?]. Disponvel em: <http://www.nationalarchives.gov.uk/preservation/digitalarchive/pdf/dpattna.pdf>. Acesso em: 7 ago. 2004.
THOMAZ, K. A preservao de documentos eletrnicos de carter arquivstico: novos desafios, velhos problemas. 2004. 388 p. Tese (Doutorado em Cincia da Informao) Escola de Cincia da Informao, Universidade Federal de Minas Gerais, Belo Horizonte, 2004.
______. Repositrios digitais confiveis e certificao. Arquivistica.net, Rio de Janeiro, v. 3, n. 1, jan./jun.2007. Disponvel em: <http://www.arquivistica.net/ojs/viewarticle.php?id=118>. Acesso em: 5 mar. 2008.
______. TECH-IN. [mensagem pessoal]. Mensagem recebida por <miguel@ibict.br. em 1 nov. 2008.
______; SOARES, A. J. A preservao digital e o modelo de referncia Open Archival Information System (OAIS). Revista de Cincia da Informao, Braslia, v. 5, n. 1, fev. 2004. Disponvel em: <http://www.dgz.org.br/fev04/Art_01.htm>. Acesso em: 7 jun. 2005.
317 UNESCO. Carta para la preservacin del patrimonio digital. [Paris?]: UNESCO, 2003. Disponvel em: <http://www.arquivonacional.gov.br/conarq/cam_tec_doc_ele/preservacao/cartapres ervacao.asp>. Acesso em: 23 jul. 2004.
______. The legal deposit of electronic publications, 1998. Disponvel em: <http://www.unesco.org/webworld/memory/legaldep.htm>. Acesso em: 18 nov. 2006.
______. Recomendaes sobre Software Livre para Repositrio e Sistema de Preservao. Paris: UNESCO, 2007.
VAN BOGART, J. W. Magnetic tape storage and handling: a guide for libraries and archives. Washington: Commission on Preservation and Access, 1995.
VAN DE SOMPEL, H.; LAGOZE, C. The Santa Fe Convention of the Open Archives Initiative. D-lib Magazine, v. 6, n. 2, Feb. 2000. Disponvel em: <http://www.dlib.org>. Acesso em: 14 fev. 2006.
VAN NUYS, C. The Paradigma Project. RLG DigiNews, v. 7, n. 2, Apr. 2003. Disponvel em: http://worldcat.org/arcviewer/1/OCC/2007/08/08/0000070511/viewer/file3600.html#fe ature2. Acesso em: 31 out. 2008.
WAIBEL, G. Produce, publish and preserve: a holistic approach to digital assets management. Journal of the Museum Computer Network, Spectra, v. 26, n. 7, 2000. Disponvel em: <http://www.bampfa.berkeley.edu/moac/imaging/index.html>. Acesso em: 7 ago. 2006.
WALKER, F. L.; THOMA, G. R. A web-based paradigm for file migration. In: ARCHIVING CONFERENCE, 2004, San Antonio, Texas, USA. Proceedings San Antonio, Texas, USA: IS&Ts, 2004.
WATERS, D.; GARRETT, J. Preserving digital information: report of the task force on archiving of digital information commissioned. Washington, DC: Commission on Preservation and Access. 1996.
WEBB, C. The role of preservation and the library of the future. [S. l.]: National Library of Australia, 2000. Disponvel em: <http://www.nla.gov.au/nla/staffpaper/cwebb9.html>. Acesso em: 17 nov. 2006.
318 WHEATLEY, P. Institutional repositories in the context of digital preservation. Leeds: University of Leeds, 2004.
______. A way forward for developments in the digital preservation functions of dspace: options, issues and recommendations. 2003. Disponvel em: <http://dspace.org/news/articles/DpAndDSpace.pdf>. Acesso em: 14 jul. 2007.
WIGGINS, Richard. Digital preservation: paradox and promise. Library Journal, p. 12-15, spring 2001.
WIPO COPYRIGHT TREATY. In: DIPLOMATIC CONFERENCE ON CERTAIN COPYRIGHT AND NEIGHBORING RIGHTS QUESTIONS, 10., 1996, Geneva. Anais Geneva: International Bureau of WIPO, 1996. Disponvel em: <http://www.wipo.int/eng/diplconf/distrib/94dc.htm>. Acesso em: 10 mar. 2005.
WOODS, A. When preserving the past: think of the future. Multimedia Information and Technology, v. 28, n. 3, p. 71-72, 1998.
ZENG, M. Metadata elements for object description and representation: a case report from a digitized historical fashion collection project. Journal of the American Society for Information Science, v. 50, p. 1193-1208, 1999.
319 APNDICE A Questionrio
Levantamento de dados
Instituio: Endereo: Site: Responsvel pelo(a) Biblioteca/Centro de Informao/Arquivo
Nmero de servidores Biblioteca/Centro de Informao/Arquivo: Tcnico (Bibliotecrios)
Auxiliares:
Situao administrativa da Biblioteca/Centro de Informao/Arquivo: ( ) Central ( ) Setorial ( ) especializada ( ) abrangncia geral
Informaes quanto ao tratamento dado aos seguintes tipos de materiais:
FORMA DE ACESSO AO CONTEDO TIPO DE MATERIAL SISTEMA ONLINE? QUAL SOFTWARE UTILIZA? SETOR RESPONSVEL UTILIZA FERRAMENTA INDEXAO? QUAL? BIBLIOGRFICO TEXTO COMPLETO Monografias (livros/ anais/ teses/dissertaes )
Analticas (captulos de livros)
Peridicos Artigos revistas Comunicaes em eventos
Multimeios (filmes, CDs, DVDs, fotografias etc.)
TCC/Trabalhos experimentais
Produo docente Outros .....
Obs.: (1) sistema on-line => mencionar se os diversos tipos de materiais esto recebendo algum tipo de tratamento e se este tratamento j est automatizado. Se sim, qual o software utilizado. (2) Setor responsvel => existncia de algum banco de dados interessante na rea e que no necessariamente est na Biblioteca. (3) Ferramenta de indexao => informar qual o vocabulrio e/ou tesauro est sendo utilizado, e se h o desenvolvimento pela unidade de algum vocabulrio e/ou tesauro especfico para o tratamento e controle da indexao.
320 Classificao, armazenamento e conservao da produo cientifica da unidade Igual a do acervo geral Especfico para a coleo Classificao Forma de armazenamento Metodologia para conservao (em qualquer suporte)
Caso utilize um tratamento especifico para a coleo, informe como feito: Classificao Forma de armazenamento Metodologia para conservao (em qualquer suporte)
Descrio do tratamento dado aos materiais digitais: Sim No Aplicao de metodologia de digitalizao Aplicao de estratgia de preservao: Participao em iniciativa nacional/internacional de preservao digital:
321 APNDICE B Roteiros de entrevistas
Roteiros das entrevistas com representantes das unidades de pesquisa do MCT
Primeiro Roteiro de Entrevista (Aplicado em eventos cientficos)
Primeiro grupo: formao profissional e caractersticas socioespaciais das tarefas realizadas pelo entrevistado: f) profisso g) titulao mxima h) tempo de servio i) cargo ocupado atualmente j) tempo no cargo atual
Segundo grupo: descrio das atividades desenvolvidas pelos respondentes que envolvem algum tipo de tratamento tcnico nos arquivos digitais da instituio: g) Quais atividades cientficas so realizadas pela sua instituio? h) Que tipo de produo cientfica j est em formato digital? i) Quem so os usurios dessa produo cientfica? j) Quais atividades de preservao de documentos digitais esto sendo realizadas pela sua instituio?
Terceiro grupo: opinies sobre o material a ser preservado e seus responsveis: k) Qual produo cientfica deve ser preservada pela sua instituio? l) Quem so os responsveis por essas atividades de preservao?
Segundo Roteiro de Entrevista (Aplicado nas sedes das UPs)
1. Conferindo a identificao individual (Nome, faixa etria, profisso, titulao, cargo, tempo de trabalho na instituio, tempo no cargo)
2. Conferindo a identificao da unidade (Nome, localizao, histrico)
3. Conferindo as informaes institucionais (Atividades cientficas, linhas de pesquisa, tipo de produo cientfica, publicaes)
4. Conferindo as informaes institucionais do setor da Biblioteca/Centro de Informao e do Setor de Informtica (Dados na descrio oficial, tipo de usurios, site)
5. Atualizao dos dados coletados no questionrio enviado em 2004 5.1 Funcionrios 5.2 Tipo de biblioteca 5.3 Tipo de material/ferramentas de software 5.4 Tipo de material/ setor responsvel 5.5 Tipo de material/Ferramenta de indexao 5.6 Tipo de material/Tipo de registro para acesso
322 5.7 Tratamento da produo cientfica (classificao, armazenamento e conservao) 5.8 Tratamento da produo cientfica em formato digital (digitalizao, estratgia de preservao, participao em iniciativa)
6. Descrio do registro da produo cientfica da instituio (gerenciamento do registro da produo)
7. Descrio do ciclo de vida da produo cientfica em formato digital na instituio (tipo de documentos, tratamento)
8. Funcionrios do setor de informtica que atendem biblioteca 8.1 Tipo de atendimento 8.2 Tipo de software/infra-estrutura 8.3 Setor responsvel 8.4 Gerenciamento de sistemas 5.6 Segurana 5.7 Recuperao de desastres 5.8 Suporte preservao digital (Formatos de identificao, validao, extrao de metadados, normalizao de entrada de dados; replicao de contedo; migrao de verses; emulao).
9. Descrio do tratamento dos acervos digitais pelo setor de suporte tcnico da instituio (atividades de armazenamento, segurana e preservao dos dados)
10. Viso pessoal sobre a preservao digital da produo tcnico-cientfica na unidade (Opinio e plano de preservao digital para a instituio)
323 APNDICE C Lista de projetos e iniciativas de preservao digital
5. Assessment of UK Data Archive and The National Archives compliance with OAIS/METS URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/assetmanagement/oai s.aspx
6. Auditing and Certification of Digital Archives URL: http://digitalarchive.oclc.org/
14. Canadian National Digital Inventory URL: http://www.library.uiuc.edu/spx/inventory/projects.html
15. CEDARS - CURL Exemplars in Digital Archives URL: http://www.leeds.ac.uk/cedars/
16. CENSA (Collaborative Electronic Notebook Systems Associations) URL: http://www.censa.org/
17. CHIN: Creation and Managing Digital Content URL: http://www.chin.gc.ca/English/About_Chin/chin.html
324
18. Clinical Data Interchange Standards Consortium (CDISC) URL: http://www.cdisc.org/
19. CMS Metadata Interoperability Project: Ensuring Metadata Interoperability Across Scottish Content Management Systems and Digital Repositories URL: http://cms.cdlr.strath.ac.uk/
21. Council for the Central Laboratory of the Research Councils (CCLRC) URL:http://www.hero.ac.uk/uk/reference_and_subject_resources/resources/opacs_in _britain_and_ireland_obi/obi_council_for_the_central_la4756.cfm
22. DAAT: Digital Asset Assessment Tool URL: ahds.ac.uk/about/projects/daat/
23. DELOS/NSF study on the digital preservation research agenda URL: http://www.dpconline.org/graphics/whatsnew/issue12.html
47. ERA: Electronic Records Archive Program URL: http://www.diglib.org/preserve/ERA2004.htm
48. EROS: Electronic Records in Office Systems URL: http://www.nationalarchives.gov.uk/recordsmanagement/
49. ERPANET Project URL: http://www.erpanet.org/
50. E-Science Data Curation Audit URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/escience.aspx
51. European Museums Information Institute URL: http://www.emii.org/map/
52. EVA project URL: http://www.evaproject.it/
326 53. Feasibility Study On E-Prints URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/eprints.aspx
54. FEDORA URL: http://fedoraproject.org/
55. Fedora (Flexible Extensible Digital Object Repository Architecture) Cornell University and the University of Virginia Library URL: http://blog.eukhost.com/webhosting/flexible-extensible-digital-object-repository- architecture/
56. File integrity and identification URL: http://www.freepatentsonline.com/7043495.html
57. HEDS - Higher Education Digitisation Service URL: http://heds.herts.ac.uk/
112. Strategic Partnerships With Industry Research & Training SPIRT Australian RecordKeeping Metadata Schema URL: http://www.sims.monash.edu.au/research/rcrg/research/spirt/
113. UKDA URL: http://www.data-archive.ac.uk/
114. UKWAC (UK Web Archiving Consortium) URL: http://www.webarchive.org.uk/
117. VERS: Victorian Electronic Records Strategy The Victorian Electronic Records System (VERS) URL: http://www.prov.vic.gov.au/vers/standard/advice_12/7-2.htm
118. Voluntary Deposit of Electronic Publications (VDEP) URL: http://www.dpconline.org/graphics/join/life.html
119. Web Archiving: UK Central Government Web Archive URL: http://www.nationalarchives.gov.uk/nowhere/
120. Web-archiving feasibility study URL:http://www.jisc.ac.uk/whatwedo/programmes/preservation/webarchiving.aspx
330 APNDICE D Centros de informao e bibliotecas das unidades de pesquisa do Ministrio da Cincia e Tecnologia
Nome: Agncia Espacial Brasileira - AEB Biblioteca: Diretoria Planejamento Oramento e Administrao - DPOA Endereo: SPO - rea 5 - Quadra 3 Bloco A, 1 andar CEP 70610-200 Braslia DF URL: http://www.aeb.gov.br Descrio: Misso Foi criada em 10 de fevereiro de 1994, pela Lei N 8.854. Atendendo a uma antiga reivindicao da comunidade cientfica e tecnolgica brasileira, a AEB nasceu com o objetivo de promover o desenvolvimento das atividades espaciais brasileiras de forma descentralizada.
Autarquia vinculada ao Ministrio da Cincia e Tecnologia
Unidade de documentao No tem unidade de documentao.
Publicaes on-line
Permite acesso on-line aos seus relatrios de gesto e outras publicaes.
Nome: Centro Brasileiro de Pesquisa Fsica - CBPF Biblioteca: Coordenao de Documentao e Informao Cientfica CDI Biblioteca do CBPF Endereo: Rua Dr. Xavier Sigaud, 150 Ed. Csar Lattes, Urca 22290.180 - Rio de Janeiro - RJ URL: http://www.biblioteca.cbpf.br Descrio: Misso Realizar pesquisa bsica em Fsica e desenvolver suas aplicaes, atuando como instituto nacional de Fsica do Ministrio da Cincia e Tecnologia e plo de investigao cientfica e de formao, treinamento e aperfeioamento de pessoal cientfico.
Em 1976 recebeu recursos financeiros do governo federal para a manuteno das linhas de pesquisa e implantao dos laboratrios de clculo numrico e de instrumentao.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao A Biblioteca do Centro Brasileiro de Pesquisas Fsicas, fundada em 1949, uma das bibliotecas nacionais de referncia na rea de Fsica, tendo atualmente um acervo de aproximadamente 21.000 livros e 850 ttulos de peridicos (240 correntes), em Fsica e cincias afins. Parcialmente destruda em 1959 por um incndio, foi reconstruda graas solidariedade da comunidade nacional e internacional. Constam de seu acervo peridicos de grande importncia histrica, como The Philosophical Magazine (1800), Comptes Rendus des Sances de L'Acadmie des Sciences (1835), Philosophical Transactions of the Royal Society of London (1875), Proceedings of the Royal Society of London (1877), entre outros.
331
Outras informaes A rea de Informao Cientfica ( AIC ) tem por finalidade promover o intercmbio da documentao e informao no campo da Fsica, e desenvolver trabalhos cientficos e tcnicos nesta rea de informao. Para atingir esse objetivo a AIC coleta, organiza, atualiza e divulga servios e produtos necessrios obteno de informaes. Dentre os seus servios e produtos destaca-se a Memria da Produo Tcnico-Cientfica do CBPF cujo objetivo registrar e disseminar todo trabalho produzido ou em andamento, de forma escrita ou oral, dos pesquisadores, tcnicos e alunos de ps-graduao do CBPF, isoladamente ou em colaborao com pesquisadores brasileiros e estrangeiros de outras instituies. Cada volume da Memria cobre o perodo de um ano. A AIC tambm disponibiliza os preprints recebidos de instituies nacionais e estrangeiras atravs de exposio organizada por instituio
Disponibiliza acesso on-line aos seus relatrios de gesto e outras publicaes em sua pgina na web.
Publicaes on-line
Permite acesso on-line aos seus relatrios de gesto e outras publicaes.
Equipe: Alberto Passos Guimares Filho Coordenador Justina de Ftima Bacellar Couto Coordenadora Substituta
Nome: Centro de Excelncia em Tecnologia Eletrnica Avanada - CEITEC Biblioteca: Endereo: Estrada Joo de Oliveira Remio, 777, Porto Alegre - RS Brasil - Cep: 91550-000 URL: http://www.ceitecmicrossistemas.org.br/portal/home.php Descrio: Misso
Desenvolver solues inovadoras em eletrnica e tecnologias da informao, com alto padro de qualidade, atendendo s necessidades do mercado.
Empresa vinculada ao Ministrio da Cincia e Tecnologia
Unidade de documentao
No possui unidade de documentao.
Publicaes on-line
Permite acesso on-line a artigos e trabalhos apresentados em seminrios, worshop etc.
332 Nome: Centro de Tecnologia da Informao Renato Archer CTI (antigo CENPRA) Biblioteca: Biblioteca Sede Endereo: Rodovia D. Pedro I, km 143,6 Amarais CEP 13082-120 Campinas - SP URL: http://www.cenpra.gov.br Descrio: Misso
Gerar, aplicar e disseminar conhecimentos em Tecnologia da Informao, em articulao com os agentes socioeconmicos, promovendo inovaes que atendam s necessidades da sociedade.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
Possui unidade de documentao, mas no disponibiliza base de dados para acesso on-line.
Disponibiliza artigos e trabalhos em sua pginas na web.
Publicaes on-line
Permite acesso on-line a artigos e outros trabalhos, de autoria dos seus colaboradores, publicados em revista especializada. Equipe: 1 Bibliotecria responsvel
Unidade: Centro de Tecnologia Mineral - CETEM Biblioteca: Servio de Informao - SEDIN Endereo: Avenida Ip, no. 900 - Ilha da Cidade Universitria 21941-590 - Rio de Janeiro - RJ URL: http://www.cetem.gov.br/biblioteca.htm Descrio: Misso
Desenvolver tecnologia para o processamento do uso sustentvel dos recursos minerais brasileiros.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
A biblioteca destina-se a dar apoio a todas as atividades de pesquisa do CETEM. uma biblioteca de referncia, especializada na rea de tecnologia mineral, processos mnero-metalrgicos e tecnologia ambiental. A biblioteca conta com um acervo de 9178 livros, mantm 97 assinaturas de peridicos cientficos especializados e rene toda a produo tcnico-cientfica da organizao, constituda de 5459 relatrios tcnicos. Tambm fazem parte de seu acervo s teses dos colaboradores e os 221 volumes editados atravs das Sries Qualidades e Produtividade, Estudos e Documentos, Tecnologia Ambiental, Tecnologia Mineral, Rochas e Minerais Industriais, Jornadas de Iniciao Cientfica e avulsos.
Publicaes on-line
Permite acesso on-line a publicaes editadas pelo CETEM.
333
Equipe: Coordenao da Biblioteca - Jackson de Figueiredo Neto Responsvel da Biblioteca - Ana Maria S de Oliveira Processamento Tcnico - Snia Maria Mamede Loureno
Nome: Centro de Excelncia em Tecnologia Eletrnica Avanada - CETENE Biblioteca: Endereo: Av. Professor Lus Freire, 1 - Cidade Universitria CEP. 50740-540 - Recife - PE URL: http://www.inpe.br Descrio: Misso
Desenvolver, introduzir e aperfeioar inovaes tecnolgicas que tenham carter estratgico para o desenvolvimento econmico e social da regio Nordeste, promovendo cooperaes baseadas em redes de conhecimento e nos agentes da economia nordestina.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
No possui unidade de documentao.
Publicaes on-line
Permite acesso on-line a fotos, relatrio, vdeos e artigos atravs da Biblioteca Virtual.
Nome: Centro de Gesto e Estudos Estratgicos - CGEE Biblioteca: Ncleo Centro de informaes Endereo: SCN Quadra 2, Bloco A, Ed. Corporate Center Financial Center, 11 andar, Salas 1102 e 1103 CEP 70712-900 - Braslia-DF URL: http://www.cgee.org.br Descrio: Misso
Promover e realizar estudos e pesquisas prospectivas de alto nvel na rea de cincia e tecnologia e suas relaes com setores produtivos, bem como realizar atividades de avaliao de estratgicas e de impactos econmicos e sociais das polticas, programas e projetos cientficos e tecnolgicos, alm de difundir informaes, experincias e projetos sociedade.
Organizao Social, vinculada ao Ministrio da Cincia e Tecnologia.
Unidade de documentao
No possui unidade de documentao.
Publicaes on-line
Permite acesso on-line a publicaes editadas pelo CGEE.
Equipe: 1 Cientista da Informao 1 Analista 1 Bibliotecria 2 Tcnicos de informao
334
Nome: Comisso Nacional de Energia Nuclear - CNEN Biblioteca: Biblioteca Sede Unidades subordinadas Comisso Nacional de Energia Nuclear em 2007: CRCN-NE; CRCN-CO; CDTN ; IEN ; IPEN; IRD At 2006 eram 14 unidades vinculadas ao CNEN. Endereo: Rua General Severiano, 90 Botafogo CEP 22294-900 - Rio de Janeiro - RJ URL: http://www.cnen.gov.br Descrio: Misso
Garantir o uso seguro e pacfico a energia nuclear, desenvolver e disponibilizar tecnologia nuclear e correlata, visando ao bem- estar da populao.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao Encontra-se em fase de implantao a Rede de Bibliotecas da CNEN, cujo objetivo proporcionar um funcionamento integrado, com otimizao dos processos tcnicos e administrativos de gerenciamento das colees, ampliando a abrangncia de consulta e servios de informaes bibliogrficas especializadas prestadas comunidade cientfica. A Rede composta por sete bibliotecas, sendo coordenada pelo Centro de Informaes Nucleares - CIN.
Centro de Desenvolvimento da Tecnologia Nuclear CDTN Belo Horizonte - MG biblio@cdtn.br Centro Regional de Cincias Nucleares do Centro-Oeste - CRCN-CO Goinia - GO elaine@cnen.gov.br Centro Regional de Cincias Nucleares do Nordeste CRCN-NE Recife - PE bibliotecacrcn@cnen.gov.br Instituto de Engenharia Nuclear IEN Rio de Janeiro - RJ biblioteca@ien.gov.br Instituto de Pesquisas Energticas e Nucleares IPEN So Paulo - SP bibli@ipen.br Instituto de Radioproteo e Dosimetria - IRD Rio de Janeiro - RJ bibli@ird.gov.br Sede Rio de Janeiro - RJ btc@cnen.gov.br]
Disponibiliza Outras informaes
ANAIS - CATLOGO COLETIVO DE ANAIS DE EVENTOS Base de dados cooperativa, coordenada pelo CIN/CNEN e aberta a participao de instituies que desejem compartilhar seus acervos. Esta base de dados inclui dados bibliogrficos de todo tipo de anais de eventos como conferncias, simpsios, congressos, reunies e outros realizados no Brasil ou no exterior e que se encontram disponveis nos acervos de bibliotecas brasileiras e de algumas latino-americanas. As informaes contidas nos registros so fornecidas pelas bibliotecas cooperantes e padronizadas pelo CIN. Perodo: Ilimitado - inclui informaes a partir de qualquer data. Atualizao: mensal
CATLOGO COLETIVO DE NORMAS TCNICAS Base de dados cooperativa, coordenada pelo CIN/CNEN e aberta a participao de instituies que desejem compartilhar seus acervos. Arrola informaes sobre normas tcnicas
335 nacionais e estrangeiras existentes nos acervos de bibliotecas brasileiras. As informaes contidas nos registros so fornecidas pelas bibliotecas cooperantes e padronizadas pelo CIN. Perodo: Ilimitado: inclui informaes a partir de qualquer data. Atualizao: mensal
Base INIS - Energia Nuclear Sistema cooperativo com a participao de mais de 120 pases e organizaes internacionais. O principal produto do sistema base de dados bibliogrficos INIS. Esta base tem a mais completa cobertura sobre aplicaes pacficas da cincia e tecnologia nucleares. Atualmente, a base contem mais de 2,9 milhes de registros sendo a fonte mundial mais completa sobre literatura tcnico-cientfica na rea nuclear. Atravs do CIN, Centro de Informaes Nucleares, servios de informao tcnico-cientfica com a base de dados INIS esto disponveis gratuitamente no Brasil.
Base Energy - Tecnologias de Energia A participao da Comisso Nacional de Energia Nuclear (CNEN) no Energy Technology Data Exchange (ETDE) tornou disponvel no Brasil a base de dados ENERGY, formada por este sistema e abrangendo todas as tecnologias de energia. A CNEN, atravs do CIN - Centro de Informaes Nucleares incorpora a literatura brasileira base de dados ENERGY, divulgando, no pas e no exterior a produo cientfica brasileira. O acesso base de dados via Internet, gratuito no Brasil para os usurios cadastrados. Os demais pases que participam do ETDE, incluindo sua literatura nacional na base Energy, so Alemanha, Canad, Coria, Dinamarca, Espanha, Estados Unidos, Finlndia, Frana, Holanda, Inglaterra, Mxico, Noruega, Portugal, Sucia e Sua. LivRe! - Revistas na Web Relaciona peridicos eletrnicos de acesso livre na Internet.
PERIDICOS - SEDE Contm os ttulos das revistas e os fascculos existentes na biblioteca da Sede. Tambm esto includos nesta base as sries da IAEA como Safety Series e Technical Report Series e a coleo de relatrios anuais de instituies nacionais e estrangeiras. Atualizao: mensal
RELATRIOS Contm informaes sobre os relatrios tcnico-cientficos e as normas tcnicas pertencentes ao acervo da Biblioteca da CNEN/CIN. Perodo: Ilimitado - inclui informaes a partir de qualquer data. Atualizao: mensal
Equipe: Maria Emilia Frade de Mello
Nome: Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico - CNPq Biblioteca: Biblioteca Lygia Portocarrero Velloso Endereo: SEPN 507, Bloco "B", Ed. Sede CNPq CEP 70.740-901 - Braslia - DF URL: http://www.cnpq.br/ Descrio: Misso
336 Promover e fomentar o desenvolvimento cientfico e tecnolgico do Pas e contribuir na formulao das polticas nacionais de cincia e tecnologia.
Fundao vinculada ao Ministrio da Cincia e Tecnologia
Unidade de documentao
Inicialmente, o acervo do CPO constitui-se a partir do acervo do Centro de Documentao - CDO - criado em 1977 e extinto em 1980, e, sobretudo da biblioteca trazida da antiga SUP - Superintendncia de Planejamento, que funcionava no Rio de Janeiro. O acervo tambm era formado de publicaes do Conselho, mesmo as anteriores a criao do CPO, e de doaes pessoais. (Perspicillum, 1987). Aps a extino arbitraria do CPO, seu acervo foi transferido para o IBICT e teve parte de seus peridicos incorporados a Biblioteca deste. Posteriormente o acervo foi transferido para a Biblioteca do Ministrio da Cincia e Tecnologia - MCT, para finalmente retornar ao CNPq em abril de 2004. Na sua configurao atual a Biblioteca Lygia Portocarrero Velloso possui um recorte temtico com obras especializadas em polticas e histria da cincia e tecnologia, com cerca de 30.000 volumes, como por exemplo, livros nacionais e estrangeiros, peridicos especializados, publicaes de tcnicos do CNPq, relatrios, obras de referncia, entre outros. Em 2001 foi criado o Centro de Memria Institucional do CNPq, vinculado vice-presidncia.
Publicaes on-line
Permite acesso on-line a publicaes editadas pelo CNPq
Equipe: Roberto Muniz Barretto de Carvalho - Chefe do Servio de Documentao e Acervo SEDOC Maria Aliette Peixoto Wanderley Responsvel pela Biblioteca Patrcia Simas de Andrade - Bibliotecria
Nome: Financiadora de Estudos e Projetos - FINEP Biblioteca: Biblioteca Servio de Informao Endereo: Praia do Flamengo, n 200 CEP 20210-030 Rio de Janeiro RJ URL: http://www.finep.gov.br/ Descrio: Misso
Promover e financiar a inovao e pesquisa cientfica e tecnolgica em empresas, universidades, institutos tecnolgicos, centros de pesquisa e outras instituies pblicas ou privadas, mobilizando recursos financeiros e integrando instrumentos para o desenvolvimento econmico e social do Pas.
Empresa pblica vinculada ao Ministrio da Cincia e Tecnologia
Unidade de documentao
A Biblioteca foi criada em 1973 e tem como objetivo assessorar e apoiar as atividades desenvolvidas pela FINEP na busca, acesso e disseminao do seu acervo, contribuindo para gerao de novos conhecimentos. Desde 1997, a Biblioteca
337 utiliza o Sistema SYSBIBLI, que permite a apresentao do catlogo on line disponvel na internet. A coleo est orientada para o desenvolvimento de temas relacionados Cincia e Tecnologia e o acervo de aproximadamente 20.000 documentos composto de livros, peridicos, artigos e material multimdia.
Outras informaes
Biblioteca Virtual de Inovao Tecnolgica resultado de uma ao conjunta envolvendo a FINEP e o Programa Prossiga/CNPq. Renem de forma estruturada e seletiva, sites brasileiros e estrangeiros contendo informaes relevantes sobre inovao tecnolgica, em seus mltiplos aspectos.
Portal Capital de Risco Brasil Tem como objetivo a construo de um ambiente institucional que favorea o desenvolvimento do capital de risco, de forma a estimular o fortalecimento das empresas nascentes e emergentes de base tecnolgica brasileiras, contribuindo, em ltima instncia, para o desenvolvimento tecnolgico nacional, bem como para a gerao de emprego e renda.
Publicaes on-line
Permite acesso on-line a publicaes editadas pelo FINEP
Equipe: 2 Bibliotecrias
Nome: Instituto Brasileiro de Informao em Cincia e Tecnologia - IBICT Biblioteca: Biblioteca Endereo: SAS Quadra 5, Lote 6, Bloco H 70070.912 - Braslia - DF URL: http://www.ibict.br Descrio: Misso
Promover a competncia e o desenvolvimento de recursos e infra-estrutura de informao em Cincia e Tecnologia para a produo, a socializao e a integrao do conhecimento cientfico-tecnolgico.
Unidade de pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
Criada no mesmo ano da inaugurao do Instituto 1954. Atuar como biblioteca especializada em cincia da informao e biblioteconomia, tendo em seu acervo monografias, peridicos, anais de eventos, normas tcnicas, materiais alternativos, obras de referncia, teses e dissertaes em cincia da informao, memria tcnica. Em 23 de fevereiro de 2005, a Biblioteca do Ibict automatizou seus produtos e servios com a aquisio do software PHL (Personal Home Library), incorporando a base Literatura em Cincia da Informao (LICI).
Publicaes on-line
Permite acesso on-line as revistas: Cincia da Informao; Incluso Social e Liinc
338
Equipe: Priscilla Mara Bermudes Arajo - Chefe do Setor da Biblioteca Suzelayne Eustquio de Azevedo - Atendimento Walter Alves Nascimento Junior - Atendimento
Nome: Instituto de Desenvolvimento Sustentvel Mamirau - IDSM Biblioteca: Biblioteca Sede Endereo: UFPA Campus do Guam Departamento de Antropologia (CFCH) Caixa Postal: 531 66073.250 - Belm - PA URL: http://www.mamiraua.org.br/ Descrio: Misso
Promover pesquisa cientfica para a conservao da biodiversidade por meio de manejo participativo e sustentvel dos recursos naturais na Amaznia.
Organizao Social vinculada ao Ministrio da Cincia e Tecnologia
Unidade de documentao
No possua biblioteca at 2007
Publicaes on-line
Permite acesso on-line a artigos e outros trabalhos, de autoria dos seus colaboradores, publicados em revista especializada.
Nome: Associao Instituto de Matemtica Pura e Aplicada - IMPA Biblioteca: Biblioteca Sede Endereo: Estrada Dona Castorina, 110 Ed. Llio Gama, Jardim Botnico 22460.320 - Rio de Janeiro - RJ URL: http://www.impa.br/ Descrio: Misso
Realizar pesquisas em cincias matemticas e afins, formar pesquisadores, disseminar o conhecimento matemtico em todos os seus nveis e integr-lo com outras reas da Cincia, Cultura, Educao e do setor produtivo.
Organizao Social vinculada ao Ministrio da Cincia e Tecnologia
Unidade de documentao
Especializada em Matemtica Pura e Aplicada, possui um notvel acervo de cerca de 30.000 volumes em livros clssicos e modernos, alm de cerca de 30.000 volumes em peridicos, correspondendo a 670 ttulos dos mais importantes em Matemtica e reas cientficas mais afins. considerada de excelente nvel em padro internacional.
Publicaes on-line
Permite acesso on-line a publicaes editadas pelo FINEP
339
Equipe: Maria da Graa Arajo Penna Duarte 1 Bibliotecrias 2 Tcnicos auxiliares 1 Analista
Nome: Indstrias Nucleares do Brasil - INB Biblioteca: Endereo: Rua Mena Barreto, 161 Botafogo - 22271-100 - Rio de Janeiro - RJ - Brasil URL: http://www.inb.gov.br/ Descrio: Misso
Explorao do urnio, desde a minerao e o beneficiamento primrio at a produo e montagem dos elementos combustveis que acionam os reatores de usinas nucleares. O conjunto dessas atividades constitui o Ciclo do Combustvel Nuclear. Atua tambm na rea de tratamento fsico dos minerais pesados com a prospeco e pesquisa, lavra, industrializao e comercializao das areias monazticas e obteno de terras-raras.
Empresa de economia mista, vinculada Comisso Nacional de Energia Nuclear - (CNEN) e subordinada ao Ministrio da Cincia e Tecnologia.
Unidade de documentao
O acervo da biblioteca constitudo basicamente de normas tcnicas nacionais e estrangeiras para atender s necessidades das duas fbricas de combustvel nuclear.
Publicaes on-line
No possui publicaes para acesso on-line.
Equipe: Gilda Menezes
Nome: Instituto Nacional de Pesquisa da Amaznia - INPA Biblioteca: Biblioteca Endereo: Avenida Andr Arajo, 2936, Petrpolis Manaus, Amazonas CEP 69083-000 Manaus - AM URL: http://www.biblioteca.inpa.gov.br Descrio: Misso
Gerar e disseminar conhecimentos e tecnologias e capacitar recursos humanos para o desenvolvimento da Amaznia.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
Criada em julho de 1954, possui um acervo com mais de 199 mil ttulos voltados s Cincias Puras e Aplicadas com nfase s Cincias Biolgicas e rene uma das maiores bibliografias nacionais sobre a Amaznia. A biblioteca constituiu-se a partir do acervo particular do eminente botnico Joo Barbosa Rodrigues (1842-1909), fundador do Museu Botnico do Amazonas e diretor do Museu Nacional do Rio de Janeiro.
340 A Diviso de Publicaes Seriadas rene no acervo 7.472 mil ttulos de publicaes peridicas, tcnica cientfica. Dentre esses ttulos encontra-se a coleo completa do peridico Acta Amaznica, que divulga os trabalhos dos pesquisadores do INPA e de outras instituies. Possui uma coleo de Obras Raras e Especiais que se destaca por sua importncia cientfica e institucional. O acervo de aproximadamente 3 mil exemplares rene raridades dos sculos XVII, XVIII e XIX. Encontram-se obras clssicas de Wallace, Bates e Darwi.
Publicaes on-line
Permite acesso on-line a publicaes editadas pelo INPA, em destaque a revista Acta Amazonica Equipe: 1 Bibliotecria responsvel
Nome: Instituto Nacional de Pesquisas Espaciais - INPE Biblioteca: Servio de Informao e Documentao - SID Endereo: Av. dos Astronautas,1.758 12227.010 - So Jos dos Campos - SP URL: http://www.inpe.br/biblioteca/ Descrio: Misso
Promover e executar estudos, pesquisas cientficas, desenvolvimento tecnolgico e capacitao de recursos humanos nos campos da Cincia Espacial e da Atmosfera, das Aplicaes Espaciais, da Meteorologia e da Engenharia e Tecnologia Espacial, bem como em domnios correlatos.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao Criada em 1965, com a misso especfica de promover informao especializada para a comunidade tcnico-cientfica do instituto, o acervo fsico dispe atualmente de mais de 73.000 volumes entre livros, teses, relatrios e mapas, e mais de 160.000 fascculos de peridicos. Possui ainda uma Mapoteca composta por aproximadamente 4.800 mapas, entre cartas topogrficas, imagens de radar e de satlite, cartas nuticas, mapas polticos, hidrogrficos, geolgicos, Projeto RADAM, e outras publicaes como atlas, enciclopdias, estudo de guas subterrneas e aptido agrcola dos solos. Possui acervo digital, oferecendo acesso a mais de 6000 documentos eletrnicos, como por exemplo: e-prints, livros on- line, teses e dissertaes
Outras informaes
Biblioteca Digital
Atualmente o acervo oferece acesso a mais de 6000 documentos eletrnicos como, por exemplo: e-prints, livros on- line, teses e dissertaes. Alm disso foi desenvolvida uma nova interface de busca para a Biblioteca Digital, adaptada ao novo padro do portal, com opes de busca rpida e busca combinada. Desde 2003, a Biblioteca Digital tornou-se um provedor de
341 dados, conforme o padro internacional OAI-PMH ("Open Archives Initiative Protocol for Metadata Harvesting"), fazendo com que os trabalhos armazenados no acervo estejam acessveis a partir dos provedores de servios OAI espalhados pelo mundo. Assim, os trabalhos do INPE constam, por exemplo, na base de dados da Universidade de Michigan - OAIster (com mais de 9 milhes de referncias) e na base de dados da Biblioteca Digital de Teses e Dissertaes (BDTD) do IBICT. A Biblioteca Digital tambm tem fornecido ao INPE os Indicadores da sua produo tcnico-cientfica para os anos de 2006, 2005, 2004, 2003 e 2002.
Equipe: Marciana Leite Ribeiro Chefe de Servio de Informao e Documentao Tcnicos bibliotecrios, auxiliares e analistas - 10
Nome: Instituto Nacional do Semi-rido - INSA Biblioteca: Endereo: Av. Floriano Peixoto, n 715 - Centro / Campina Grande PB - CEP 58.100-001 / Fone (83) 2101-6400 URL: http://www.insa.gov.br/ Descrio: Misso
Promover a realizao de estudos e pesquisas cientficas e tecnolgicas sobre a regio do semi-rido brasileiro, em estreita cooperao com outras entidades locais, bem como sua divulgao e difuso, visando integrao dos plos socioeconmicos e ecossistemas estratgicos e o desenvolvimento sustentvel da regio.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
No tem unidade de documentao.
Publicaes on-line
Possui publicaes para acesso on-line.
Nome: Instituto Nacional de Tecnologia - INT Biblioteca: Diviso de Informao e Prospeco Tecnolgica Endereo: Av. Venezuela, 82 -Sade, 8 andar 20081.310 Rio de Janeiro - RJ URL: http://www.int.gov.br/sol_tec_info_main.html#1 Descrio: Misso
Desenvolver e transferir tecnologias e executar servios tcnicos para o desenvolvimento sustentvel do Pas, norteado pelo avano do conhecimento e em consonncia com as polticas e estratgias nacionais de Cincia, Tecnologia e Inovao.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
A Biblioteca do INT tem por objetivo oferecer produtos e
342 servios que atendam s expectativas do corpo funcional da Instituio e da comunidade de C&T em geral, alm de atender empresas, empreendedores, pesquisadores e estudantes. O acervo composto de cerca de 20.000 livros, peridicos, teses, cadastros, manuais, guias e folhetos, alm de aproximadamente 12.000 normas tcnicas, nas reas de qumica industrial, orgnica, inorgnica, tecnologia de materiais metlicos, cermicos e polimricos, corroso e proteo, desenho industrial, gesto da produo, gesto do conhecimento e informao tecnolgica, alm de obras de referncia em engenharia, cincias bsicas e administrao.
Outras informaes
Disponibiliza, em verso online, a Biblioteca Virtual do Gs Natural, desenvolvida no mbito do Ncleo de Tecnologias de Uso do Gs Natural. A BVGN rene, de forma estruturada, informaes atualizadas sobre sites no Brasil e no mundo relacionado ao tema.
Publicaes on-line
No possui publicaes para acesso on-line.
Equipe: Vera Lcia Maia Lellis - Diviso de Informao e Prospeco Tecnolgica
Nome: Laboratrio Nacional de Astrofsica - LNA Biblioteca: Biblioteca Sede Endereo: Rua Estados Unidos,154 - Bairro das Naes 37500.000 - Itajub - MG URL: http://www.lna.br Descrio: Misso
Planejar, desenvolver, prover, operar e coordenar os meios e a infra-estrutura para fomentar, de forma cooperada, a Astronomia Observacional brasileira.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
Possui biblioteca especializada na rea de astrofsica e reas afins com aproximadamente 1800 livros, proceedings de simpsios e colquios. Destaca-se a coleo de peridicos em astronomia e astrofsica, que representa uma das mais completas no pas. Possuiu ainda, peridicos na rea de cincias computacionais, ptica, eletro-eletrnica, difuso cientfica, tanto quanto preprints e boletins de outros observatrios e associaes de amadores. No possui base de dados online
Publicaes on-line No possui publicaes para acesso on-line
Equipe: 1 Tcnico auxiliar
343 Nome: Laboratrio Nacional de Computao Cientfica - LNCC Biblioteca: Servio de Biblioteca - SBI Endereo: Av. Getlio Vargas, 333 Quitandinha 25651.070 - Petrpolis - RJ URL: http://www.lncc.br Descrio: Misso
Realizar pesquisa e desenvolvimento em computao cientfica, em especial a criao e aplicao de modelos e mtodos matemticos e computacionais na soluo de problemas cientficos e tecnolgicos; desenvolver e gerenciar ambiente computacional de alto desempenho que atenda s necessidades do Pas; formar recursos humanos, promovendo transferncia de tecnologia e inovao.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
Com um acervo especializado nas reas de Matemtica Aplicada e Computacional, Mecnica dos Slidos e Fluidos, Teoria dos Sistemas e Controle, Mtodos e Anlise Numrica em Cincias e Engenharia, a rea de Biblioteca e Documentao tem como objetivo fornecer o apoio bibliogrfico necessrio ao desenvolvimento das atividades desenvolvidas no LNCC bem como pela disseminao deste acervo para a comunidade tcnico-cientfica. A Biblioteca do LNCC possui um acervo especializado nas reas de interesse do Laboratrio, tais como: Computao Cientfica, Matemtica Aplicada, Mecnica Aplicada, Teoria dos Sistemas e Controle, Cincia da Computao, Estatstica e Biomatemtica. Conta com cerca de 10.000 livros.
Publicaes on-line Possui publicaes para acesso on-line e participa da BDTD
Equipe: Maria Cristina Albuquerque de Almeida Chefe Total de servidores - 5
Nome: Laboratrio Nacional de Luz Sncrotron / ABTLus - LNLS Biblioteca: Departamento Cientfico Endereo: Rua Giuseppe Mximo Scolfaro, 10.000 - 13083.970 - Campinas - SP URL: http://www.lnls.br/ Descrio: Misso
Atuar como laboratrio nacional, aberto, multiusurio, multi e interdisciplinar, capaz de criar e prover solues integradas para problemas cientficos e tecnolgicos complexos nas reas de materiais avanados, nanotecnologia, biotecnologia, aceleredores e tecnologias relacionadas e instrumentao cientfica.
Organizao Social vinculado ao Ministrio da Cincia e Tecnologia
Unidade de documentao
Biblioteca do LNLS tem como objetivo d suporte s atividades tcnico-cientficas, localizando textos, obras completas,
344 peridicos e outros materiais documentais. As atividades da Biblioteca tiveram incio em 1987, logo que o LNLS comeou a ser implantado e sempre foi vinculada ao Departamento Cientfico. Alm de atender ao quadro de funcionrios do LNLS, a Biblioteca tambm atende pesquisadores de inmeras outras instituies brasileiras e do exterior, em especial os que utilizam a infra-estrutura de pesquisa e desenvolvimento existente no LNLS. Mantm intercmbio com outras bibliotecas e integra os sistemas COMUT e o British Library (BL) que permite solicitar e receber cpias de artigos de peridicos, teses e captulos de livros.
LNCC: foi primeira instituio a conectar o pas a uma rede internacional acadmica de computadores.
Publicaes on-line Possui publicaes para acesso on-line
Equipe: Margarida M. S. Abreu de Lima
Nome: Museu de Astronomia e Cincias Afins - MAST Biblioteca: Servio de Biblioteca Endereo: Rua General Bruce, 586, So Cristvo 20921.030 - Rio de Janeiro - RJ URL: http://www.mast.br/ Descrio: Misso
Ampliar o acesso da sociedade ao conhecimento cientfico e tecnolgico por meio da pesquisa, preservao de acervos e divulgao da Histria da Cincia e da Tecnologia no Brasil.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
Biblioteca especializada em histria da cincia, educao em cincias e divulgao cientfica. Possui tanto obras do interesse de pesquisadores, como direcionadas para estudantes dos nveis fundamentais e mdios, e tambm para o pblico em geral. Seu acervo compe-se de aproximadamente 7000 volumes, incluindo clssicos da cincia, livros, teses de ps- graduao e um amplo sistema de referncia sobre fontes de consulta no pas e no exterior. O acervo se encontra totalmente informatizado. O acervo de peridicos um dos mais completos do pas nas reas de histria da cincia e divulgao cientfica, alm de possuir assinaturas nas reas de museologia, documentao e ensino em cincias. A coleo tambm est disponvel para consulta no Catlogo Coletivo Nacional, e a biblioteca do MAST participa do programa de emprstimo entre bibliotecas. A biblioteca do MAST publica mensalmente os Sumrios Correntes, que rene os ndices das revistas cientficas recebidas durante o ms.
Publicaes on-line No possui publicaes para acesso on-line
Equipe: Lcia Alves da Silva
345 1 Bibliotecria 1 Arquivista 1 Tcnico auxiliar
Nome: Museu Paraense Emlio Goeldi - MPEG Biblioteca: Biblioteca Domingos Soares Ferreira Penna Endereo: Av. Perimetral, 1901 - Terra Firme CEP: 66077-530 - Belm - PA URL: http://www.museu-goeldi.br/ Descrio: Misso
Realizar pesquisas, promover a inovao cientfica, formar recursos humanos, conservar acervos e comunicar conhecimentos nas reas de cincias naturais e humanas relacionadas Amaznia.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
O acervo da Biblioteca Domingos Soares Ferreira Penna especializado em antropologia, arqueologia, botnica, cincias da terra, ecologia, lingstica, zoologia e em assuntos amaznicos, reunindo documentos adquiridos ao longo dos anos, atravs de compra, doao e permuta. Seu acervo composto por livros, peridicos, folhetos, separatas, mapas, CDs, fotografias, filmes, fitas e microfilmes. A Coleo Especial, com edies desde o sculo XVI, apresenta um valioso acervo de livros raros, antigos e valiosos, de grande importncia para a Amaznia.
Publicaes on-line Possui publicaes para acesso on-line
Equipe: Doralice Romeiro - Coordenao de Informao e Documentao Ftima Guedes - Bibliotecria
Nome: Nuclebrs Equipamentos Pesados - NUCLEP Biblioteca: Endereo: Rod. Rio Santos, Km 18 BR 101 Itagua - RJ URL: http://www.nuclep.br Descrio: Misso
Fundada em 1975
Empresa Estatal vinculada ao Ministrio da Cincia e Tecnologia
Unidade de documentao
No tem unidade de documentao.
Publicaes on-line No possui publicaes para acesso on-line
346
Nome: Observatrio Nacional - ON Biblioteca: Diviso de Documentao - DID Endereo: Rua General Jos Cristino, 77 So Cristvo 20921.400 Rio de Janeiro - RJ URL: http://www.on.br/ Descrio: Misso
Realizar pesquisa e desenvolvimento em Astronomia, Geofsica e Metrologia em Tempo e Freqncia, formar pesquisadores em seus cursos de ps-graduao, capacitar profissionais, coordenar projetos e atividades nacionais nestas reas e gerar, manter e disseminar a Hora Legal Brasileira.
Unidade de Pesquisa do Ministrio da Cincia e Tecnologia
Unidade de documentao
considerada uma das melhores bibliotecas especializadas do pas, com um acervo de valor inestimvel nas reas de Astronomia, Geofsica, Metrologia e cincias correlatas. A seo de obras raras inclui livros, fotografias e negativos em vidro. Grande parte desse material remonta ao sculo XIX, encontrando-se, no entanto, livros do sculo anterior. Desde 2004 disponibiliza na pgina oficial do ON a Biblioteca Digital de Obras Raras e Especiais do Observatrio Nacional, que consiste na reproduo em meio eletrnico do acervo raro, visando a sua preservao e disseminao.
Publicaes on-line Possui publicaes para acesso on-line
Equipe: 1 Bibliotecria
Nome: Associao Rede Nacional de Ensino e Pesquisa - RNP Biblioteca: Diretoria de Gesto da Informao - DGI Endereo: Rua Lauro Muller, 116 sala 3.902 CEP 22290-160 Rio de Janeiro - RJ URL: http://www.rnp.br/ Descrio: Misso
Promover o uso inovador de redes avanadas no Brasil.
Organizao Social vinculada ao Ministrio da Cincia e Tecnologia.
Unidade de documentao No tem unidade de documentao. Conta com um pequeno acervo dentro da Biblioteca da Embrapa em Campinas
Publicaes on-line Possui publicaes para acesso on-line
Equipe: 1 Cientista da Informao
347 APNDICE E Produo bibliogrfica de servidores do Ministrio da Cincia e Tecnologia sobre preservao digital
Banon, G. J. F. Hiperdocumentos versus URLib. 2002. Disponvel em: <dpi.inpe.br/banon/2002/10.10.08.39>. Acesso em: 25 fev. 2004.
______. Uniform repositories for a digital library (URLib). 1998. Disponvel em: <dpi.inpe.br/banon/1997/08.14.12.32>. Acesso em: 25 fev. 2004.
______; Banon, L. C. Creating persistent citation links. 2001. Disponvel em: <iconet.com.br/banon/2001/07.27.00.56>. Acesso em: 25 fev. 2004.
______; RIBEIRO, M. L.; BANON, L. C. Contribuio ao livre acesso da literatura cientfica em cincia espacial: implementao da poltica de auto-arquivamento na biblioteca digital do INPE. In: SEMINRIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS BRASIL, 1., 2007, So Paulo. Proceedings... So Paulo: INPE, 2007.
______; ______; ______. Preservao digital da memria tcnico-cientfica do INPE. In: SIMPSIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS, 2., 2004, Campinas. Anais eletrnicos... Campinas: INPE, 2004. Disponvel em: <http://libdigi.unicamp.br/document/?view=8264>. Acesso em: 19 set. 2005.
______; ______; SILVA, M. D. Preservao, enriquecimento e disseminao das Memrias Tcnico-Cientfica e Documental do INPE. So Jos dos Campos: INPE, 2003. Disponvel em: <http://urlib.net/sid.inpe.br/marciana/2003/10.21.16.25>. Acesso em: 15 fev. 2004.
BARBEDO, S. A. D.; RIBEIRO, M. L. Estudo de padronizao de metadados para preservao da memria documental da biblioteca digital do INPE. In: SIMPSIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS, 3., 2005, So Paulo. Anais... So Paulo: INPE, 2005. Disponvel em: <http://ePrint.sid.inpe.br:80/rep- /sid.inpe.br/ePrint@80/2005/12.02.12.25>. Acesso em: 16 fev. 2006.
BERGAMINI, E. W. et al. CCSDS Standards: a reference model for an Open Archival Information System (OAIS). In: SIMPSIO SPACEOPS, 98., 1998, Tokio. Anais... Tkio: [s.n.], 1998. Disponvel em: <http://iris.sid.inpe.br:1905/col/sid.inpe.br/banon/2001/04.03.15.36.19/doc/mirror.cgi:I ISarau na Biblioteca>. Acesso em: 12 jan. 2006.
BOERES, S. A. A.; MRDERO ARELLANO, M. A. Polticas e estratgias de preservao de documentos digitais. In: CINFORM, 4., 2005, Salvador, BA.
MRDERO ARELLANO, M. . As colees de obras raras na biblioteca digital. 93 f. 1998. Dissertao (Mestrado em Cincia da Informao)- Departamento de Cincia da Informao e Documentao, Universidade de Braslia. Braslia: [s.n], 1998.
______. Digital preservation of scientific information in Brazil: an initial approach of existing models. In: INTERNATIONAL CONFERENCE ON ELETRONIC PUBLISHING, 8., 2004, Braslia. Proceedings Braslia: Universidade de Braslia, 2004.
______ Preservao de documentos digitais. Cincia da Informao, v. 33, n. 2, p. 15-27, 2004.
______; ANDRADE, R. S. Preservao digital e os profissionais da informao. DataGramaZero, v. 7, n. 5, out. 2006.
______. Preservao digital: uma preocupao dos editores de revistas cientficas eletrnicas no Brasil. In: ENCONTRO NACIONAL DE EDITORES CIENTFICOS, 9., 2007, Ouro Preto, MG. Proceedings... Ouro Preto, MG: [s. n], 2007.
RIBEIRO, M. L. Aspectos da memria cientfica do Instituto Nacional de Pesquisas Espaciais (INPE). So Jos dos Campos: INPE, 2007. Disponvel em: <http://urlib.net/sid.inpe.br/mtc-m17@80/2007/07.10.18.17>. Acesso em: 21 out. 2008.
______. Reflexes sobre o resguardo da memria cientfica do INPE. In: SEMINRIO NACIONAL DE BIBLIOTECAS UNIVERSITRIAS, 14., 2006, Salvador, BA. Anais... Salvador, BA: INPE, 2006. Disponvel em: <http://urlib.net/sid.inpe.br/mtc-m16@80/2006/10.31.16.16>. Acesso em: 21 out. 2008.
SAYO, L. F. O modelo de referncia ISO/OAIS: Open Archival Information System. In: SIMPSIO INTERNACIONAL DE BIBLIOTECAS DIGITAIS, 2., 2004, Campinas. Anais... Campinas: Unicamp, 2004.
______. Padres para bibliotecas digitais abertas e interoperveis. Revista Brasileira de Biblioteconomia e Documentao, So Paulo, v. 4, n.1, p. 101-130, jan./jun. 2008.
349
______. Preservao digital no contexto das bibliotecas digitais: uma breve introduo. In. MARCONDES, Carlos H. et al. (Org.). Bibliotecas digitais: saberes e prticas. Salvador: EDUFBA; Braslia: IBICT, 2005. p. 115-149.
______. Preservao Digital: uma brevssima introduo. Rio de Janeiro: [s. n.], 2003. Disponvel em: <http://www.arquivonacional.gov.br/conarq/cam_tec_doc_ele/preservacao/preservac ao.asp>. Acesso em: 03 dez. 2003.
TOLMASQUIM, A. T. Preservao de objetos tridimensionais para a histria da cincia e tecnologia. In: SEMANA NACIONAL DO LIVRO E DA BIBLIOTECA, 2., 2005, So Jos dos Campos. Atas... So Jos dos Campos: INPE, 2005.
350 APNDICE F - Glossrio de termos tcnicos
Acessibilidade de longo prazo: acessibilidade do sistema de preservao digital que permite medir as facilidades de uso que ele proporciona aos usurios, a dimenso das tarefas realizadas e o grau de conhecimento que eles tm das funes do sistema; depende da sua capacidade de ser interopervel; usa de ferramentas de softwares livres, possibilitando a alterao de qualquer parte do sistema sem nenhuma conseqncia nas suas funcionalidades. Como um critrio pode ser medido por meio de indicadores de desempenho que proporcionam os dados sobre a eficincia do sistema no atendimento de usurios e suas expectativas de tempo e tipo de resposta.
Acesso Livre: disponibilizao livre e pblica na Internet, de forma a permitir a qualquer usurio a leitura, download, cpia, impresso, distribuio, busca ou link com o contedo completo de artigos, bem como a indexao ou o uso para qualquer outro propsito legal.
Anlise Etnogrfica de Contedo: tcnica de anlise qualitativa de dados, usada para o estudo da origem e uso de conceitos formulados nas mdias. Diferentemente da anlise de contedo tradicional, a AEC interage com as informaes sem ficar restrita a amostras; tratar o processo de amostragem como uma comparao constante, cujas descobertas so usadas para delinear categorias especficas e narrativas descritivas.
Arqueologia digital: uso de material obsoleto para pesquisa da histria dos incios da arquitetura computacional, aplicativos perifricos, sistemas operacionais, linguagens de programao, ferramentas e sistemas de gesto eletrnica de documentos.
Arquivos Abertos (Open archives): arquivos eletrnicos conectados por meio do protocolo Open Archives Initiative Protocol for Metadata Harvesting (OAI- PMH), permitindo a interoperabilidade entre bibliotecas e repositrios digitais.
Atributo: caracterstica inerente ou qualidade associada a um elemento j mencionado.
Atualizao (refreshment): migrao de dados digitais que procura substituir uma mdia com uma cpia que seja suficientemente exata, para que a infra- estrutura de hardware e software continue a funcionar como antes.
Auditoria: permite que os desenvolvedores dos repositrios analisem e respondam de forma sistemtica s carncias e acertos na criao dos sistemas.
Autenticidade: comprovao de autoria do documento por meio de mecanismos de verificao como o layout, tipologia de fontes, vocabulrios controlados da poca e assinatura digital.
351 Autodepsito: que possibilita ao prprio autor a publicao de seu trabalho cientfico diretamente na Rede, sem necessidade de intermedirios.
Biblioteca digital: biblioteca com textos completos em formatos digitais, armazenados e disponveis via Internet.
Bit (binary bit): dgito binrio, menor unidade de informao armazenada em um computador. Um bit tem um valor nico, 0 ou 1.
Bitstream: a camada mais elementar para dotar de significado um objeto digital, emprega a leitura bit por bit em vez do mtodo convencional de 16 bits por vez.
Bundles: agrupamento ou pacotes de bitstreams. A possibilidade de um documento incluir vrios bundles significa que ele pode pertencer a uma ou mais colees e uma coleo a uma ou mais comunidades. Essa funo dos bundles pode ser compreendida na seqncia de duas funcionalidades j disponveis na verso 1.3 do DSpace.
Byte: grupo de dgitos binrios que so armazenados e operados como se fossem uma unidade.
Certificao: envolve mais do que a aplicao de critrios resultantes de normas e requisitos bsicos. Ela deve prover ferramentas para o planejamento da auto-avaliao e formas de auditorias internas e externas. O contexto de ambas geopoltico, mas o processo no varia significativamente.
Confiabilidade: garantir o armazenamento e acesso da informao por longo prazo
Cpia de segurana (backup): cpia de dados de um dispositivo de armazenamento a outro para que possam ser restaurados em caso da perda dos dados originais.
Critrios de preservao digital: conjunto de atividades que determinam a manuteno de colees digitais; a maioria das propostas de critrios que vem surgindo menciona a influncia do modelo de referncia OAIS/SAAI, elas definem as funes dos repositrios, os processos e procedimentos, a comunidade alvo a usabilidade da informao e as tecnologias e a infra- estrutura tcnica. Usados em procedimentos de auditoria e modelos de certificao.
Digitalizao: transformao de informao analgica para formato digital, por meio de dispositivo adequado e seguindo requisito de qualidade no seu processo de produtividade.
Documento digital: documento codificado em linguagem binria digital ou convertido para formato digital, legvel por mquinas, independente do suporte fsico e de sua mensagem original, sendo que a digitalizao pode chegar a produzir mudanas no se registro.
352 Documento eletrnico: um registro que foi criado (elaborado ou recebido) de forma eletrnica.
DOI (Digital Object Identifier): sistema de identificador de objetos digitais on-line para gerenciar a propriedade intelectual e o uso comercial dos objetos materiais digitais.
Dublin Core: esquema de descrio de metadados para descoberta de recursos on- line.
Emulao: criao de um novo software que imita o funcionamento do antigo hardware e/ou software, com o objetivo de reproduzir seu comportamento.
Encapsulamento: preservao da informao necessria para o desenvolvimento de conversores, emuladores e visualizadores de objetos digitais.
Espelhamento ou redundncia (Mirroring or Redundancy): manter uma cpia exata de um arquivo em diversos lugares; muito usado na cpia de segurana de grandes bases de dados.
Estratgia de preservao digital: tipo de abordagem que permite o acesso contnuo informao em formato digital. Esquemas tcnicos e conceituais que permitem identificar as partes integrantes do processo de preservao digital, assim como sua padronizao em modelos de referncia.
Formato: estrutura do arquivo que define o modo como armazenado ou apresentado na tela ou impresso; organizao seqencial de dados em termos de seus componentes, tambm chamado de extenso. Formatos abertos de arquivo so aqueles em que os usurios tm acesso aos detalhes tcnicos e ao significado de sua estrutura de bits.
Handle System
: um exemplo de identificador persistente, desenvolvido pela
Corporation for National Research Initiatives.
Harvesting: busca automtica de endereos web, com o resgate das referncias para outros documentos, links e informaes relevantes.
Identificador: um caractere ou conjunto de caracteres designados para identificar inequivocamente um documento. Alguns exemplos de identificadores so o URN (Uniform Resource Name), o DOI
, o ISBM (International Standard
Book Number) e o SICI (Serial Item and Contribution Identifier).
Identificador persistente: um nico identificador permanentemente associado a um objeto digital, quando gerenciado, sempre prover acesso permanente a um objeto independentemente de qualquer mudana de local.
Informao digital: dados organizados e com significados, codificados em dgitos binrios, bits, produzidos e armazenados em computador.
353 Interoperabilidade: interao de documentos digitais entre diferentes sistemas tecnolgicos; configurao de todos os arquivos, padronizando-os de forma global.
Metadado: informaes estruturadas e codificadas que descrevem e permitem gerenciar, compreender, preservar e acessar os documentos digitais ao longo do tempo.
Metadados administrativos: tipo de metadados que permite o gerenciamento de uma coleo digital.
Metadados de preservao: atributos especiais de dados ou documentos, geralmente descritivos; so aqueles relacionados com o contedo do documento, seu contexto e estrutura no momento da sua criao, assim como das mudanas acontecidas em todo seu ciclo de vida.
Migrao: conjunto de atividades para copiar, converter ou transferir a informao digital de uma tecnologia antiga ou obsoleta para uma tecnologia nova; transferncia peridica de dados de uma gerao tecnolgica para outra.
Modelo de Referncia: estrutura para o entendimento de relaes significativas entre entidades de um ambiente e para o desenvolvimento de padres consistente ou especificaes que lhe do suporte. Um modelo de referncia esta baseado em um nmero pequeno de conceitos unificados.
OAIS (Open Archival Information System): esquema conceitual que disciplina e orienta um sistema para a preservao e manuteno de acesso informao digital por longo prazo; contm o termo archival para distingi-lo de outros usos do termo arquivo. Arquivo no OAIS consiste em uma organizao de pessoas e sistemas que aceitam a responsabilidade de preservar informao e torna-la disponvel.
Objeto digital: tipos de arquivos encontrados em meio digital, compostos de conjuntos de seqncias de bits sobre contedos informacionais. metadados e identificadores.
Pacote de Arquivamento de Informao (PAI): informao de contedo e sua descrio de preservao necessria para preservar-la dentro de um pacote de informao por longo prazo.
Pacote de Disseminao de Informao (PDI): pacote de informao que contm partes de um PAI que so distribudas a um Cliente/Usurio quando solicitado.
Pacote de Submisso de Informao (PSI): pacote de informao identificado pelo produtor no acordo de submisso na estrutura conceitual do OAIS.
Preservao digital de longo prazo: o ato de manter informao, de forma correta e independente por longo prazo. Informao armazenada independentemente que possui documentao suficiente para permitir que
354 seja interpretada e usada por uma comunidade sem necessidade de recursos especiais obsoletos. Requer procedimentos especficos e tcnicas apropriadas para cada tipo de formato e mdia. Com ela pretende-se garantir a inalterabilidade dos registros digitais
Preservation Master File: o objeto derivado do original que ser preservado, gerenciado e disseminado por longo prazo.
Protocolo: padres que controlam a transferncia de informao entre computadores. Desenvolvidos para melhorar a confiabilidade e a velocidade de dados transferidos.
Repositrio digital: sistema de informao on-line encarregado de gerar e armazenar objetos digitais para seus subseqentes acessos e recuperaes.
Repositrio digital confivel: resultado da associao de repositrios institucionais servios de preservao e arquivos por rea de conhecimento; tem como misso prover acesso de longo prazo confivel a recursos digitais gerenciados para suas comunidades alvo, hoje e no futuro. Repositrio Institucional: repositrio digital que incluem no s artigos submetidos ao processo tradicional de reviso dos pares (pos-print), como tambm verses eletrnicas preliminares de documentos cientficos (pr-prints), teses, manuais, materiais de ensino ou qualquer outro tipo de material que os autores ou sua instituio desejem que se torne disponvel para o pblico. Eles devem estar respaldados por poltica de gerenciamento que os reconheam como vitais para a instituio.
SGML (Standard Generalized Markup Language): Linguagem de Marcao Generalizada Padro que a base para a criao de todas as linguagens de marcao, definido pela norma ISO 8879:1986.
Software: programa de computador. So instrues que o computador capaz de entender e executar.
Software livre: programa de computador em que se tem liberdade de executar, copiar, distribuir, modificar e aperfeioar, de acordo com interesses pessoais ou comerciais. Apresenta um cdigo-fonte aberto.
URL (Uniform Resource Locator): padronizao da localizao ou dos detalhes de endereamento dos recursos da Internet.
XML (Extensible Markup Language): linguagem para descrio de documentos eletrnicos; estrutura sinttica para descrio de dados entre aplicaes de informtica, em formato de texto; um formato padro para publicao, armazenamento e transferncia de documentos por via eletrnica, independente dos fabricantes de software, facilmente interpretvel por mltiplas aplicaes e, em certa forma, auto-explicativo.