Escolar Documentos
Profissional Documentos
Cultura Documentos
comunicação de peqquisa
um novo patamar para preservação de dados
digitais de pesquisa
N
a questão crucial que se coloca é a seguinte:
o período de 1918 a 1919 a gripe será que os atuais registros médicos e os
espanhola se espalhou pelo mundo demais registros de pesquisa que agora estão
inteiro, matando de 20 a 80 milhões de sendo documentados de forma digital ou
pessoas. De origem viral, não havia tratamento já são gerados em formatos digitais estarão
conhecido. Como veio, se extinguiu. Com o disponíveis para o acesso e para a reutilização
intuito de pesquisar meios de evitar uma nova em novas pesquisas daqui a alguns anos? Essa
catástrofe, a comunidade internacional das questão tem implicações mais amplas, posto que
áreas médica e de saúde pública procurou por o volume de dados de pesquisa disponibilizados
décadas algum vestígio biológico do vírus digitalmente está crescendo numa velocidade
causador dessa enfermidade. Só depois de muito vertiginosa, engendrando concepções novas de
tempo, foi encontrada uma amostra de tecido documentos e redesenhando o ciclo tradicional
humano infectado pelo vírus num hospital de comunicação científica. É necessário ainda
militar da Inglaterra. A partir desses vestígios observar que, além de gerar novos dados
estão sendo desenvolvidas pesquisas para se digitais, os pesquisadores e os acadêmicos, já
descobrir vacinas e meios de tratamento da gripe há algum tempo, começaram a creditar toda a
espanhola. As pesquisas em torno da amostra só confiança nos conteúdos digitais criados por
se tornaram possíveis graças à preservação dos outros cientistas para dar prosseguimento
arquivos científicos, datados de 1916, daquele aos seus empreendimentos (ABBOUT,
hospital militar (DITADI, 2003). 2008), inaugurando um novo patamar de
Diante do fato de que alguns dados compartilhamento de dados e um diálogo
de pesquisa são únicos e não podem ser transversal ao tempo e ao espaço.
Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012 179
Luis Fernando Sayão, Luana Farias Sales
180 Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012
Curadoria digital
Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012 181
Luis Fernando Sayão, Luana Farias Sales
a maior parte da última metade do último dos dados e o seu potencial de reuso em vários
milênio”. No quarto paradigma temos a ciência outros contextos. Prosseguindo no nosso estudo,
unificando experimentos, teorias e simulações, convidamos o leitor a concentrar a atenção nas
através do uso intensivo de dados capturados soluções e modelos propostos para enfrentar
por instrumentos cada vez mais sofisticados ou esses desafios.
gerados por simulação, processados por software
e armazenados em computadores na forma de
bases de dados. Com a finalidade de se extrair 3 A IMPORTÃNCIA DA GESTÃO
entendimento e inferir significado, a partir desse DOS DADOS DE PESQUISA
último ponto os dados podem ser analisados
Compreendendo a importância da gestão
por meio de metodologias de gerenciamento
ativa de coleções de dados para a pesquisa do
de dados, de soluções estatísticas e também por
século XXI a D-Lib Magazine2 – o periódico
meio do uso de ferramentas de representação do
mais importante no universo das pesquisas
conhecimento, como ontologias.
em bibliotecas digitais – publicou no inicio do
É nítida, portanto, a linha que separa
ano de 2011 um número especial sobre esse
os dados dos seus significados. Bell (2011) nos
assunto. Nessa publicação estão endereçadas
relembra que Keppler (1571-1630) – assistente
questões como acesso livre, curadoria digital,
do astrônomo dinamarquês Tycho Brahe (1546-
aquisição e gestão, qualidade e confiabilidade e
1601) – foi quem pegou o caderno de observações
as possíveis conexões entre dados de pesquisa
astronômicas sistemáticas de Brahe e a partir
e as publicações acadêmicas tradicionais, que
daí formulou as leis do movimento planetário.
oferecem oportunidades para o surgimento
Este fato estabeleceu uma divisão clara entre a
de concepções surpreendentes de documentos
mineração e a análise de dados experimentais.
mais apropriados ao paradigma da ciência
Por um lado, temos os dados coletados e
computacional e orientada por dados.
cuidadosamente arquivados; por outro, a criação
O problema da gestão de dados de
de teorias. Esta divisão é um dos aspectos
pesquisa tem muitas faces que vão se revelando
determinante do quarto paradigma.
à medida que avançamos. No plano econômico,
Nesse contexto de grandes mudanças,
o custo-benefício de se manter o acesso e a
novos papeis e responsabilidades emergem como
capacidade de reuso aos dados de pesquisa
críticos para a gestão de conjuntos de dados
é extremamente difícil de ser mensurado. O
de pesquisa, dentre eles está o “cientista de
valor de um registro pode estar relacionado
dados” que podem ser cientistas da computação
à possibilidade da reprodutibilidade de um
ou cientistas da informação, engenheiros de
determinado experimento aonde ele foi gerado
software e de base de dados, especialistas em
ou capturado. Algumas pesquisas podem ser
disciplinas, entre outros. Apesar de não ser
fáceis e baratas de se replicar; outras podem
ainda uma carreira de contornos bem definidos
ser literalmente impossíveis de se reproduzir
e de reconhecimento óbvio, a sua contribuição
– como é a mensuração das características
é fundamental para um diálogo bem sucedido
de uma particular erupção vulcânica – ou
entre todas as partes envolvidas.
são repetíveis somente a custos e esforços
Explicitada rapidamente a importância
inaceitáveis (JANSEN, 2006), como uma
das coleções de dados de pesquisa para o avanço
incursão na atmosfera de Marte. Nessa direção,
da ciência moderna, concluímos esta seção
o arquivamento eletrônico de dados começa a
constatando que a ciência com uso intensivo
ser estimulado ativamente pelas agências de
de dados consiste de três atividades essenciais:
financiamento de pesquisa, que demandam mais
captura, curadoria e análise. Tendo em vista esse
e mais que os projetos científicos contemplem o
fluxo, Bell (2011) argumenta que é preciso investir
arquivamento dos dados gerados no decorrer
na criação de um conjunto de ferramentas
das pesquisas em repositórios de dados
genéricas que cubram todo o espectro de
confiáveis3. O que nos indica que as agências que
atividades – da captura e validação dos dados à
curadoria, analise e, finalmente, arquivamento
permanente. Em todo esse ciclo se interpõe o 2 Disponível em: < http://www.dlib.org/dlib/january11/brase/01brase.html>
3 Para uma análise sobre a confiabilidade dos repositórios digitais, consultar:
desafio de manter a capacidade de interpretação SAYÂO, L.F. Repositórios digitais confiáveis para a preservação de periódicos
182 Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012
Curadoria digital
financiam ou que estabelecem as diretrizes para que se observa é que ainda persistem lacunas
o setor de pesquisa começam a delinear políticas, críticas e questões de pesquisas em aberto (LEE;
estratégias e prioridades que considerem os TIBBO, 2007).
dados de pesquisa de longa duração como Mesmo assim, várias iniciativas
um investimento importante que precisa ser importantes, lideradas pelas próprias
protegido como tal. comunidades científicas, já cumprem papel vital
O Relatório do Projeto Digital Repository na garantia do acesso livre aos dados de pesquisa
Infrastructure Vision for European Research II e no que se convencionou chamar de curadoria
(Driver II), desenvolvido sob os auspícios da digital, como veremos a seguir.
Comunidade Europeia, justifica a preocupação Ancorado no lema “ajudando você a
das agências de fomento enfatizando que o encontrar, acessar e reusar dados”, foi fundada
acesso a dados de pesquisa proporciona uma em Londres no ano de 2009 uma organização
série de vantagens, especialmente quando esses sem fins lucrativos, chamada de DataCite4,
dados estão associados a manuscritos acadêmicos cujos objetivos essenciais, desde então, são:
disponíveis online. Por exemplo: quando um estabelecer bases para o acesso mais fácil a
pesquisador deposita seus dados brutos, ele abre dados de pesquisa na internet; aumentar o
a possibilidade dos seus pares replicá-los e, dessa grau de aceitação dos dados de pesquisa como
forma, verificar o que está sendo defendido na contribuições legítimas passíveis de serem
publicação científica; isto possibilita também citadas nos registros acadêmicos; dar sustentação
que outros pesquisadores reusem os dados, os ao arquivamento de dados de pesquisa de forma
comparem e os combinem com outros dados, de que seja possível que os resultados possam ser
forma que novas pesquisas podem ser geradas. verificados e readaptados para futuros estudos.
Outro benefício apontado pelo Relatório é que A ideia central que alimenta as ações do
a curadoria dos dados torna possível traçar a DataCite é a citação de dados, significando
linhagem dos vários produtos dos projetos de que os dados de pesquisa devem ser citados da
eScience, dado que esses projetos se desenvolvem mesma forma como são citadas outras fontes de
por vários estágios, tais como captura de dados, informação, tais como artigos e livros. O DataCite
processamento, modelagem e interpretação. “Se preconiza que a citação de dados permite o
fosse possível destacar as inúmeras conexões reuso e a verificação dos dados mais facilmente,
entre os recursos que são produzidos durante possibilitando que o impacto dos dados possam
os vários estágios do processo científico, isto ser rastreados, e que uma estrutura acadêmica
poderia ser de grande utilidade” (VERHAAR, que reconheça e recompense os produtores de
2008, p.14), enfatiza o autor do Relatório. dados possa ser, finalmente, criada.
Entretanto, para muitas comunidades Para cumprir seus objetivos o DataCite
acadêmicas a gestão e o acesso continuado a esta procura juntar as comunidades que lidam com
vasta quantidade de dados ainda é um problema conjunto de dados de pesquisa para que, de forma
distante de ser superado. Lamentavelmente, colaborativa, equacionem o desafio de tornar os
muitos dos dados que são produzidos, dados de pesquisa visíveis e possíveis de serem
frequentemente a um custo alto para a sociedade acessados. Uma das iniciativas importantes
como um todo, são irremediavelmente perdidos. nesse processo é o apoio aos centros de dado no
No curto período do que se assinalamento de identificadores persistentes e na
convencionou chamar de era digital, algumas definição de padrões para a publicação de dados;
instituições científicas se comprometeram no destaca-se também apoio aos editores científicos
desenvolvimento de atividades que pudessem no sentido de os capacitarem a estabelecer links
salvaguardas os dados científicos digitais. entre artigos e os dados subjacentes e eles. Para o
Porém as poucas instituições engajadas nesse usuário pesquisador, o DataCite oferece recursos
processo ainda não estabeleceram práticas e não e serviços que o ajudam a encontrar, identificar e
garantiram os fluxos de recursos que assegurem citar conjunto de dados de forma confiável.
o completo sucesso da gestão desses dados. O
Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012 183
Luis Fernando Sayão, Luana Farias Sales
184 Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012
Curadoria digital
Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012 185
Luis Fernando Sayão, Luana Farias Sales
186 Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012
Curadoria digital
Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012 187
Luis Fernando Sayão, Luana Farias Sales
analisados. A ideia que está por traz das de sua apresentação, somados a metadados
publicações ampliadas é precisamente criar que asseguram a integridade, precisão e
pontes que liguem os conteúdos dos repositórios autenticidade. Dessa forma, novas pesquisas
institucionais, ou seja, publicações científicas, de qualidade podem ser desenvolvidas, com
com os conteúdos dos repositórios de dados a segurança necessária, a partir desses dados,
(VERHAAR, 2008). que estão instrumentalizados para serem
Dessa forma, a publicação ampliada ou transportados para novos domínios. Pode-se
o documento ampliado é pensado como uma observar que uma nova relação se estabelece
forma de objeto digital complexo que combina entre os pesquisadores na medida em que um
vários recursos heterogêneos, que são, porém, pesquisador, para desenvolver seus projetos,
relacionados. A base para esse tipo de objeto pode depositar toda a confiança nos dados
ainda é a publicação acadêmica tradicional, por levantados por outro, distante no tempo e no
exemplo, uma tese e os seus conjuntos de dados espaço.
gerados, somada também com os metadados Assim como se debate hoje fortemente
necessários. a questão do acesso livre aos periódicos
acadêmicos, criando-se novos modelos de
disseminação de resultado de pesquisa -
7 OS DADOS CIENTÍFICOS E A mais ágeis e mais dinâmicos e organicamente
COMUNICAÇÃO CIENTÍFICA mais próximos das comunidades científicas
-, hoje fica claro que é preciso estender o
De uma forma definitiva a ciência
movimento de livre acesso também aos
orientada por dados cria um ponto de inflexão
dados científicos, posto que esses recursos
no ciclo tradicional da comunicação científica.
constituem uma parte imprescindível do
Disciplinas como física das partículas, química,
estoque de conhecimento acumulado pelo
astronomia, geologia, dependem de forma
trabalho acadêmico e de pesquisa, e que
absoluta do uso intensivo de ambientes de
são financiados, na maioria das vezes, pelo
rede altamente distribuídos, instrumentos
dinheiro público. As facilidades propostas
automatizados, técnicas de captura de
pelas organizações que lidam com dados
imagens e programas de simulação. Esse
de pesquisa para encontrar, identificar,
aparato tecnológico tem impactado ampla e
arquivar, adicionar valor e reusar esses
profundamente a forma como os cientistas
dados criam um novo canal de diálogo entre
podem conduzir e disseminar as suas pesquisas
os acadêmicos e pesquisadores, que se reflete
(VERHAAR, 2008), desenhando novos fluxos
nos modelos de socialização acadêmica e de
de cooperação e compartilhamento e definindo
comunicação científica.
conceitos inéditos para a comunicação e para o
No novo ambiente de pesquisa
registro científico, que merecem estudos partindo
redesenhado pelas práticas da eScience, o ciclo de
de muitos olhares.
vida da curadoria digital incorpora-se como uma
No domínio específico da curadoria
peça-chave no fluxo tradicional de comunicação
digital, são inúmeras as reflexões que se podem
científica baseado tradicionalmente em artigos
fazer face aos impactos do reuso de dados de
de periódicos. A curadoria digital, no momento
pesquisa, da publicação e da citação de coleções
em que gerencia e preserva os dados de pesquisa
de dados e a partir do estabelecimento de
para que sejam acessados e compreendidos por
novos conceitos de publicações acadêmicas -
outros pesquisadores estabelecendo um dialogo
mais complexas e mais heterogêneas - sobre o
com o futuro, cria a possibilidade de se criar
ritual de comunicação científica. De uma forma
conceitos inovadores de documentos de registros
geral, a curadoria de dados científicos adiciona
de pesquisa, rompendo com o paradigma
velocidade ao ciclo da comunicação científica na
unidimensional e absoluto do artigo de periódico.
medida em que oferece aos pesquisadores dados
prontos para o reuso, ou seja, dados tratados,
acompanhados por metadados semânticos e 8 À GUISA DE CONCLUSÃO
estruturais – que asseguram a fidedignidade
de seu significado e a reconstrução correta A tecnologia digital nos coloca diante de
um dos dilemas mais críticos do nosso tempo:
188 Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012
Curadoria digital
por um lado ela nos permite criar, manipular, arquivos digitais, a integridade e autenticidade
armazenar e tornar disponível uma quantidade de materiais digitais e a recuperação da
impressionante de informações; por outro lado, informação, para citar alguns itens, são
esta mesma tecnologia fugidia coloca em perigo imprescindíveis para a gestão de coleções
a longevidade dos objetos informacionais por de dados de pesquisa; a Museologia digital,
ela engendrada, colocando a humanidade por sua vez, pode trazer aportes importantes
– que depende cada vez mais dos estoques na questão dos objetos digitais complexos e
informacionais digitais – face a face com o multimidiáticos, cuja presença é comum na
perigo de uma amnésia digital. Isto porque curadoria de exposições museológicas virtuais
os objetos digitais requerem metodologias e pode ser interessante para renderização de
de gestão que são muito diferentes das que estruturas cientificas mais sofisticadas.
são utilizadas no universo da impressão Porém, para a Ciência da Informação,
tradicional. os impactos nos obrigam a repensar alguns
Uma das atividades humanas em que pontos críticos, como no conceito ancestral
mais se gera e se manipula materiais digitais é de documento, no modelo tradicional de
precisamente o trabalho de pesquisa científica. disseminação de resultados de pesquisa e na
Em alguns nichos específicos, a totalidade das extensão dos formatos de metadados como
atividades que se desenrolam nos laboratórios instrumentos de recomposição de significados e
distribuídos está centrada num intenso fluxo estruturas.
de dados, nos mais diversos formatos digitais. Esses pontos nos inspiram a propor novos
Era de se esperar, portanto, que surgissem itens para uma agenda de pesquisa dentro
iniciativas que pudessem tornar os dados do domínio interdisciplinar da Ciência da
científicos digitais mais visíveis e sempre Informação:
possíveis de serem acessados, mantendo a sua a) em primeiro lugar, seria importante
integridade, fidedignidade e o seu papel de avaliar como o ciclo da comunicação
evidência. científica se altera mediante as novas
Nessa direção, a curadoria digital emerge formas de colaboração, socialização
como uma nova área de práticas e de pesquisa e disseminação proporcionadas
de espectro amplo que dialoga com várias
pelo reuso de dados científicos,
disciplinas e muitos gêneros de profissionais.
especialmente em áreas de
Ela une as tecnologias e boas práticas do
conhecimento com maiores interfaces
arquivamento e da preservação digital e dos
com a eScience;
repositórios digitais confiáveis com a gestão
b) em segundo, seria interessante investigar
dos dados científicos, criando uma nova
as novas modalidade de publicação
área de pesquisa cujos desdobramentos, de
científica, cuja gênese está na vinculação
amplo espectro, ainda são imprevisíveis. Isto
entre as publicações tradicionais
porque, como se trata de uma área que só
depositadas repositórios em digitais
recentemente despontou como crítica para a
temáticos e institucionais com os dados
pesquisa, ainda restam muitas lacunas práticas
gerenciados pelos centros de dados e de
e teóricas a serem equacionadas, orientadas,
curadoria digital;
preferencialmente, por uma abordagem
c) por fim, em terceiro mas não menos
multidisciplinar.
importante, está a concepção de modelos
A Biblioteconomia e a Arquivologia,
que se renovam cotidianamente para enfrentar de informação que possam orientar
novos problemas, têm muito a contribuir para a definição de conjunto de metadado
a curadoria digital com suas experiências capazes de garantir significado, estrutura,
em gestão de patrimônios intangíveis. fidedignidade e autenticidades aos
Representação e organização do conhecimento, dados de pesquisa — pelo tempo que for
os novos conceitos de bibliotecas, repositórios e necessário.
Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012 189
Luis Fernando Sayão, Luana Farias Sales
ABSTRACT: A considerable part of the results of research activities is being created in digital formats. Although
valuable, these data are at risk of being lost by technological obsolescence and by the inherent fragility
of digital media. Thus, the management of research data in a digital networked and distributed
environment becomes an increasing challenge for the world of research and for the information science.
In response to this challenge arises the concept of digital curation, which involves the management
of research data from its planning, ensuring its long-term preservation, discovery, interpretation and
reuse. In this sense, this study briefly examines the importance of research data and of the idea of
digital curation and its impact on the formulation of new documents and scientific communication.
190 Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012
Curadoria digital
LEE, Cristopher; TIBBO, Helen. Digital curation VERHAAR, Peter. Report on object models and
and trusted respositories: steps toward success. functionalities. DRIVER II, 2008. Disponível em:
Journal of Digital Information, v. 8, n. 2, 2007. <https://openaccess.leidenuniv.nl/bitstream/
Disponível em: <http://journals.tdl.org/jodi/ handle/1887/16018/Report_on_Object_Models_
and_Functionalities.pdf?sequence=2>. Acesso
em: 20 dez. 2011.
Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012 191