Você está na página 1de 12

Usando EAD e NOBRADE para acessar um fundo arquivístico digitalizado:

o Servidor de Imagens do AHUFJF1

Galba Di Mambro*
José Guilherme Ribeiro**

APRESENTAÇÃO
A presente comunicação é fruto do trabalho conjunto de seus dois autores. Nessa
associação, o professor Galba Di Mambro tem se responsabilizado pelo estudo das normas
internacionais (ISAD(G)2 e NOBRADE3), pela elaboração dos instrumentos de pesquisa e
pela execução do trabalho de digitalização, enquanto o professor José Guilherme Ribeiro tem
se responsabilizado pelo estudo do padrão EAD, e pela concepção e desenvolvimento do
sistema de entrega de imagens usando esse padrão.
O trabalho está sendo desenvolvido pelo Arquivo Histórico da UFJF – AHUFJF desde
2006 quando, por meio de projeto apresentado junto à FAPEMIG, os documentos do fundo
Sociedade de Medicina e Cirurgia de Juiz de Fora foram higienizados, arranjados, descritos e
digitalizados. Em 2007, através de projeto apresentado ao ICMS/Cultural de Minas Gerais,
está sendo desenvolvido o sistema para a disponibilização das imagens digitais, por meio de
um site na Web. O desenvolvimento do site deverá estar concluído em fevereiro de 2008.
O site desenvolvido ultrapassa o âmbito dos documentos da Sociedade de Medicina e
Cirurgia de Juiz de Fora. Ele pretende reunir, a partir de um único endereço, o resultado de
uma série de trabalhos de digitalização desenvolvidos pelo Arquivo Histórico da UFJF. O
conjunto desses trabalhos estará disponível no Servidor de Imagens do AHUFJF.
Os estudos para o Servidor de Imagens começaram a ser desenvolvidos em 2006.
Como parte desses estudos, no início de 2007 foi feito um modelo – um protótipo – que
sistematiza de forma concreta “aquilo que queremos” com o servidor. Em outras palavras,
esse modelo correspondeu à explicitação da maioria dos requisitos funcionais do sistema, tal
1
Texto apresentado no II Seminário Internacional do Arquivo Público Mineiro – Documentos Eletrônicos:
gestão e preservação, realizado em Belo Horizonte, no período de 05/11/2007 a 08/11/2007 e promovido pela
Secretaria de Estado da Cultura – SEC/MG, Arquivo Público Mineiro e Universidade Federal de Minas
Gerais, na mesa-redonda “Projetos de digitalização e preservação digital”.
*
Professor da Universidade Federal de Juiz de Fora. Diretor do Arquivo Histórico da UFJF.
*
* Consultor do Arquivo Histórico da UFJF.
2
CONSELHO INTERNACIONAL DE ARQUIVOS. ISAD(G) 2001; Norma Geral Internacional de
Descrição Arquivística. 2, ed, adotada pelo Comitê de Normas de Descrição, Estocolmo: 1999. Versão final
aprovada pelo CIA. Rio de Janeiro: Arquivo Nacional, 2001. 119 p. O padrão ISAD(G) é comentado no
texto, mais à frente.
3
CONSELHO NACIONAL DE ARQUIVOS - CONARQ. Câmara Técnica de Descrição Arquivística.
NOBRADE. Norma Brasileira de Descrição Arquivística. Rio de Janeiro: CONARQ, 2006. 123 p. O padrão
NOBRADE é comentado no texto, mais à frente.
como os entendemos na época.4 Nessa comunicação, exploraremos esse modelo, procurando
demonstrar como será o funcionamento do sistema, quando concluído. O leitor deve estar
avisado de que trata-se de um estudo preliminar, e que, embora a maior parte dos requisitos
deva permanecer estável, a aparência geral do site, ou mesmo uma ou outra funcionalidade,
podem ser alteradas.

1. O SERVIDOR DE IMAGENS DO AHUFJF


A Ilustração 1 mostra a tela de abertura do Servidor de Imagens. Nela haverá um texto
inicial, que explicará o âmbito do sistema. A seguir, logo abaixo, estarão disponíveis alguns
links, que apontarão para os projetos de digitalização do AHUFJF. Inicialmente, apenas o site
da Sociedade de Medicina e Cirurgia de Juiz de Fora estará disponível. A partir de 2008,
novos sites serão acrescentados ao Servidor. Para prosseguir, vamos selecionar o link da
Sociedade de Medicina e Cirurgia de Juiz de Fora.

Ilustração 1: Tela de abertura do Servidor de Imagens do AHUFJF

A Ilustração 2 mostra a tela inicial da Sociedade de Medicina e Cirurgia. O leitor deve

4
Requisitos funcionais correspondem à especificação das funções de um software, ou o conjunto de “coisas”
que ele fará. Para mais detalhes, cf. LARMAN, Craig. Utilizando UML e padrões: uma introdução à
análise e ao projeto orientados a objetos e ao desenvolvimento iterativo. 3. ed. Porto Alegre: Bookman, 2007.
ter em mente que, a partir desse ponto, estamos lidando com um instrumento de pesquisa em
formato digital. Isso será explicado mais tarde, mas o leitor deve pensar como se tudo, a partir
desse ponto, correspondesse a um único arquivo de computador, uma descrição arquivística
em formato digital.
A tela mostrada na Ilustração 2 contém uma pequena síntese, um resumo para
avaliação do usuário. A intenção é que, lendo o resumo, o internauta possa escolher entre
prosseguir ou não na análise do fundo. Abaixo do resumo, em área não mostrada na
ilustração, o usuário encontrará uma série de links para seguir.

Ilustração 2: Tela de abertura da Sociedade de Medicina e Cirurgia de Juiz de Fora

Seguindo o item descrição arquivística, o internauta encontrará a descrição do fundo


como um todo, feita conforme a Norma Brasileira de Descrição Arquivística – NOBRADE. A
descrição ocupa várias telas, das quais destacamos uma, mostrada na Ilustração 3. Nela vêem-
se alguns campos, como o código identificador, o título, as datas-limite, história
administrativa, história arquivística, e outros, relativos ao fundo como um todo. O nome dos
campos, bem como orientações gerais sobre o seu preenchimento, são dados pela NOBRADE.
O layout não é fixado pela norma, e corresponde a uma adaptação do AHUFJF. O usuário
pode ter, lendo a descrição em primeiro nível, uma visão abrangente do fundo como um todo,
encontrando, ao final, uma série de links que permitem a ele prosseguir (Ilustração 4).
A Ilustração 4 mostra as opções de prosseguimento para o internauta. Ele tem ali uma
visão geral das grandes divisões do fundo, podendo escolher qual delas quer consultar em
detalhe. Se o usuário escolher a opção “Grupo D. Correspondência operacional”, encontrará a
figura mostrada na Ilustração 5. Nessa tela, o usuário poderá ver a descrição de todas as séries
do grupo D, de forma seqüencial.

Ilustração 3: Descrição em primeiro nível - Fundo Sociedade de Medicina e Cirurgia


de Juiz de Fora
Ilustração 4: Acesso aos níveis subordinados

Na Ilustração 5, cada descrição de série está mostrada em uma tabela, uma espécie de
ficha, com os dados relativos à mesma. Os campos da ficha são essencialmente os mesmos da
descrição em primeiro nível, apenas preenchidos de forma mais curta, e com um número
maior de campos sendo omitidos. Novamente, a estrutura dos campos é dada pela
NOBRADE, e o layout é uma adaptação do AHUFJF. Caso haja sub-níveis a serem
consultados (subséries, dossiês, processos ou itens), haverá um link na última linha da tabela,
que levará ao próximo nível. Caso contrário, naquele lugar haverá um link para as imagens
dos documentos daquela unidade. Seguindo esse link (“Ver imagens dos documentos dessa
série”), temos a tela mostrada na Ilustração 6.
Ilustração 5: Descrição das séries do Grupo D - Correspondência Operacional

A Ilustração 6 mostra o que chamamos de “visualizador” das imagens. É uma


ferramenta para a visualização das imagens de uma série, subsérie, ou nível inferior. Ele inicia
mostrando a primeira imagem do conjunto solicitado, e contém opções para mostrar a
próxima, a anterior, a primeira e a última do conjunto. Possui também uma opção de zoom,
que permite ampliar ou reduzir a imagem, dentro de certos limites.
Isso encerra a primeira forma de acesso, considerada a principal, aos fundos do
Servidor de Imagens do AHUFJF. O usuário que faz esse caminho parte do geral para o
particular – de uma informação mais ou menos genérica do conteúdo da documentação a uma
descrição do fundo, e daí aos níveis inferiores, até chegar à imagens digitais dos documentos.
Isso reproduz, na Internet, o modo de consulta dos arquivos reais.
Voltando ao site do Servidor de Imagens, podemos ter outras formas de acesso. A
primeira delas é através de uma série de índices – índice alfabético geral, índice das obras e
folhetos, índice das fotografias, dos periódicos, etc. Se voltarmos algumas telas, selecionando
o índice alfabético geral, iremos nos deparar com um imagem como a mostrada na Ilustração
7. A imagem mostra uma série de descritores, com entradas que remetem às séries, ao lado de
entradas do tipo “ver” e “ver também”. Cada uma dessas entradas tem ao seu lado um link, ou
uma série de links, que levam a trechos da descrição arquivística. Por exemplo, a entrada
“ANESTESIOLOGISTAS” tem ao seu lado a referência à série “2E05”. Clicando nesse link,
o usuário será levado à descrição da série 2E05, numa tela semelhante à mostrada
anteriormente, na Ilustração 5. A partir daí, o internauta pode acessar os níveis inferiores, se
houver, ou a imagem dos documentos, como já foi mostrado.

Ilustração 6: Visualização de um documento - Sociedade de Medicina e Cirurgia


A última forma de acesso disponível é um mecanismo de busca, que permite a
pesquisa por palavras ou por datas, no interior das fichas descritivas do fundo, das séries e dos
demais níveis. A tela do mecanismo de busca é mostrada na Ilustração 8. Inicialmente, os
campos de texto e de datas estarão vazios, e a tela não mostrará nenhum resultado da busca.
Quando o usuário digitar um critério de pesquisa – texto ou datas, ou ambos – e pressionar o
botão “Pesquisar”, a busca será realizada. O resultado da busca mostra a ocorrência do
resultado encontrado, bem como toda a hierarquia do documento (fundo, série, subsérie, etc.)
em que ele se encontra. Clicando no link do resultado, o usuário será levado à descrição da
unidade correspondente, numa tela semelhante à da Ilustração 5, de onde poderá prosseguir
para os níveis inferiores ou para as imagens dos documentos.
Ilustração 7: Índice Alfabético Geral das Séries

2. DESDOBRAMENTOS
A especificidade do Servidor de Imagens do AHUFJF está em ser baseado em dois
padrões de descrição arquivística – a NOBRADE e a EAD, cuja difusão no Brasil está em
estágio inicial. A NOBRADE é a Norma Brasileira de Descrição Arquivística, aprovada pelo
Conselho Nacional de Arquivos, e corresponde à adaptação da Norma Internacional de
Descrição Arquivística – ISAD(G) para o caso brasileiro. A EAD refere-se à Encoded
Archival Description (Descrição Arquivística Codificada) e corresponde a um padrão mantido
pela Associação dos Arquivistas Americanos e pela Biblioteca do Congresso dos EUA5, e que
tem sido introduzido recentemente no Brasil.6
5
No site oficial da EAD podem-se encontrar textos de referência sobre a mesma, bem como links para outros
sites que usam a EAD e/ou que contém mais material sobre ela. Cf. http://www.loc.gov/ead/ (acesso em 23
de abril de 2007). Muito material de referência pode ser encontrado no site Cover Pages sobre a EAD
(http://xml.coverpages.org/ead.html - acesso em 12 de julho de 2007).
6
Entre os eventos recentes que envolveram a EAD, pode-se citar a oficina “Uma introdução à EAD”,
promovida pelo AHUFJF e ministrada pelo prof. José Guilherme Ribeiro, de 04 a 06 de maio de 2005, o
curso “Registro e transferência de dados – o uso da XML”, promovido pela Associação dos Arquivistas
Brasileiros e ministrado por Adrissa Dominitini e Ana Pavani nos dias 12 e 13 de fevereiro de 2007, a
“Oficina sobre EAD e EAC”, promovida pelo Arquivo Nacional e ministrada pelo prof. Michael Fox nos dias
12 e 13 de março de 2007, e o II Encontro de Bases de Dados sobre Informações Arquivísticas, promovido
pela Associação dos Arquivistas Brasileiros nos dias 15 e 16 de março de 2007, no Rio de Janeiro. Artigo
Ilustração 8: Mecanismo de busca - Sociedade de Medicina e Cirurgia

No Servidor de Imagens do AHUFJF, a NOBRADE é usada como estrutura de dados,


e a EAD é usada como padrão de armazenamento e de comunicação. 7 Isso quer dizer que o
nome dos elementos descritivos de um fundo, série ou item documental é dado pela
NOBRADE, assim como a estrutura geral da descrição (estrutura multinível). Por seu lado, a
EAD fornece o meio de dar a essa descrição um formato legível por computador.
A EAD usa a linguagem XML para armazenar uma descrição arquivística. 8 Se
recente da revista Arquivística.net faz referência ao padrão EAD. Cf. SOUSA, Ana Paula de Moura e outros.
Princípios da Descrição Arquivística: do suporte convencional ao eletrônico. Arquivistica.net. Rio de
Janeiro, v. 2, n.2, p. 38-51, ago./dez. 2006. Disponível em http://www.arquivistica.net – acesso em 04 de
outubro de 2007.
7
A classificação foi proposta por Michael Fox. Segundo ele, os padrões internacionais usados na Arquivologia
e na Biblioteconomia podem ser divididos em 4 categorias: padrões de estrutura de dados, de conteúdo, de
valores de dados e de comunicação. A função de armazenamento (“data storage”) é mencionada, junto com a
de comunicação e intercâmbio de dados, em passagens referentes ao Marc e em outras referentes à EAD. O
uso dos padrões NOBRADE e EAD, no trabalho desenvolvido no AHUFJF, é coerente com a análise de
Fox. O leitor interessado pode consultar FOX, Michael J. Stargazing: locating EAD in the descriptive
firmament. In: PITTI, Daniel V., DUFF, Wendy M.(Ed.) Encoded archival description on the Internet.
New York: The Haworth Press, 2001. p. 61-74. (Volume publicado simultaneamente no Journal of Internet
Cataloging, v. 4, n. 3-4, 2001. Cópias do artigo podem ser compradas em http://www.HaworthPress.com –
acesso em 15 de setembro de 2007).
8
A XML é uma linguagem de computador, aprovada pelo consórcio W3C em 1998. Há muito material sobre a
XML, para consulta on-line ou publicado. Uma pesquisa no Google ou Yahoo! sempre retornará uma grande
quantidade de tutoriais sobre o assunto, que podem servir como uma referência inicial. Uma página que
contém uma grande relação de recursos (livros, bibliografias, material on-line, etc.) é a página XML do W3C
anteriormente pedimos ao leitor para pensar que tudo, de certo ponto em diante, correspondia
a um único documento, é porque todas as informações mostradas daquele ponto em diante
estavam contidos em um único arquivo de computador. A EAD armazena os dados, mas não
as instruções de formatação. O conteúdo dos campos, a ordem em que eles aparecem, e as
relações hierárquicas entre eles, são informações registradas pelo documento EAD. Fontes,
cores, e a fragmentação dos arquivos são informações adicionais, registradas num outro tipo
de documento chamado “folha de estilos”.
A interação entre um documento EAD e uma folha de estilos pode ser vista num
exemplo simples. O documento EAD registra as informações fundamentais (o conteúdo,
digamos assim) de uma descrição arquivística. A folha de estilos registra as informações
necessárias à apresentação desse conteúdo. É possível então que o mesmo conteúdo tenha
duas ou mais apresentações diferentes. Ou seja: a mesma descrição multinível vista aqui, num
modelo de site para a Web, poderia gerar (com o mesmo conteúdo, voltamos a enfatizar) um
documento de texto, num arquivo do editor de textos Word, por exemplo. O Arquivo
Histórico da UFJF pretende tirar partido dessa maleabilidade gerando descrições multinível
adaptadas, para acompanhar as cópias em CD e DVD das imagens, em formato JPEG e TIFF,
geradas pelo processo de digitalização. Isso permite que as diversas versões da descrição
sejam mais facilmente sincronizadas, depois de passar por uma revisão, por exemplo.
Existe outra característica importante no uso da EAD – uma característica que surge
como uma possibilidade a ser explorada. É muito comum usar-se, como veículo para o
armazenamento da descrição arquivística, bancos de dados relacionais. Quem já usou um
banco de dados relacional sabe que, para isso, é necessário definir uma ou mais tabelas e
campos, no que seria chamado de “estrutura” dos dados. Normalmente, em projetos isolados,
essa estrutura é definida de modo ad-hoc pelo programador, projetista ou analista de sistemas.
O resultado é que esses projetos, desenvolvidos isoladamente, possuem estruturas de dados
que se comunicam com dificuldade. O uso da NOBRADE pode melhorar um pouco esse caos,
porque ela oferece uma estrutura básica de onde partir. Mas, mesmo assim, a dificuldade
permanece, pois o grau de liberdade no mapeamento dos elementos NOBRADE para tabelas e
campos relacionais é muito amplo.
Nesse ponto, entra a EAD. A EAD não é mais do que a sistematização da estrutura de
uma descrição arquivística compatível com ISAD(G) e NOBRADE. As informações que a

(http://www.w3.org/XML/ - acesso em 10 de julho de 2007). A página do site Cover Pages sobre a XML
(http://xml.coverpages.org/xml.html - acesso em 10 de julho de 2007) também fornece uma grande
quantidade de referências sobre o tema. Outra fonte é o site XML.com (http://www.xml.com/ - acesso em 10
de julho de 2007). Quanto a publicações em papel, o leitor pode recorrer ao livro de Harold & Means sobre o
tema - HAROLD, Elliotte Rusty, MEANS, W. Scott. XML in a nutshell: a desktop quick reference. 2.ed.
Sebastopol (USA): O'Reilly, 2002. 613 p.
EAD traz são os nomes que se deve usar para cada elemento (por exemplo, que o campo
“Âmbito e conteúdo” usado pela ISAD(G) e pela NOBRADE deve ser chamado
“scopecontent”), e o modo como eles se relacionam (por exemplo, que uma série pode conter
subséries, dossiês, processos, itens, e etc.). Mesmo sendo aparentemente mínimas, essas
informações são cruciais. Elas permitem que dois projetos, que usem bancos de dados
relacionais (ou outra forma de armazenamento) possam trocar dados entre si, usando a EAD
como base para um protocolo de comunicação.
Isso permite desdobramentos interessantes, ainda inexploradas no Brasil. O principal
deles é que esses projetos, até então isolados, se integrem de alguma forma. Uma
possibilidade seria a formação de bases de dados centralizadas, que funcionassem como portal
de acesso e mecanismo de busca unificado para projetos antes isolados. Isso ampliaria a
visibilidade dessas iniciativas, na medida em que o internauta recorreria a um portal unificado
para acessar um conjunto amplo de sites que, de outra forma, não seriam tão facilmente
localizados. Outra possibilidade, relacionada à anterior, é que esses sites usem a Internet para
se integrar, delineando alguma forma de rede de computadores. Um site centralizado com
mecanismo de busca unificado poderia usar a Internet para se abastecer de dados, por
exemplo, ou poderia usar a estrutura do documento EAD – que é padronizada – para se
comunicar com sites distribuídos. Essas possibilidades, que apenas começam a se delinear,
deverão ser exploradas, proximamente, pelo Servidor de Imagens do AHUFJF.9

CONCLUSÕES
O uso conjunto da NOBRADE e da EAD abre uma ampla gama de oportunidades para
os trabalhos de descrição arquivística. O Servidor de Imagens do AHUFJF explora algumas
dessas possibilidades, aplicando os dois padrões num modelo de site para disponibilização de
cópias digitais de documentos de arquivos. Além de uma grande flexibilidade, materializada
na capacidade de ter um mesmo documento em vários formatos de apresentação, a difusão
desses padrões também permitirá uma maior integração entre projetos até então dispersos. A
formação de bancos de dados unificados e de sistemas de redes são apenas algumas dessas
possibilidades, e podem contribuir para ampliar a visibilidade e o acesso a iniciativas até
9
Existem exemplos de bancos de dados unificados que usam EAD como padrão de metadados, dos quais um
dos primeiros foi o Online Archive of California (http://www.oac.cdlib.org/ - acesso em 04 de outubro de
2007). Relatos de experiências desse tipo podem ser encontrados em PITTI, Daniel V., DUFF, Wendy (Ed).
Encoded Archival Description on the Internet. New York: Haworth Press, 2001. (Co-publicado
simultaneamente no Journal of Internet Cataloging. v. 4, n. 3/4, 2001); e em STOCKTING, Bill,
QUEYROUX, Fabiennne (Ed.). Encoding Across Frontiers: proceedings of the European Conference on
Encoded Archival Description and Context (EAD and EAC), Paris, France, 7-8 October 2004. New York:
Haworth Press, 2005. (Co-publicado simultaneamente no Journal of Archival Organization, v. 3, n. 2/3,
2005). As possibilidades em torno de uma rede de arquivos foram exploradas em RIBEIRO, José Guilherme.
Implantação da Rede de Arquivos Municipais de Minas Gerais – RAM-MG. Governador Valadares,
2004. (mimeo.)
então dispersas.

Juiz de Fora / Governador Valadares, 04 de outubro de 2007