Você está na página 1de 13

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

Ambiente para busca e visualizao de documentos histricos na Web


Maurilio de Araujo Possi Mestrando em Cincia da Computao. Universidade Federal de Viosa Alcione de Paiva Oliveira Professor Associado. Universidade Federal de Viosa Departamento de Informtica Alexandra Moreira Doutoranda em Lingstica Universidade Federal de Juiz de Fora Fbio Mendes Professor Associado. Universidade Federal de Viosa Departamento de Histria Jonas Maral Queiroz Professor Adjunto-Universidade Federal de Viosa Departamento de Histria

Documentos histricos so ferramentas essenciais para historiadores. Em muitos casos, o acesso aos documentos pode ser difcil em funo de inmeros fatores, tais como a distncia, segurana e fragilidade do documento. Uma forma de contornar esse problema a digitalizao e disponibilizao do acesso em uma rede de comunicao, a Internet. Este artigo apresenta um ambiente para visualizao de documentos histricos, desenvolvido dentro do projeto de Digitalizao de manuscritos dos acervos dos Cartrios do 1. e 2. Ofcios do Arquivo Histrico da Casa Setecentista de Mariana - PHAN. Palavras-chave: Digitalizao; Documentos histricos; Busca na Web.

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

168

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

Web environment for search and display of historical documents


Historical documents are essential tools for historians and researchers. However, in many cases, access to documents can be difficult or impossible, depending on factors such as distance, security and fragility of the document. One way to circumvent this problem would be through scanning and allowing access through an open network of communication, such as the Internet. This article presents an environment for viewing of historical documents developed within the digitalization project of the manuscripts of the historical archive of the Cartrios do 1 e 2 Ofcios Casa Setecentista de Mariana-IPHAN. Keywords: Search. Digitization; Historical Documents; Web

Recebido em 14.07.2009 Aceito em 30.07.2011

1 Introduo
A digitalizao tem sido vista como um caminho para complementar solues relacionadas tanto com a preservao como ao acesso de documentos histricos, como sugerido por MOREIRA et al. (2007). um caminho complementar, porque ainda no possvel substituir a tcnica da microfilmagem; no entanto, a digitalizao torna possvel restringir o acesso ao documento original, liberando para consulta apenas o material digitalizado. Alm disso, a possibilidade da transmisso das informaes digitalizadas por meio de uma rede de computadores, como a Internet, permite um maior acesso e agilidade s solicitaes de contedo pelo pblico. Esse ltimo ponto fundamental para a universalizao do acesso aos documentos e ao incremento das pesquisas, no mbito da histria e da arquivstica. No entanto, importante que a disponibilizao dos documentos atendam a alguns requisitos, de forma a atender adequadamente sua finalidade. Existem vrios requisitos de segurana, como desempenho, qualidade de imagem e metadados para a busca, que sero detalhados na prxima seo; eles devem ser atendidos por ambientes que tem como finalidade prover acesso remoto a documentos histricos. Este artigo relata a experincia do projeto e implementao de um ambiente para disponibilizao de documentos histricos, que usa como meio de comunicao a Internet. Esta atividade ocorreu dentro do projeto de Digitalizao de manuscritos dos acervos dos Cartrios do 1. e 2.

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

169

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

Ofcios do Arquivo Histrico da Casa Setecentista de Mariana - IPHAN, coordenado pelo Departamento de Artes e Humanidades da Universidade Federal de Viosa e financiado pela FAPEMIG, por meio do edital FAPEMIG No.009/2005 - USO DA TECNOLOGIA DIGITAL NO RESGATE DA IDENTIDADE HISTRICO-CULTURAL DE MINAS GERAIS (MOREIRA et al., 2007; MENDES et al., 2007). Espera-se que este relato ajude a nortear projetos semelhantes e que os critrios adotados possam auxiliar nas decises difceis, que surgem em projetos desta natureza. A prxima seo descreve os requisitos em ambientes com essa finalidade. Em seguida, apresentada a arquitetura e funcionalidades do ambiente desenvolvido. A seo 4 apresenta os resultados obtidos com o ambiente. Finalmente, a seo 5 apresenta as concluses relativas ao projeto e implementao deste ambiente.

2 Requisitos para Busca e visualizao de documentos histricos distncia


Os seguintes requisitos devem ser atendidos por ambientes que tm por finalidade a disponibilizao de documentos histricos distncia: desempenho: documentos histricos, especialmente manuscritos, fotografias e gravuras, so digitalizados e arquivados no formato de arquivos imagens, como o formato Tagged Image File Format (TIFF) ou Joint Photographic Expert Group (JPEG). Em funo da necessidade de se realizar uma digitalizao a mais prxima possvel do documento original, o processo realizado utilizando-se uma grande resoluo (mnimo de 300 ppi) e profundidade de bits (24 bits). Portanto, esses arquivos ocupam uma grande quantidade espao em meios de armazenamento. O tamanho tpico de apenas uma pgina do projeto fica em torno de 15 megabytes. A transmisso de arquivos desse tamanho, via uma rede de computadores de longa distncia , para os padres atuais de transmisso, invivel. Alm disso, a digitalizao nessa resoluo e profundidade de bits necessria apenas para armazenamento e realizao de futuras cpias, sem a necessidade de se recorrer ao documento original. Para pesquisas comuns, imagens com resoluo bem menores, atendem s necessidades dos usurios. Geralmente, o requisito do desempenho mais prioritrio e, para atend-lo, necessrio reduzir a resoluo das imagens, diminuindo seu tamanho para apenas alguns megabytes, para que possam ser transmitidas rapidamente pela Internet, mas, de tal forma, que seu contedo continue fiel ao original, no apresentando distores, e possa, assim, serem vistas com facilidade. Alm disso, necessrio prover meios de pr-visualizao, como, por exemplo, a exibio de miniaturas (ou thumbnails), para que o usurio possa navegar rapidamente pelas imagens at que encontre uma imagem especfica que seja do seu interesse, e a sim, acesse o seu contedo em tamanho original; a)segurana: ao disponibilizar acesso a documentos histricos em um meio pblico e to irrestrito como a Internet, segurana um grande

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

170

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

requisito e, talvez, o maior desafio. Existem diversos motivos pelos quais se torna necessria a segurana e o controle de acesso em sistemas como esse, dos quais se pode salientar a possibilidade de tais documentos estarem protegidos por leis de direitos autorais, que probem sua cpia por terceiros. Para atender o requisito de segurana, o sistema deve ser capaz de identificar os usurios do sistema e possuir algum meio para garantir a verificao da origem do documento; b) atendimento aos padres arquivsticos: o arquivamento de documentos de qualquer natureza deve seguir as normas estabelecidas pela organizaes relacionadas com a arquivstica, como o Conselho Nacional de Arquivos (CONARQ), de modo a estabelecer a provenincia, facilitar o acesso e o intercmbio de documentos. A norma de arquivamento mais aceita atualmente a International Standard Archival Description (ISAD-G) (INTERNATIONAL COUNCIL ON ARCHIVES - ICA, 2000). A ISAD(G) uma norma estabelecida pelo Conselho Internacional de Arquivos, que visa descrever um contedo informacional, aplicando-se um sistema de nveis. Esse sistema de nveis permite uma descrio detalhada e racional, facilitando o entendimento e o acesso mtuo. Alm disso, respeita os princpios da provenincia e da organicidade; e c) acessabilidade: o requisito da acessabilidade est relacionado facilidade de uso e de busca do sistema. Para cumprir seu papel de ferramenta para universalizao do acesso informao, o ambiente de acesso aos documentos deve ser de fcil utilizao e, tambm, permitir que o usurio possa realizar vrios tipos de busca. Os documentos exibidos tambm devem ser apresentados de forma que facilite a visualizao e a navegao.

3 Solues adotadas para o atendimento dos requisitos


Os requisitos levantados serviram de base para orientar a definio da arquitetura do sistema, que recebeu a denominao de Sistema de Arquivamento e Pesquisa de Documentos Histricos (DigiDoc). Foi projetada uma arquitetura multicamada, utilizando o padro arquitetural Modelo, Viso e Controle (MVC), que preconiza a separao de responsabilidades em camadas de software. Cada camada de software usa os servios da camada subjacente e oferece servios para as camadas superiores. A diviso das responsabilidades em camadas de software torna o sistema mais fcil de ser modificado e mais escalvel. O padro MVC determina que o sistema possua pelo menos trs camadas de responsabilidades: a camada da viso, responsvel pela interface com o usurio; a camada de controle , responsvel pela captura das requisies do usurio e por sua execuo; e a camada do modelo, responsvel pela manuteno do modelo de informao da aplicao. Em sistemas mais complexos, necessrio introduzir um nmero maior de camadas de softwares para reduzir a complexidade geral da aplicao. A FIG. 1 mostra as camadas usadas na aplicao.

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

171

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

Figura 1 - Camadas do sistema

Alm das camadas mnimas do MVC, foi adicionada uma camada de persistncia, responsvel para fornecer os servios de persistncia e recuperao de informao no Banco de Dados. A arquitetura em camadas proporcionou uma maior facilidade para atender aos requisitos, uma vez que cada um deles podia ser tratado separademente, em cada camada. A seguir, sero descritas as abordagens adotadas para atendimento dos requisitos listados na seo anterior. No atendimento do requisito desempenho, as seguintes abordagens foram realizadas: adoo da arquitetura em camadas; reduo da resoluo das imagens dos documentos; e o uso de ferramenta dinmica de zoom. A arquitetura em camadas favorece ao desempenho, por permitir alocar cada camada em um mquina separada. Com isso, podese adquirir mquinas de acordo com a necessidade em atender demanda de acesso. Isto ainda no foi necessrio e, portanto, o sistema est sendo executado em um nico servidor. A imagem original foi reduzida para cerca de um megabyte, tanto para facilitar a transmisso quanto para evitar que a imagem seja utlizada como uma imagem fiel do documento original. Ainda assim, o tamanho de

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

172

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

um megabyte muito grande para a maioria das conexes na Internet. Para solucionar esse problema, foi adotado o formato pyramidal TIFF. O formato Pyramidal TIFF consiste em vrias camadas de imagem (layers), cada uma utilizando uma resoluo diferente (multi-resolution). Cada camada separada em pequenos blocos (tiled). As camadas so ordenadas por sua resoluo, resultando em uma forma semelhante a de uma pirmide, da o seu nome. Esse formato permite o acesso instantneo a qualquer bloco individual de imagem, em qualquer resoluo (a resoluo pretendida pode variar de acordo com o nvel de aproximao (zoom) que o usurio estiver usando), sem que seja necessrio transmitir toda a imagem, minimizando a sobrecarga da rede e do servidor. Na medida em que o usurio vai navegando pela imagem, novos blocos vo sendo requisitados e a imagem vai se montando, parte a parte. Se o usurio voltar para uma regio onde os blocos j foram recebidos, eles no sero carregados do servidor novamente, uma vez que j se encontram no cache do navegador. Ao final, caso o usurio tenha visto toda a extenso da imagem, ter recebido o arquivo todo, sem ter esperado pelo recebimento completo do mesmo. O Pyramidal TIFF uma extenso padro do formato TIFF e reconhecido pela maioria dos programas de edio grfica, como o GIMP1, VIPS2, ImageMagick3, etc. Para converter as imagens originais nesse formato, foi utilizado o programa VIPS, um sistema livre de processamento de imagens, integrado ao sistema web, de modo que a converso feita automaticamente, sempre que se adiciona as imagens de um novo documento ao sistema. Figura 2 - Pyramidal TIFF

Fonte: INTERNET IMAGING PROTOCOL IIP (1997).

1 2 3

Disponvel em: <www.gimp.org>. Acesso em: 12 mar. 2010. Disponvel em: <www.vips.ecs.soton.ac.uk>. Acesso em: 03 maio 2009. Disponvel em: <www.imagemagick.org>. Acesso em: 03 maio 2009.

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

173

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

As imagens no formato Pyramidal TIFF so enviadas para pgina do cliente via o protocolo Internet Image Protocol (IIP, 1997). Para o envio das imagens via IIP, foi utilizado o programa servidor IIPImage, que comunica com a pgina por meio de requises dinmicas em Asynchronous Javascript And XML (AJAX) (GARRETT, 2005). No atendimento do requisito segurana, foi usada a estratgia de autorizao acesso, por meio de login baseada em e-mail vlido. Para isso, o usurio deve se cadastrar no site, fornecendo seus dados pessoais, filiao e um e-mail vlido, que receber uma mensagem eletrnica, contendo um link que deve ser acessado para a confirmao do cadastro. Esta estratgia evita que o usurio fornea um e-mail falso no cadastro e permite que o usurio seja localizado por meio do provedor do servio de e-mail. Isso no evita que um usurio crie um email com dados falsos em um provedor de e- mail, mas garante que, pelo menos, um acesso foi realizado nesse provedor, deixando um algum registro. Uma verificao de indentidade mais rgida chegou a ser cogitada, como o cadastramento via apresentao de documentos, mas essa abordagem foi descartada, em nome de uma maior facilidade de acesso aos documentos, o que um dos principais objetivos da criao do site. Outra restrio o impedimento de baixar, na ntegra, as imagens dos documentos. Os documentos so exibidos em uma janela do site, por meio da tecnologia AJAX, que mostra apenas parte do documento, com uma marca d'gua no canto inferior direito (FIG. 3). Figura 3 - Apresentao dos documentos digitalizados

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

174

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

Essa forma de apresentao evita que o documento seja usado como uma imagem fiel do original e atende apenas aos propsitos de pesquisa. Para o atendimento do requisito acessibilidade, apresentada ao usurio diversas formas de acesso aos documentos. A forma bsica de acesso aos documentos por meio da navegao estrutura hierrquica (FIG. 4), que organizada, segundo os nveis que refletem a organizao interna do arquivo, ou seja: cartrio (primeiro ou segundo ofcio); tipo de documento ( ao cvel , crime , execuo , inventrio , justificao , notificao, sesmaria , testamentaria, alforriascartas, audincias, compra e venda de escravos, fianas de criminosos, hipotecas, notas, procuraes, querelas, registro do testamento); ano ; nmero do cdice; e nmero do auto. Atualmente, somente os inventrios do primeiro ofcio no perodo de 1713 at 1770 esto disponveis. Figura 4- rvore de navegao

O sistema permite, tambm, que o usurio realize buscas sobre os metadados dos documentos. A busca pode ser tanto na modalidade exata quanto na modalidade aproximada.

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

175

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

Na busca exata, os termos de busca fornecidos pelo usurio so passados para o SGBD, no caso o MySQL4, que se encarrega de fazer a busca nos metadados dos documentos cadastrados. Essa busca chamada de exata, pois os termos cadastrados no banco tm que ser idnticos aos termos digitados para serem considerados nos resultados da busca. Por exemplo, os documentos que faam referncia a uma pessoa chamada "Thiago Costa da Silva", sero encontrados se o usurio buscar por "Thiago", mas no sero se o mesmo usurio digitar "Tiago", pois as duas palavras diferem-se pela letra "h". Apesar disso, decidiu-se que a busca exata aceitaria subsequncias de palavras e no s palavras inteiras, isto , a busca pelo termo "arma" poderia ter como resultados quaisquer documentos que tenham palavras com a sequncia "arma", como, por exemplo, "armando", "armador", "farmcia", etc. A busca tambm no sensvel ao caso maisculo ou minsculo dos caracteres, ou seja, os documentos que faam referncia a uma pessoa chamada "Antnio Carvalho da Cunha" podero ser encontrados caso o usurio digite "Antnio", "antnio", "ANTNIO", etc. E, ainda, a busca exata vai considerar como resultado palavras que diferem-se por acentos ou cedilha. Em resumo, documentos que tm a palavra "Antnio" podero ser encontrados pelo usurio que digite "antonio", "antnio", "Antonio", "Antnio", "Anton", "Ant", etc., na busca exata. A desvantagem de se usar a busca exata que torna-se necessrio saber com certa exatido o termo que se est procurando. Alm disso, termos com erros ortogrficos ou com alteraes na grafia no sero encontrados. A grande vantagem a rapidez desse mtodo, capaz de varrer todos os metadados em alguns milissegundos, dependendo da quantidade de documentos cadastrados. Como os documentos podem ser de qualquer poca e as lnguas, em especial a portuguesa, vem passando por constantes transformaes, surgiu um inconveniente: a grafia de muitos nomes foram alterados com o passar do tempo. Alm disso, a transcrio e o cadastro dos documentos so passveis de erros humanos, incluindo o de digitao, que podem modificar a grafia de algum termo. Apesar de toda flexibilidade que foi dada busca exata, ela ainda no capaz de encontrar documentos ignorando certas mudanas de grafia, seja por erro humano, seja por evoluo da lngua. Para solucionar este problema, props-se a implementao de uma busca aproximada. Na busca aproximada, o sistema permite que o usurio a realize por termos aproximados, utilizando o algoritmo shift-and para casamento aproximado, proposto por Ziviani (2004). Neste algortmo, a busca modelada como um autmato finito no determinstico e permite que ocorra casamento de palavra, com at um certo nmero de erros ou distncia da palavra original. Distncia de edio k entre duas cadeias de caracteres x e y o menor nmero de operaes de insero, edio ou remoo necessrias para converter x em y ou vice-versa. Na implementao usada, permitido o casamento com at trs erros e o tamanho mnimo da palavra de seis caracteres.
4
Disponvel em: <www.mysql.com>. Acesso em: 11 fev. 2009.

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

176

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

O mais importante para o usurio, entretanto, so os recursos flexveis de visualizao desenvolvidos para o DigiDoc, desenhados com vista s dificuldades da leitura paleogrfica de manuscritos. A ferramenta de visualizao permite o zoom da imagem com clique-duplo sobre a imagem ou atravs do uso do roller do mouse. A miniatura que aparece direita da imagem permite o deslocamento da imagem e a seleo de parte do documento para leitura. A barra de rolagem esquerda, permite ao consulente uma noo precisa do nmero total de pginas do auto, assim como a transio rpida para qualquer parte do mesmo. Os cones na parte superior permitem modificar a cor de fundo e/ou visualizar o documento em negativo. No atendimento do requisito "atendimento aos padres arquivsticos", adotou-se um conjunto de metadados descritivos, selecionados de um subconjunto dos que so sugeridos na norma ISAD(G) (ICA, 2000). A norma ISAD (G) no uma norma preescritiva, mas sim, diretiva e, por esse motivo, foram usadas como base para a escolha dos metadados adequados ao projeto. Os metadados aplicados aos documentos arquivados na Casa Setecentista de Mariana MG, so de dois tipos: os de acesso pblico e os de acesso restrito. Os metadados de acesso restrito, tais como procedncia e condies de reproduo, so utilizados pelos funcionrios ou tcnicos, nas atividades de descrio do contedo da documentao, enquanto que os de acesso pblico, tais como, idioma, ttulo, mbito e contedo, no possuem restrio de acesso. Outra classificao para os metadados, proposta pela ISAD(G), separao em reas, que agrupam os elementos de descrio comuns. Os metadados foram digitados em uma planilha, para, posteriormente, serem inseridos em um banco de dados. Est prevista para futuras verses do sistema a exportao dos dados no formato Encoded Archival Description (EAD), que um padro de marcao para descrio de documentos, apoiado pela Sociedade Americana de Arquivistas e pela Biblioteca do Congresso Americano.

5 Resultados
O release beta do stio foi oficialmente lanado no dia 10 de outubro de 2008, na cidade de Mariana5 (FIG. 5). Na oportunidade, estiveram presentes diversas autoridades da Universidade Federal de Viosa e do IPHAN, bem como convidados. As imagens, porm, no foram ainda disponibilizadas na sua totalidade. As imagens j digitalizadas, passam por uma rotina sistemtica de reviso, antes de serem adicionadas base de dados. Periodicamente, novos documentos so adicionados e novas funcionalidades so integradas. Atravs da opo Fale Conosco, os usurios fazem contato com a administrao do site, reportando eventuais falhas, erros, dvidas e

Disponvel em: <www.lampeh.ufv.br/acervosmg>. Acesso em: 09 maio 2011.

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

177

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

sugestes. Sempre que possvel e vivel, so feitas alteraes, de modo a incorporar sugestes e crticas dos usurios. O stio do projeto est online desde fevereiro de 2008, tendo passado por uma srie de testes e aperfeioamentos de estrutura e layout, desde ento. O sistema se apresenta estvel e seguro, permitindo acesso rpido, com boa interatividade e alta qualidade de resoluo de imagens. Contamos atualmente com aproximadamente 400 usurios cadastrados, de diversos estados da federao e do exterior, e o nmero de acessos crescente. As imagens digitalizadas esto sendo gradativamente includas na pgina, aps cuidadosa reviso. Atualmente, esto disponveis para acesso livre todos os inventrios digitalizados entre 1713 e 1770, totalizando cerca de 360 autos e aproximadamente 29.000 imagens de alta resoluo.

Figura 5 - Pgina inicial do stio

6 Concluses
No incio do trabalho, foram definidos requisitos de vrias naturezas (desempenho, segurana, atendimento aos padres e acessabilidade) que o sistema deveria cumprir. A estrutura e as tecnologias utilizadas no desenvolvimento, foram selecionadas com o intuito de atender a esses requisitos. Como requisito complementar, procurou-se adotar padres

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

178

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

abertos e tecnologias de software livre, de modo a no se prender a fornecedores especficos. Os metadados selecionados para o padro de arquivamento seguiram os recomendados pela norma ISAD(G), no entanto, a exportao dos metadados no formado XML, associado norma, ainda no foi implementada, mas est prevista para as prximas verses. Para atender ao requisito desempenho, o tamanho das imagens de documentos foram reduzidas para um tamanho que viabilizasse uma transmisso rpida, porm, ainda mantendo uma qualidade de imagem aceitvel. Este requisito possui um ponto de equilbrio difcil de ser atingido e, nesse caso, algum sacrifcio deve ser feito em algum ponto. Particularmente, no caso do sistema desenvolvido, clientes com conexo lenta reportaram muita lentido no acesso aos documentos. Futuras verses devem permitir que o usurio especifique a velocidade de sua conexo para que o sistema envie os documentos em um tamanho mais adequado, com possveis perdas na qualidade da imagem. O requisito de segurana foi atendido por meio de uma soluo simples de cadastramento e de aceitao do termo de compromisso quanto ao uso das imagens dos documentos. Uma marca d'gua tambm foi adicionada s imagens, para identificar sua origem. Para atender ao requisito acessabilidade, foi implementada a possibilidade da navegao em uma rvore, seguindo a ordem cronolgica, alm da busca exata e aproximada sobre os metadados, onde o pesquisador pode selecionar os campos onde ser realizada a busca. O usurio pode, ainda, acessar o instrumentos de pesquisa, que d acesso a arrolamentos onosmticos e cronolgicos, da totalidade do acervo fsico de inventrios da Casa Setecentista de Mariana. Nestes arrolamentos, reunidos no formato PDF, o usurio pode identificar documentos de interesse, atravs da localizao do acervo fsico ("caixa" e "auto") ou pelo nome do inventariado, do inventariante ou pela data. Nem todos os inventrios arrolados esto disponveis atualmente no site. Para verificar a existncia do documento digital, deve-se realizar uma busca exata, usando-se o nome do inventariado. Caso o documento ainda no esteja disponvel, o consulente tem a opo de consult-lo diretamente na Casa Setecentista de Mariana. Como parte de um projeto paralelo, os documentos esto sendo transcritos, de modo que, no futuro, ser possvel fazer buscas no prprio texto do documento. O processo de transcrio lento, uma vez que a transcrio exige prtica e conhecimento sobre a forma de redao de cada perodo. Conclui-se, ento, que todos os requisitos foram atendidos, sendo que alguns em maior extenso do que outros. Alguns aperfeioamentos, detectados a partir do feedback dos usurios, necessitam ser realizados e devem ser incorporados ao sistema, nas prximas verses. Considera-se, tambm, que as metas de conservao preventiva, organizao, informatizao do acervo, digitalizao e acesso pblico, por meio digital, foram plenamente atingidas, tendo o projeto colaborado, de modo significativo, para a preservao e divulgao do importante acervo

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

179

Ambiente para busca e visualizao de documentos histricos na Web

Maurlio de Araujo Possi; Alcione de Paiva Oliveira; Alexandra Moreira; Fbio Mendes; Jonas Maral Queiroz

histrico da Casa Setecentista de Mariana e para o Resgate da Memria Histrico-Cultural de Minas Gerais.

Referncias
INTERNATIONAL COUNCIL ON ARCHIVES (ICA). ISAD(G): General International Standard Archival. 2. ed. Ottawa: CIA/CDS, 2000. Disponvel em: <http://www.icacds.org.uk/eng/ISAD(G).pdf >.Acesso em 12 set. 2007. INTERNET IMAGING PROTOCOL (IIP). Version 1.0.5. [s.l.]: Eastman Kodak Company; Hewlett Packard Company; Live Picture, 1997. Disponvel em: <http://iipimage.sourceforge.net/IIPv105.pdf>. Acesso em: 13 maio 2009. GARRETT, J. J. Ajax: a new approach to web applications. 2005. Disponvel em: <http://www.adaptivepath.com/ideas/essays/archives/000385.php>. Acesso em: 13 maio 2009. MENDES, F. F. et al. Tecnologia a servio da histria. Revista do Arquivo Pblico Mineiro, v. 43, p. 162-167, 2007. MOREIRA, A. et al. Digitalizao de manuscritos histricos: a experincia da Casa Setecentista de Mariana. Cincia da Informao, Braslia, v. 36, n. 3, p. 89-98, 2007. ZIVIANI, N. Projeto de algoritmos com implementaes em Pascal e C. 2. ed. So Paulo: Pioneira Thomson Learning, 2004.

Perspectivas em Cincia da Informao, v.16, n.3, p.168-180, jul./set. 2011

180