Você está na página 1de 10

Área

Gestão

Sub área
O direito autoral e a preservação digital em unidades de informação

DA DIGITALIZAÇÃO DE SUMÁRIOS À POLÍTICA DE PRESERVAÇÃO DIGITAL

Magda De Conto
Bibliotecária Consultora na Área Jurídica
Rua Visconde do Herval, 766, Menino Deus – Porto Alegre/RS
BRASIL – magdadeconto@yahoo.com.br
2

DA DIGITALIZAÇÃO DE SUMÁRIOS À POLÍTICA DE PRESERVAÇÃO DIGITAL

Magda De Conto*

Resumo
Relata experiência de um escritório de advocacia na digitalização dos sumários das
obras de sua biblioteca visando pesquisa direta em texto e sua política de
preservação digital. Apresenta o primeiro estágio do projeto: escolha do mecanismo
indexador e de busca, estudo da lei dos direitos autorais e cita padrões adotados.
Descreve o segundo estágio atualmente em implantação, o do desenvolvimento de
uma política de preservação digital e uso de metadados para identificar o objeto
digital. O projeto prevê ainda o terceiro estágio, de estudo e implementação de novas
práticas relacionadas à preservação física, lógica e intelectual dos objetos digitais.

Palavras-chave: Digitalização. Objeto digital. Preservação digital. Metadados.

1 Introdução

A área jurídica possui várias peculiaridades que a distingue de outras áreas na


busca pela informação. Uma delas é a necessidade de se pesquisar no inteiro teor
do documento. Poucas são as ferramentas e sistemas capazes de realizar tal tarefa.
A maioria dos softwares disponíveis para bibliotecas realiza uma busca nos registros
bibliográficos, disponibilizando o conteúdo do documento para consulta através de
links. Sendo assim, na maioria das vezes o usuário se vê obrigado a fazer nova
busca, agora no conteúdo do texto linkado, utilizando o localizador de programas
como o do Adobe ou do Word, por exemplo, caso os arquivos tenham sido
digitalizados em pdf ou texto.

_______________
*Bibliotecária Consultora na Área Jurídica, com experiência em implantação de softwares e
colocação de banco de dados na Internet. E - mail: magdadeconto@yahoo.com.br
3

No intuito de melhorar esta dinâmica, a bibliotecária responsável pelos livros


no escritório de advocacia realizou um levantamento de softwares disponíveis no
mercado que pudessem pesquisar diretamente no texto, pois o objetivo do trabalho
era o de digitalizar os sumários dos livros existentes no escritório em formato texto
para que a pesquisa pudesse ser feita diretamente no conteúdo do sumário,
eliminando-se assim, uma etapa no processo de busca. O software também deveria
de alguma forma estruturar a informação e ser de baixo custo.

2 Primeiro estágio

2.1 A procura de mecanismos de busca

No final de 2005, além da escolha do scanner e programas complementares


que facilitassem a digitalização dos documentos, houve análise de alguns softwares
conhecidos como Search Engines.
Estes softwares montam um sistema de indexação e busca para arquivos do
computador do usuário, rede ou web. Na grande maioria os resultados são
apresentados numa tela de fácil entendimento e operacionalidade, ou no próprio
navegador (Internet Explorer, Mozilla, Opera, Firefox, Netscape).
Alguns indexam automaticamente os arquivos digitalizados, outros somente se
ativada a tarefa; permitem configurações como uso de operadores booleanos,
aceitam uma infinidade de formatos de arquivos (html, rtf, pdf, txt, xml, ppt, asp, php,
xml, gif, jpg), são de fácil manuseio e rápidos na resposta.
Search Maker Pro, Google Search, Copernic Desktop Search, Windows
Desktop Search, foram alguns dos programas analisados que rodavam em ambiente
Windows. Além destes, foram encontrados mecanismos de indexação e busca para
ambiente Linux, como o Kat Desktop Search Engine, o Beagle e Spotlight, este
último para ambiente Mac Os.
Como a rede existente no escritório baseia-se no Windows, buscou-se um
software compatível com o sistema operacional, que pudesse ser acessado através
4

da rede, que possibilitasse configuração da página de pesquisa, controle dos links


gerados, que aceitasse os formatos de texto, pois havia a necessidade de se alterar
o conteúdo digitalizado acrescentando referência do material e localização, e que
permitisse trabalhar com metadados.
O software adotado foi o Search Maker Pro. Este software além de indexar as
páginas digitalizadas, ou seja, converter em links relativos, gera o índice de forma
dinâmica, utilizando JavaScript.

2.2 Direito autoral

Outro ponto pesquisado foi a questão do direito autoral. Segundo artigo 46 da


Lei 9.610/98 que altera, atualiza e consolida a legislação sobre direitos autorais e
regulamenta dentre outras coisas a cópia no Brasil, é permitida a reprodução de
pequenos trechos da obra, para fins privados, sem o intuito de lucro. O entendimento
de “pequeno trecho”, segundo Carboni (2007) é de cerca de 15 % a 20 % da obra e
que não contenha a “essência do texto”.
O sumário dá ao leitor a idéia do que a obra contém, mas não de sua
essência. Existem na biblioteca do escritório cerca de 2.000 sumários, e por mais
detalhados que sejam, não chegam a 5% da obra. São acrescentadas também ao
texto digitalizado informações que identificam o trecho copiado, a própria referência
do livro. O sumário não constitui em si o conteúdo da obra, sendo então, possível
sua cópia. A Lei 9.610/98 em seu artigo 8º, inciso VI, afirma que “Não são objeto de
proteção como direitos autorais de que trata esta Lei: ...os nomes e títulos isolados” .
Além disso, a digitalização do sumário não prejudica o mercado editorial e não causa
prejuízos aos interesses legítimos do autor. O direito moral do autor citado no art. 24,
de ter seu nome citado, é preservado. O conteúdo digitalizado somente é
visualizado em tela, esta prática não configura violação de direitos autorais segundo
informações obtidas no Seminário Gestão da Informação Jurídica em Espaços
Digitais, ocorrido em Brasília (2007).
5

2.3 Adoção de Padrões

Uma das primeiras medidas que foram tomadas logo após a instalação do
software foi a padronização das rotinas de digitalização, principalmente na forma
como o conteúdo iria ser disponibilizado a fim de tornar a informação um objeto
digital, ou seja, um “arquivo digital contendo informações organizadas, passíveis de
proteção de propriedade intelectual ou patrimonial.” (PAVANI, 2005).
Estas medidas também envolviam utilização de fontes não proprietárias,
definição do formato de arquivo a ser utilizado, leiaute da página digitalizada,
referenciação completa do livro e não só dos elementos essenciaIs segundo a norma
de referências bibliográficas NBR 6023:2002.

3 Segundo Estágio

3.1 Preservação digital

Logo no início do trabalho percebeu-se a necessidade de perenizar as


informações digitalizadas a fim de que continuassem a ser consultadas através de
outros softwares caso o programa adotado não estivesse mais disponível ou mesmo
a tecnologia que dá suporte. Considerou-se que para implantar medidas para
preservação digital seria necessária a adoção de métodos e tecnologias que
protegessem e garantissem sua manutenção (ARELLANO, 2004, p.17) e que
integrariam a preservação física, lógica e intelectual dos objetos digitais.
A preservação física está focada no suporte onde a informação está
armazenada: disco rígido, discos óticos, fitas DAT, fitas VHS. No escritório os dados
são primeiramente digitalizados em rtf, posteriormente convertidos para html e
armazenados no servidor do escritório. Há rotina de geração de cópias de segurança
periódicas para Cd-Rom, sendo que uma cópia de segurança atualizada é mantida
em outro prédio.
6

Já a preservação lógica preocupa-se com a atualização da tecnologia. Há


buscas constantes pela atualização do software adotado e por novos softwares que
possam substituir e ampliar as possibilidades de armazenamento e preservação.
Com relação a isso, Pavani (2005) comenta que “é importante a possibilidade de
migrar de tempos em tempos o conteúdo para um outro ambiente”. Com o atual
sistema e organização de arquivos, qualquer que seja mecanismo de busca, há
possibilidade de migração e conversão de arquivos. Também se faz a procura por
novo hardware a fim de manter vigente os dados para leitura.
A preservação intelectual está relacionada aos mecanismos que garantem
autenticidade e integridade da informação. Neste sentido, há dupla revisão do que foi
digitalizado, consulta ao catálogo de autoridades visando a integridade e qualidade
dos dados. Não se aplica aqui o uso de assinaturas digitais, marca d’ água ou
criptografia .

3.2 Metadados

Os objetos digitais são identificados através de metadados. Estes são dados


estruturados, informações sobre estes objetos: língua, título, descrição, relação com
outros objetos, propriedade intelectual. Estes dados facilitam a preservação da
informação a longo prazo e acesso contínuo.
O Search Maker disponibiliza o Dublin Core – Dublin Core Metadata Element
Set, um conjunto de 15 (quinze) elementos para descrição, armazenados como parte
integrante do objeto que descrevem, inseridos no arquivo html através da tag <meta
name>.

Figura 1. Campos disponíveis do Dublin Core no Search Maker


7

4 Terceiro Estágio

A terceira fase será implementada ainda no ano de 2007. Dentre as atividades


está o planejamento de uma política de preservação a longo prazo, a pesquisa de
tecnologias que facilitam a criação de objetos digitais e a possível disponibilização
destes sumários na BdJur- Biblioteca Digital Jurídica do Superior Tribunal de Justiça.

4.1 Planejamento de uma política de preservação digital a longo prazo

Visa estabelecer normas que garantam o acesso aos objetos digitais ao longo
do tempo. Primeiramente serão documentadas as práticas já adotadas. Itens como
manter política de preservação atualizada, verificação constante da estabilidade da
tecnologia no mercado, preferência pela utilização de padrões abertos, possibilidade
de acesso através de diversos softwares e de migração dos documentos, replicação
de dados objetivando possuir cópias de segurança e autenticidade, são alguns dos
itens a serem incorporados na política que conduzirá o trabalho futuro.

4.2 Pesquisa de novas tecnologias

Dentre as tecnologias a serem pesquisadas estão os softwares que restauram


a cópia digital, que removem manchas de tinta, amarelados e rabiscos de modo a
melhorar a qualidade do objeto digital. Será analisada a questão custo x benefício.
Uma análise do PDF-Archive – tags, etiquetas para o armazenamento
arquivístico de documentos eletrônicos (PDF-A), será feita, observando-se a
viabilidade de sua implementação e a maneira mais adequada de se fazer isso.

4.3 Disponibilização dos sumários digitalizados na BdJur

Como uma forma de contribuição e compartilhamento da informação, estes


arquivos serão remetidos à Biblioteca do Superior Tribunal de Justiça, onde
8

possivelmente receberão novos tratamentos, tendo em vista sua publicação para o


público em geral.

Estas ações descritas acima serão feitas objetivando um aprimoramento das


práticas adotadas e formulação de estratégias que possam ser implementadas
assim que novos desafios forem surgindo, ou mesmo antes deles, de modo a
conduzir o trabalho de forma proativa.

5 Conclusão

Vários fatores têm de ser observados quando do início do processo de


digitalização: análise do que há no mercado em termos de hardware e software
(pode-se dizer que nenhum sistema irá atender totalmente às expectativas), a troca
de conhecimento com outros profissionais que estejam estruturando bibliotecas
digitais e o treinamento das pessoas envolvidas, pois o fator mais preocupante em
termos de segurança digital não é o sistema ou os mecanismos adotados para tal,
mas quem os opera.
Quando do início do trabalho se faz necessária a adoção de padrões
(metadados, repositórios digitais), a definição de uma política de preservação digital
que contenha informações precisas de como será capturada e armazenada a
informação, de como será feita a preservação do objeto digital, de como será
mantida a integridade e autenticidade dos dados, de que forma será realizado o
acesso e de como serão tratadas as questões de direito autoral.
Um sistema assim estruturado, além de possuir informações do conteúdo dos
textos e de realizar uma pesquisa precisa, poderá fornecer informações de “vida” do
documento em papel e do objeto digital, fundamentais para sua perpetuação. Sendo
assim, pode-se dizer que o objetivo da biblioteca do escritório de advocacia até o
presente momento está sendo alcançado, de forma que as ações já estão sendo
compartilhadas com outras bibliotecas da área.

6 Bibliografia consultada
9

ARELLANO, Miguel Angel. Preservação de documentos digitais. Ciência da


Informação, Brasília, v. 33, n. 2, p. 15-27, maio/ago. 2004.

BRASIL. Lei n. 9.610 de 19 de fevereiro de 1998. Altera, atualiza e consolida a


legislação sobre direitos autorais e dá outras providências. Diário Oficial da União.
Brasília, DF, 20 fev. 1998.

CARBONI, Guilherme. Direitos autorais em espaços digitais. In: SEMINÁRIO


GESTÃO DA INFORMAÇÃO JURÍDICA EM ESPAÇOS DIGITAIS, 1, 2007, Brasília,
DF. [Anotações]. Brasília: STF, 2007.

HEDSTROM, M. Digital preservation: a time bomb for digital libraries. Disponível


em: <http://www.uky.edu/~kiernan/DL/ hedstrom.html>. Acesso em: 25 de mar.
2007.

LIMA, Gladys Machado Pereira Santos Lima; CUNHA, Maria Rosângela da.
Preservação digital na Marinha do Brasil. In: WORKSHOP EM BIBLIOTECAS
DIGITAIS, 1, 2005, Uberlândia, MG. [Biblioteca digital brasileira da Computação].
Disponível em: <http://www.lbd.dcc.ufmg.br:8080/colecoes/wdl/2005/Preservacao
DigitalMBcr.pdf>. Acesso em: 12 de mar. 2007.

PAVANI, Ana. Curso de ETDs: Electronic Theses e Dissertations [palestra].


Porto Alegre, 2005.

SARAMAGO, M.L. Metadados para preservação digital e aplicação do modelo


OAIS. Disponível em: <http://www.unicamp.br/siarq/doc_eletronico/metadados.pdf>.
Acesso em: 03 de mar. 2007.

SHEARCH Maker Pro. Disponível em: <http://www.searchmakerpro.com>. Acesso


em: 07 mar. 2007.

SEMINÁRIO GESTÃO DA INFORMAÇÃO JURÍDICA EM ESPAÇOS DIGITAIS, 1,


2007, Brasília, DF. [Palestras]. Disponível em: <http://www.stf.gov.br/sijed/
palestras.asp>. Acesso em: 22 fev. 2007.

SULLIVAN, Susan. PDF Worldwide collaboration to preserve electronic documents.


Iso Focus, Boston, p. 17-20, mar. 2006.

Abstract
This article explains about the experience of a legal profession office in the
digitization of the summaries of the books, seeking direct research in text and its
politics of digital preservation. It presents the first stage of the project: choose of the
10

index mechanism and search engine, implication of the law of the copyrights and it
mentions adopted patterns. It describes the second stage now in implantation:
development politics of digital preservation and metadados, used to identify the digital
object. The project still foresees the third stage, of study and implementation of new
related practices the physical, logic and intellectual preservation of the digital objects.

Keywords: Digitalization. Digital object. Digital preservation. Metadata.

Você também pode gostar