Você está na página 1de 43

Guia para digitalizao

de documentos
Verso 2.0

Embrapa
Informao
Tecnolgica
Fevereiro 2006
Verso de 2001,

Grupo de trabalho.

Anna Christina Aun de Azevedo Nascimento


Cristiane Vieira Peres
Maria Jos de Oliveira
Karla Igns Corvino Silva

Verso de 2006

Reviso de Anna Christina Aun de Azevedo Nascimento

Empresa Brasileira de Pesquisa Agropecuria Embrapa


SCT Fevereiro de 2006. Braslia, DF

2
Introduo

Em 2001, a Embrapa Informao Tecnolgica, por meio de sua Gerncia de


Organizao da Informao tomou a iniciativa de desenvolver um Guia Geral de
Digitalizao de Documentos visando orientar as atividades de digitalizao dos
documentos da Empresa. Alm disso, o Guia tambm teve como propsito a
preservao de originais que materializavam as atividades do capital intelectual da
Embrapa, ao mesmo tempo que proporcionava maior disseminao de seus
contedos.

Em dezembro de 2005 a nova verso comeou a ser produzida com o


objetivo de revisar e atualizar o documento original. A Embrapa Informao
Tecnolgica novamente financiou o Guia de Digitalizao cumprindo a sua funo
de estimular e orientar as Unidades da Embrapa no processo de organizao da
informao, assim como integr-las e torn-las parte de uma grande rede de
fornecedores de informaes digitais. recomendvel que esse Guia seja
utilizado para ajudar o desenvolvimento do planejamento e implementao de
digitalizao de materiais.

Recentemente tem-se verificado a importncia de se aplicar tcnicas e


padres de forma inteligente e consistente nos procedimentos relacionados a
desenvolvimento e publicao de contedos digitais. O uso de padres, alm de
adicionar longevidade e escalabilidade ao ciclo de vida dos materiais, tambm
possibilita a um pblico ainda maior do que o originalmente pensado a descobrir e
usar os recursos de informao.

Um dos objetivos desse Guia de Digitalizao mostrar a importncia de se


pensar na questo da sustentabilidade dos programas. Ao adotar prticas que
possibilitam o compartilhamento dos recursos produzidos pela Empresa,
possvel assegurar um uso mais abrangente dos materiais. Tanto hoje quanto no
futuro, audincias que nem mesmo foram consideradas podero estar se

3
beneficiando dos contedos digitais e fazendo novas combinaes e criando
novos recursos.

A padronizao assegura a qualidade, consistncia e segurana dos


recursos, e faz com que eles sejam compatveis com os recursos de outras
projetos. Iniciativas que utilizam essa abordagem promovem escalabilidade e
podem ser mantidas e gerenciadas com o mximo benefcio para todos.
Resumindo, uma boa prtica de digitalizao de materiais pode ser avaliada pela
sua capacidade de maximizar a utilizao desses recursos enquanto minimiza o
custo de sua manuteno e uso.

Finalidade

O propsito deste documento oferecer orientaes bsicas e prover


recomendaes mnimas necessrias digitalizao de materiais em formatos de
texto, fotografia, mapas e ilustraes. Este guia no deve ser considerado como o
melhor padro disponvel para digitalizao, mas sim como um recurso de
orientao para a captura de imagem, apresentao, armazenagem e preservao
de originais. Alm disso, o guia fornecer aos autores de materiais, tcnicos e
dirigentes da empresa, orientaes necessrias para que eles possam avaliar se
determinada estratgia de digitalizao proposta adequada ou no ao seus
objetivos e materiais. Apesar deste documento no ter a inteno de ser a ltima
palavra no assunto, ele pode ser utilizado como uma referncia para aqueles que
esto iniciando procedimentos de digitalizao e publicao de seus recursos de
informao.

Este guia contempla principalmente orientaes que propem:

Aumentar a interoperabilidade entre os diversos repositrios de contedos


digitais.

4
Assegurar a acessibilidade aos recursos atravs do uso de padres e
formatos amplamente aceitos.

Possibilitar o uso dos materiais por diversos pblicos.

Incorporar procedimentos que estimulam a preservao dos materiais


originais.

As tecnologias esto constantemente mudando e se aperfeioando,


portanto, este guia um trabalho em constante desenvolvimento. Seus
comentrios e sugestes so bem vindos para complementar as
orientaes aqui propostas.

5
Princpios gerais

Escanear na maior resoluo possvel apropriada para a natureza do


material original.
Escanear em nvel de qualidade apropriado para evitar o re-trabalho e re-
manuseio dos originais no futuro.
Criar e armazenar um arquivo mestre que poder ser utilizado para produzir
arquivos de imagens derivadas que atendam a uma variedade de
necessidades atuais e futuras.
Preferir sistemas no-proprietrios.
Utilizar formatos de arquivos e tcnicas de compresso em conformidade
aos padres mais amplamente utilizados pelas comunidades que utilizam
as informaes da EMBRAPA.
Criar cpias de segurana de todos os arquivos em mdias estveis.
Criar metadados significativos para os arquivos de imagens ou colees.
Armazenar a mdia em ambiente apropriado.
Documentar estratgias de migrao para transferncia de dados atravs
das geraes de tecnologia.

6
Tpicos
do Guia de Digitalizao

Introduo.................................................................................................. .3

Finalidade............................4

Princpios gerais ........................................................................................6

Planejamento........................................................................ .......... ............9


Fases do planejamento ... ..................................................... .......... .......... 10

Formas gerenciais de produo digital........................................................ 11


Na prpria Instituio ............................................................ .................... 11
Terceirizao ......................................................................................... 12

Audincia alvo........................................................................................... 13
As demandas e necessidades.................................................................... 14

A seleo de materiais......................................................... ....................15


Caractersticas do material original ............................16
Propriedades fsicas dos materiais ........................................................... 17
Objetivos da digitalizao........................................................................... 18
Direitos autorais ........................................................................................ 19

Equipamento............................................................................................. 19
Computador ............................................................................................... 20
Monitor ........................................................................................................20
Gravador de CD-DVD ................................................................................ 21
Porta de transferncia de alta velocidade .................................................. 21

Scanners ................................................................................................... 21
Resoluo.................................................................................................. 21
Profundidade de cores ............................................................................. . 22
rea de escaneamento .............................................................................. 22
Tempo de digitalizao .............................................................................. 22
Usabilidade .................................................................................................23

Cmeras digitais ...................................................................................... 23

Software..................................................................................................... 24

Criao de arquivos digitais .................................................................. 25


Arquivo mestre.......................................................................................... 26

7
Arquivo de imagens derivadas ................................................................. 26

Tipos de escaneamento........................................................................... 27

Digitalizao de documentos.................................................................. 28
Recomendaes para texto ...................................................................... 29
Recomendaes para Fotografias............................................................. 30
Recomendaes para Mapas..................................................................... 31
Recomendaes para Material grfico....................................................... 31
Recomendaes para imagens de diferentes funcionalidades ................. 32

Controle de qualidade ............................................................................. 33

Denominao dos arquivos......................................................................34

Armazenagem.......................... 35
Disco rgido ............. 36
CDs............. 36
DVDs............. 36

Metadados e Objetos digitais.................................................................. 37

Anexo I
Fontes complementares de informao................................................ 38
Escaneamento........................................................................................... 38
Metadados ............. 38
Outras fontes de informao..................................................................... 39

Anexo II
Glossrio................................................................................................... 41

8
Planejamento

A iniciativa de digitalizar contedo requer um planejamento cuidadoso antes


de sua implementao. Tal planejamento deve sempre considerar o plano
estratgico da instituio como um todo, desde o de mbito tecnolgico ao de
fluxo de trabalho. Um bom planejamento, para qualquer projeto requer um nmero
de decises e questes, tais como as que seguem:

Qual o trabalho que precisa ser feito;

Como ser feito (de acordo com padres, especificaes, modelos bem
sucedidos);

Quem dever fazer o trabalho;

Aonde ser feito;

Quanto tempo de trabalho;

Qual ser o custo;

O objetivo desta seo alertar para certos tens do processo de


planejamento e indicar os pontos decisivos, como: analisar os recursos
necessrios, verificar o pessoal e o equipamento requerido, selecionar o tipo
adequado de metadados, e a gesto do projeto como um todo.

A tecnologia tem se desenvolvido e mudado muito rapidamente nos dias de


hoje, portanto parece quase impossvel tomar decises sobre padres,
especificaes, equipamento, habilidades e metodologias com total segurana.
Porm, para quem est planejando um projeto, no s a preocupao com
esses detalhes que garantir uma tomada de deciso acertada. muito mais
importante entender os princpios bsicos que envolvem a produo e qualidade
da converso digital do que saber a capacidade que oferece um determinado
equipamento. Esses princpios se aplicam de forma geral e sofrem menos
mudanas e de forma bem mais lenta. Com esse conhecimento, o gestor de um

9
projeto de digitalizao pode identificar mais facilmente a equipe de profissionais
de que ele precisa, assim como estabelecer um modelo efetivo para o
desenvolvimento do trabalho. Este Guia contem informaes sobre uma srie de
aspectos tcnicos, mas sua maior contribuio espera-se estar na apresentao
de questes mais fundamentais e de como elas esto relacionadas.

Fases do planejamento

A audincia alvo A identificao da audincia deve ser a sua primeira


preocupao, assim como as respostas s perguntas Quem precisa desse
trabalho? Quem se beneficiar dele?.

Seleo do material As informaes obtidas do levantamento inicial sobre


a audincia influenciaro a etapa de seleo dos materiais que sero digitalizados.
Nesta fase, voc tambm dever pensar sobre medidas relacionadas a direitos
autorais, e sobre como os materiais digitalizados sero distribudos: quais as
tecnologias que sero utilizadas, se o acesso aos contedos sero abertos ou
controlados, e como voc poder alcanar o seu publico alvo.

Estabelecendo padres A utilizao de padres, sempre que possvel,


aumenta a longevidade, portabilidade e interoperabilidade do seu contedo.
importante que voc conhea os padres que se aplicam ao tipo de digitalizao
que voc est pretendendo.

Seleo de equipamentos A seleo de equipamentos deve ser tomada


considerando a funcionalidade requerida e as suas prioridades. Um exemplo disso
poderia ser manter os custos baixos mais importante do que conseguir o melhor
padro de captura de imagem.

Equipe de trabalho A questo sobre metodologia e procedimentos est


intimamente relacionada com a deciso sobre pessoal e, portanto, influenciar as
decises acerca de Quem dever fazer o trabalho? Voc dever identificar o
perfil dos profissionais necessrios e estabelecer as tarefas que espera que sejam

10
cumpridas. Nessa fase voc poder concluir que precisar de colaboradores
externos junto a sua equipe.

Formas gerenciais
de produo digital

As imagens digitalizadas podem ser produzidas sob duas condies:

Na prpria instituio

Nesta categoria enquadram-se as produes realizadas no mesmo


ambiente detentor dos documentos a serem digitalizados ou na prpria instituio.
Esta modalidade oferece vantagens e desvantagens, conforme pode ser
observado abaixo.

Vantagens da produo na prpria empresa:

Adquirir experincia no processo de digitalizao de imagens (projeto de


administrao, familiaridade com a tecnologia, etc.).

Controlar o processo de digitalizao de imagem desde a manipulao


dos originais at o armazenamento.

Ajustar os requerimentos necessrios quanto qualidade, acesso e


escaneamento da imagem medida que se progride no processo.

Acompanhar diretamente o processo de digitalizao de imagens que


melhor satisfaz as necessidades da Empresa e dos usurios.

Desvantagens da produo na prpria empresa:

Requerer, inicialmente e durante o projeto, um grande investimento


financeiro em equipamento e pessoal.

11
Necessitar mais tempo para a implementao do processo, da infra-
estrutura tcnica, e de gerao de imagens.

Exigir grande investimento para uma produo limitada.

Necessitar de especialistas para consultoria, contratos e custos de


manuteno,treinamento de pessoal, etc.

Desconhecer padres e prticas melhores.

Terceirizao

Caso a Unidade no tenha condies ou no pretenda digitalizar suas


imagens in loco, dever considerar as seguintes vantagens e desvantagens na
terceirizao da atividade:

Vantagens de terceirizar:

Pagar pelo custo somente da digitalizao da imagem, no pelo


equipamento ou equipe.

Alto nvel de produo.

Ter especialistas no assunto.

Correr menos risco de perdas.

Descartar custos relacionados com a obsolescncia da tecnologia,


falhas, tempo de inatividade do sistema, necessidade de treinamento de
mo-de-obra, etc.

Desvantagens de terceirizar:

Menor controle sobre o processo de digitalizao de imagem e controle


de qualidade.

Necessitar o estabelecimento de contrato complexo, descrevendo todas


as especificaes necessrias, direitos e deveres de ambas as partes.

12
Divergncia na comunicao entre vendedor e consumidor, dificultando
o estabelecimento de padres de negociao e medio da qualidade
do servio.

Necessitar transporte, manuseio e armazenamento dos originais por


equipe da empresa de terceirizao.

Possvel inexperincia do prestador de servio com o material da


Embrapa.

Audincia alvo

Instituies de pesquisa, como a EMBRAPA, atendem s necessidades de


diversas comunidades de usurios de estudantes, acadmicos e pesquisadores,
a agricultores, empresrios e do pblico em geral. Ao iniciar o desenvolvimento e
planejamento do processo de digitalizao, importantssimo que voc conhea o
seu publico alvo. Esta informao influenciar muitas de suas decises, tais como:
os itens que sero digitalizados, a tecnologia que ser utilizada, os mecanismos
para acesso, e a forma de apresentao do material para os usurios. Por
exemplo, voc poder descobrir que tem materiais que interessam tanto a
estudantes de agronomia quanto a pequenos produtores agrcolas, mas que cada
um desses pblicos requer um tratamento diferenciado da interface de
apresentao do material. Neste caso, apesar de voc poder usar a mesma
tecnologia para re-formatar o material, e publicar duas verses usando o mesmo
sistema, voc dever desenvolver duas interfaces distintas, do mesmo material,
para atender aos diferentes usurios.

Portanto, as primeiras questes que devero ser respondidas ao iniciar um


projeto de digitalizao so:

Onde est o publico que dever acessar o meu material?

Qual o perfil dessa audincia?

13
O material no formato digital me ajudar a atender melhor as
necessidades dessas comunidades de usurios?

A digitalizao de materiais me ajudar a criar novas audincias para os


meus materiais?

As demandas e necessidades do pblico alvo

As necessidades do pblico da empresa, tambm devem guiar as decises


do projeto de digitalizao. Apesar de ser difcil prever como ser o uso do
ambiente eletrnico no futuro, o que se sabe hoje sobre os hbitos dos usurios
pode ser usado como referncia. O conhecimento do perfil dos usurios, e suas
preferncias para acessar informao podem indicar vrios aspectos a serem
atendidos, limitaes e possibilidades de desenvolvimento. Considere as
seguintes questes sobre o seu pblico:

Qual o tamanho do pblico alvo?

Qual a distribuio geogrfica?

H necessidade por acesso descentralizado (de diferentes instituies


ou de casa)?

O seu pblico necessita de ferramentas especiais ou condies


especiais para utilizar os recursos digitais?

H vrios grupos diferentes de usurios que precisaro de diferentes


formas e nveis de acesso?

Se voc ainda no tem suficiente informao sobre o seu pblico para


responder essas questes, voc precisar de uma estratgia para colet-las e
avaliar se os recursos digitais atendem as demandas atuais e futuras desses
usurios. A digitalizao tambm pode ser utilizada para trazer novos pblicos e
ajudar a expandir contedos especializados para um publico maior. Contedos

14
digitais podem reforar a educao continuada, e ajudar a promover a incluso
social e cultural abrindo acesso para grupos menos favorecidos socialmente.

O nvel de tecnologia que o pblico alvo utiliza para acessar informao


digital tambm deve ser considerado como um fator importante na hora de
selecionar os materiais e as metodologias para digitalizao. Se os usurios no
tm comprimento de banda suficiente para baixar ou visualizar arquivos grandes
como o de imagens, por exemplo, este material corre o risco de no ser
disseminado com sucesso. Por outro lado, os seus usurios podem ter uma
expectativa de sua empresa que ela ainda no est pronta para corresponder.
Voc precisar ento decidir quais so as demandas mais importantes a serem
atendidas, e traar estratgias para desenvolv-las.

A seleo de materiais

H uma srie de questes que devem ser consideradas ao decidir sobre o


material que dever ser digitalizado, tais como as metas e caractersticas da
instituio, o perfil e necessidades dos usurios, e as caractersticas dos prprios
materiais.

A seguir, algumas questes importantes que devem ser respondidas para a


seleo de materiais:

Qual o propsito de digitalizar material e quais os critrios que sero


utilizados para selecion-los?

Quais sero os usurios desses recursos?

Quais so suas necessidades?

Os materiais selecionados iro requerer cuidados especiais no


manuseio?

15
Quais as caractersticas dos materiais e como elas podem afetar o
processo de digitalizao?

Caractersticas do material original

As colees de documentos, imagens, vdeos, e outros formatos de


informao so componentes importantes do capital intelectual de uma empresa
como a Embrapa. Um bom programa de digitalizao comea com um
levantamento das diversas formas de material da instituio e sua relao com as
demandas de seus pblicos.

O planejamento para digitalizao dever basear-se nos requerimentos


obtidos das anlises dos recursos analgicos e de suas caractersticas fsicas, e
no a partir dos recursos tecnolgicos disponveis. A anlise dever incluir uma
avaliao do material original, suas condies, caractersticas, e o seu valor
educacional, cultural, histrico e cientfico.

Questes que devem ser respondidas antes da seleo de material para


digitalizao:

Qual a relevncia intelectual do material no formato analgico?

original?

H outro exemplar na instituio em melhores condies?

O contedo est completo ou est faltando alguma parte?

A informao est atualizada?

A informao est correta?

O material um interesse efmero dos dias de hoje, ou ele ainda ser


de interesse com o passar do tempo?

16
A digitalizao tambm pode aumentar o valor intelectual de seus materiais
quando permite novas possibilidades educacionais, como por exemplo:

Oferecendo cpias digitais de boa qualidade disponveis para acesso


em diferentes instituies, e em diferentes pases;

Permitindo o acesso e estudo personalizado do material, com


combinaes e justaposies do contedo, de acordo com interesses
particulares.

Facilitando o acesso a novos pblicos, e permitindo novas formas de


explorar e aproveitar o material;

Oferecendo a possibilidade de pesquisa e manipulao de textos em


formato eletrnico;

Oferecendo acesso a diferentes verses e edies, e dando mais


flexibilidade e riqueza de utilizao do que seria possvel com um texto
de formato impresso;

Criando catalogaes eletrnicas que permitem pesquisas rpidas de


materiais, em variados formatos de mdia.

Propriedades fsicas dos materiais

Apesar da relevncia intelectual dos contedos ser um fator crtico para a


seleo dos materiais que sero digitalizados, as caractersticas fsicas desses
recursos tambm devero influenciar bastante a sua deciso, uma vez que elas
afetam diretamente o produto digital que ser obtido no processo.

A seguir, algumas questes que serviro de ponto de partida para gui-lo


no processo de examinar os materiais.

17
Propriedades fsicas dos materiais

Tipo e categoria do recurso ( um livro impresso, texto escrito a mo,


programa de TV em VHS, um original ou uma reproduo?)

Data (quantos anos tem? Sabe quando foi feito? )

Tamanho e dimenses fsicas ( um livro de tamanho regular?


uniforme? Qual o tamanho em cm? Qual a durao da fita de vdeo
em horas/minutos/segundos?)

Tipo de mdia (papel, Madeira, couro, vdeo cassete magntico;


combinao de materiais?)

Formato (disco de 78 rpm, fita cassete analgica, DAT (Digital Audio


Tape), Betacam SP tape, NTSC ou PAL formato de vdeo)

Estrutura do material (o material encadernado?)

Condies de preservao (qual o estado de conservao? Dever ser


preservado? Requer manuseio especial?)

Objetivos da digitalizao

Alm dos passos j listados (examinar o valor intelectual dos recursos,


como isto poder ser melhorado com a digitalizao, e considerar os atributos
fsicos dos seus materiais), outros princpios podem ajud-lo a priorizar o processo
de seleo.

Abaixo, esto as principais razes para justificar uma iniciativa de


digitalizao na instituio.

Melhorar o acesso;

Ajudar na preservao dos materiais originais reduzindo seu manuseio;

Facilitar atividades de pesquisa;

18
Atender as necessidades do pblico;

Complementar outras iniciativas de digitalizao, de dentro e fora da


instituio.

Direitos autorais

Assim que voc identificar o material que dever ser digitalizado comece a
cuidar dos aspectos relacionados a propriedade intelectual. Se o material que
voc quer digitalizar de domnio publico, ou se a empresa possui os direitos
autorais e controla os direitos para digitalizao, ento voc provavelmente poder
prosseguir sem impedimentos.

Se os materiais que voc quer digitalizar no so de domnio pblico, e


voc no controla os direitos autorais, ser preciso identificar o detentor desses
direitos e solicitar permisso para digitalizar e publicar o material em questo.
Mesmo que voc j saiba quem o detentor dos direitos, e mesmo que voc j
tenha permisso para uso do material para certos propsitos, voc ainda ter que
se certificar que a sua permisso cobre a digitalizao e publicao em meio
digital.

Equipamento

O processo de digitalizao exige, antes de sua implementao, a busca de


informaes bsicas que orientem a escolha de mquinas e equipamentos
diferenciados, que possam atender tanto a tarefa de escanear como a de
armazenar, organizar, visualizar e editar informaes. A escolha do equipamento
depende, sobretudo, do tipo de material que ser escaneado, assim com a
inteno de uso das imagens digitais.

19
Um dos grandes desafios de quem decide realizar um projeto de
digitalizao est relacionado com a rapidez com que hardware e software se
tornam obsoletos. Portanto, as decises sobre mquinas devem considerar as
implicaes que as mudanas tecnolgicas podem ter no ciclo de vida dos
materiais digitais. A escolha do equipamento depende, sobretudo, do tipo de
material que ser escaneado assim como a inteno de uso das imagens digitais.

A seguir, os tens bsicos para a digitalizao de documentos:

Computador

muito importante selecionar o tipo adequado de computador para o


processo de digitalizao. Os principais componentes que devem ser
considerados para a escolha do computador so: memria, velocidade do
processador, o tamanho do espao para armazenagem, e portas de transferncia
de dados.

Principais componentes para a escolha do computador:

Computador com o mximo de memria (RAM) possvel. Quanto mais


memria mais capacidade para o computador processar informaes.

Computador com processador otimizado para manipulao de imagens.

Computador com capacidade para conexes do tipo USB ou IEEE1394.

Gravador de CD e DVD.

Monitor

Um monitor de alta qualidade, com tela acima de 17 polegadas, alta


resoluo, alta velocidade, sem tremulaes e com suporte para vdeo RAM que
possa produzir imagens representativas do original digitalizado fundamental para
a manipulao e editorao de imagens.

20
Gravador de CD-DVD

A aquisio de um gravador de CD-ROM ser necessria quando a


Unidade optar pela armazenagem das imagens digitalizadas em CDs. Para salvar
as imagens em CD-ROM necessrio que o equipamento adquirido esteja de
acordo com as normas ISO e que suporte uma variedade de formatos.

Porta de transferncia de alta velocidade

(USB 2.0 ou Firewire). Interfaces de transferncias de informao


permitem que o seu computador converse com os perifricos, tais como:
scanners, impressoras, cmeras digitais, etc.

Scanners

Existem scanners de vrios tipos, tamanhos e nveis de qualidade. A


escolha de um scanner depende do objetivo do trabalho, do formato, tipo e
tamanho do material que se pretende digitalizar.

A seguir, outros fatores que devem ser considerados quando da escolha de


um scanner:

Resoluo

A resoluo o fator determinante na qualidade de um scanner, isto , o


nvel mximo de detalhamento que pode ser capturado de uma imagem. A
resoluo ptica de um scanner medida pela capacidade de leitura de seu
sensor de imagem. Quanto maior a resoluo ptica melhor.

Valores acima da resoluo ptica podem ser alcanados por meio de um


recurso de software conhecido como interpolao, que gera pontos extra, a partir

21
de amostragens da imagem capturada. Entretanto, existem limites para essa
tcnica, que pode produzir imagens com menor nvel de detalhes.

Profundidade de cores

Trata-se do nmero de cores que cada ponto captado pelo scanner pode
ter: preto e branco (1 bit), 256 cores ou escala de cinzas (8 bits), e True
Color (24 bits). Quanto maior a profundidade de cores maior a quantidade de
informaes capturada pelo scanner, e portanto, maior a similaridade entre a cpia
e o original.

rea de escaneamento

A rea de digitalizao do scanner, normalmente delimitada pela superfcie


de vidro do equipamento, costuma variar pouco de um modelo para outro. Em
geral todos os scanners so capazes de digitalizar documentos com a largura
mxima de uma folha tamanho carta e o comprimento de uma folha formato A4.

Tampas removveis facilitam a digitalizao de objetos de grande


espessura, como livros e revistas. A capacidade de aceitar acessrios extra, tais
como alimentador de folhas avulsas, so oferecidos como opcionais em alguns
modelos mais sofisticados.

Para escanear slides, diapositivos, negativos ou transparncias, o ideal


que se utilize um scanner prprio para esse tipo de material.

Tempo de digitalizao

Uma caracterstica normalmente associada ao desempenho de um scanner


o tempo que o equipamento demora para digitalizar um documento. Isso pode
ser influenciado por vrios fatores, entre eles, a resoluo desejada, o nmero de
passadas do carro do sensor e as caractersticas do programa de digitalizao.

22
Usabilidade

Algumas interfaces so bastante simples, limitando-se a definir cor,


resoluo, e rea de digitalizao; outras apresentam interfaces complexas com
vrias opes de tratamento de imagem no prprio programa.

A complexidade da interface pode transformar a digitalizao num


complicado processo de captura e tratamento de imagem, que toma tempo,
processamento do computador, e, em muitos casos, a pacincia do usurio.

Cmeras digitais

Embora sejam equipamentos que exigem altos investimentos, as cmeras


digitais manuais disponveis atualmente no mercado no so boas para
escaneamento de grandes arquivos, com exceo das cmeras digitais de alta
resoluo (Kontron, Zeutschel, Leica) usadas por grandes instituies e empresas
no ramo comercial de imagens.

As cmeras digitais de alta resoluo no tm nenhuma limitao para o


escaneamento e podem capturar numa resoluo extremamente alta. Porm elas
tm requerimentos especficos sobre iluminao, e exigem um alto nvel de
habilidade do operador. As vantagens dessas cmeras esto no grande potencial
para escanear materiais de tamanho grande, todos os formatos de mdia,
materiais encadernados, e o baixo risco na operao com os materiais frgeis.

As cmeras digitais no usam filme para capturar imagens. As fotografias


so armazenadas numa mdia interna ou em cartes de memria. A capacidade
varia de 4MB a 512MB e est aumentando cada vez mais com o progresso da
tecnologia. Os cartes de memria guardam um nmero razovel de imagens,
dependendo da resoluo escolhida e da capacidade do carto. Se voc utilizar o
formato TIFF de imagens, ento os arquivos sero grandes, e logo esgotaro a
capacidade do carto. Portanto, voc dever optar por transferir as imagens
diretamente para o seu computador, antes de tirar novas fotografias.

23
Software

H dois tipos de software necessrios para a digitalizao de imagens. Um


deles o software de escaneamento que vem com o scanner; o outro, o
software de edio de imagens, normalmente aplicado aps a captura da imagem.

Alguns softwares, como o Adobe Photoshop, podem servir tanto como


software de escaneamento como de edio de imagem.

O software de escaneamento geralmente limitado quanto a


funcionalidade. Deve-se escolher um software de escaneamento que tenha pelo
menos a funcionalidade de salvar os arquivos de imagens em formatos padres,
tais como TIFF, JPG, GIF etc. Essa funcionalidade ajuda na produo e permite
ampla opo de imagens para distribuio em diferentes mdias.

Os tipos de software que convertem arquivos de imagens de um formato


para outro tambm sero teis.

Para produzir imagens com qualidade adequada, importante investir em


software de edio de imagens. Normalmente esses software so usados para
limpar a imagem, removendo imperfeies, pontos, manchas etc., e para
correo, tais como ajuste do nvel de brilho e contraste.

Um software de edio de imagem deve ter, entre outras, as seguintes


funes: cortar, inclinar, virar, ajustar nvel de brilho e contraste; realar a
imagem; controlar o zoom; acomodar diferentes formatos de arquivos; fornecer
controle para gama, preto-e-branco e cores (RGB e CMYK); fornecer um
histograma; e possibilitar ao usurio criar e salvar situaes customizadas.

A escolha do software de edio baseada no nvel de manipulao de


imagens desejado e no nvel de especializao dos indivduos que vo utiliz-lo.
Alguns softwares de edio de imagens, como o Adobe Photoshop, so muito
avanados e podem requerer algum tempo e treinamento para a aprendizagem.

24
Outros softwares mais bsicos permitem somente operaes limitadas,
como cortar e girar e, portanto, so de fcil domnio.

Alm de considerar a capacidade e a facilidade de uso de um software de


edio de imagens, certifique-se de que a tecnologia utilizada suporta o software.
Verifique a quantidade de memria, espao em disco rgido, potncia do
processador e capacidade de vdeo.

Criao de arquivos digitais

No processo de digitalizao, recomenda-se a criao de trs verses de


uma imagem: a imagem mestra, a imagem de acesso e a imagem em miniatura.
Dependendo da necessidade de detalhes detectada numa imagem, deve-se criar
uma imagem de acesso com uma resoluo mais alta do que a sugerida.

Recomendaes gerais

Na criao de arquivos mestres devem ser considerados, alm dos


requisitos de qualidade, os propsitos de uso.

Assegure a qualidade da resoluo, formato dos arquivos, mecanismos


de armazenamento e acesso s imagens a partir de uma amostra do
material a ser digitalizado.

Para garantir melhor qualidade possvel imagem faa a digitalizao a


partir dos originais.

Essas recomendaes foram desenvolvidas para:

Assegurar nvel elevado de qualidade nas imagens.

Facilitar o acesso a imagens digitais.

25
Evitar a duplicao ou o re-trabalho no processo de digitalizao de
imagens, diante da evoluo tecnolgica das mquinas e equipamentos.

Os padres apresentados no pretendem ser considerados como


verdadeiros, mas guiar a captura, apresentao e armazenamento de imagens,
portanto os documentos de caractersticas diferentes das aqui apresentadas
devem receber tratamento diferenciado.

Arquivo mestre

Trata-se de arquivos de imagens digitais que contm o mximo de atributos


das imagens originais. O arquivo mestre deve ser de alta qualidade, visto que
preserva o contedo informacional do original, possibilitando variados usos e
formatos alternativos para atendimento s vrias demandas, evitando re-trabalho
de digitalizao.

A cpia mestra no deve ser editada nem compactada. Os arquivos de


imagens mestras so muito grandes para serem armazenados on-line. Uma
alternativa armazenar esses arquivos em CD ou DVD.

Arquivo de imagens derivadas

Arquivos derivados so criados a partir da imagem digital mestra e so


usados geralmente para acesso na Web. Arquivos derivados incluem imagens de
acesso, dimensionadas para a tela de um monitor mdio, e suas respectivas
miniaturas. So geralmente armazenadas on-line.

26
Tabela 1. Caractersticas dos diversos arquivos de imagens.

Tipos de escaneamento

Existem trs tipos de escaneamento: preto-e-branco, em escala de cinzas e


colorido. As caractersticas desses 3 tipos so descritas abaixo.

Preto-e-branco (Bitonal) Um bit por pixel representando preto-e-


branco. O escaneamento bitonal mais apropriado para documentos de
alto contraste como textos impressos.

Escala de Cinza (Grayscale) Mltiplos bits por pixels representando


tons de cinza. A escala de cinza prpria para documentos de tons
contnuos, como fotografias em preto-e-branco.

27
Cores (True Colors) Mltiplos bits por pixel representando cores.
Escaneamento em cores apropriado para documentos com
informaes coloridas.

Esses trs tipos de escaneamento requerem algumas decises subjetivas.


Por exemplo, um documento datilografado em preto-e-branco pode ter anotaes
em tinta vermelha. Embora o escaneamento bitonal seja freqentemente usado
para textos, o escaneamento em cores pode ser preferido neste caso,
dependendo de como a imagem ser usada.

Manuscritos e documentos impressos antigos podem ter melhor tratamento


se escaneados nas cores contnuas da escala de cinza ou cores, para assegurar a
reproduo das nuances, as condies do papel e outras marcas nele gravadas.

Digitalizao de documentos

As recomendaes tcnicas contidas neste guia foram direcionadas para os


seguintes tipos de documentos:

Impressos (Texto impresso, fotocpias, documentos datilografados ou


impressos a laser que possam conter esboos, ilustraes, manuscritos
etc. Podem ser includas nesta categoria as fotografias em preto-e-
branco e coloridas).

Fotografias (Negativos de filme e transparncias).

Mapas

Material grfico (Esboos, ilustraes artsticas, litografias, aquarelas


etc).

A profundidade de tons ser determinada pela natureza do material


escaneado, e pela funcionalidade do scanner utilizado. Os formatos de arquivos
sugeridos no so proprietrios e combinam com o padro da indstria.

28
Dependendo do formato do arquivo, podem ocorrer perdas na compactao
da imagem. Compactao com baixos nveis de perdas resulta num arquivo
similar imagem original; na compactao com perdas, certa quantidade de
informao descartada durante o processo. Embora a informao descartada
seja invisvel aos olhos humanos, ocorre uma perda de qualidade.

As recomendaes sobre resoluo so expressas tanto em dpi (dots per


inch pontos por polegada) como em pixel.

Nas tabelas a seguir encontram-se resumidas as recomendaes


direcionadas para a profundidade de tons, formato de arquivo, compactao e
resoluo espacial para cada tipo de documento.

Tabela 2. Recomendaes para texto

29
Nota: Alm dos formatos anteriormente mencionados para texto, pode-se
adotar o seguinte formato alternativo.

PDF (Portable Document Format) da Adobe um formato de arquivo


alternativo para criao e exibio de arquivos de textos na Web. Requer o
software Adobe Acrobat para criao e manipulao de arquivos. O download do
Adobe Acrobat Viewer grtis e a verso permite aos usurios visualizar os
documentos em seus computadores.

Para maiores informaes, veja http://www.adobe.com.br

Tabela 3. Recomendaes para Fotografias

Nota: Para produzir imagens escaneadas de alta qualidade recomenda-se o uso do


negativo da fotografia. Outra considerao relaciona-se deciso de escanear em preto-e-
branco ou cores, as fotografias em spia. Recomenda-se escane-las em cores para criar
uma imagem melhor, embora isto aumente muito o tamanho do arquivo.

30
Tabela 4. Recomendaes para Mapas

Tabela 5. Recomendaes para Material grfico

A tabela a seguir resume as informaes sobre imagens mestras, de


acesso e miniaturas relacionadas com o tipo de material escaneado.

31
Tabela 6. Recomendaes para digitalizar imagens de diferentes funcionalidades.

32
Controle de qualidade

Deve existir um programa de controle de qualidade em todas as fases do


processo de converso digital dos documentos.

A inspeo de arquivos de imagens digitais finais deve ser incorporada ao


fluxo de trabalho nas propores desejadas de acompanhamento. Recomenda-se
que procedimentos de controle de qualidade sejam implementados e
documentados e que sejam definidos claramente os defeitos inaceitveis numa
imagem. As imagens devem ser inspecionadas enquanto estiverem sendo
visualizadas numa proporo de pixel 1:1 ou numa ampliao de 100%.

A qualidade avaliada tanto subjetivamente pela equipe responsvel pelas


atividades, atravs da inspeo visual, como objetivamente no software de
imagens. O ambiente para inspeo visual de imagens tambm importante: os
monitores devem estar ajustados e a sala deve ser escura, ou pelo menos com as
luzes apagadas, sem luz do sol ou luz ofuscante. A inspeo visual deve
considerar:

Imagem com tamanho incorreto

Imagem com resoluo incorreta

Nome de arquivo incorreto

Formato de arquivo incorreto

Imagem gravada de modo incorreto (imagem colorida graduada em


escala de cinza)

Perda de detalhes por causa de superexposio ou sombras

Interferncia excessiva especialmente em reas escuras ou sombras

No geral muito clara ou muito escura

Valores tonais desiguais

33
Falta de nitidez/definio excessiva

Presena de artefatos digitais (linhas atravs da figura)

Padres de moire (ondulaes ou redemoinhos)

Imagem no aparada

Imagem de cabea para baixo ou invertida

Imagem distorcida ou no centralizada

Equilbrio de cores incorreto

Imagem fosca ou sem variao de cor

Curva negativa na tabela de verificao

Recorte de valores em preto-e-branco (em um histograma)

Denominao dos arquivos

necessrio considerar a nomenclatura que ser usada para nomear os


arquivos antes de comear o processo de digitalizao.

O nome do arquivo deve ser um conjunto de informaes que identifique


unicamente aquela imagem. O nome do arquivo deve incluir o nome da coleo ou
Unidade assim como o nmero da imagem, mais a extenso apropriada (.gif, .jpg,
.tif). Os nomes dos arquivos no devem ter mais de 8 caracteres e no devem
incluir espaos ou smbolos tais como ? , /, ou # etc.

34
Armazenagem

Digitalizar recursos requer a criao de uma infra-estrutura significativa para


arquivar material digital. Entre outros componentes dessa infra-estrutura deve
haver um robusto repositrio digital, um sistema de controle de qualidade e
administrao de acessos.

Existem vrias opes para armazenagem de material digital, e as mais


comuns so: a utilizao de discos rgidos internos, discos ticos, e discos de
rede. Discos rgidos internos de computadores so relativamente rpidos e
capazes, mas como so diariamente utilizados h sempre o risco de falha,
infeco de vrus e outros problemas. preciso estar constantemente
providenciando algum tipo de backup em outro formato de armazenagem. Discos
ticos (que incluem CD-R e DVD-R) so removveis e de razovel durabilidade,
apesar de terem capacidade limitada (640 Mb para CD-R, 6 GB para DVD-R).

Cada uma dessas opes ideal para alguns propsitos e inadequada para
outros. Portanto, quando decidir por um formato de armazenagem, voc deve
considerar primeiramente o tipo de demanda do seu projeto. Se o propsito for
backup e preservao essencial que a mdia de armazenagem seja removvel e
durvel. Dependendo da quantidade de informao que voc precisa guardar,
provvel que tambm seja necessrio uma grande capacidade. Para projetos
menores, ou projetos que lidam com pequenos arquivos, a armazenagem em CD-
ROM ou DVD devem ser suficientes.

A Tabela 7 mostra as vantagens e desvantagens dos diversos tipos de


mdias de armazenagem.

35
Tabela 7. Tipos de mdia para armazenagem

Se o material destina-se a acesso on-line, h necessidade de adicionar


equipamento extra para integrar o meio de armazenagem s redes. Para que uma
coleo digital seja acessada via Web, faz-se necessrio os servios de
manuteno de rede e suporte, e de uma equipe treinada.

O procedimento mais comum para projetos digitais armazenar as imagens


mestre off-line em CD-ROMs, e disponibilizar as verses de acesso e as
miniaturas on-line 24 horas. Imagens mestras podem ser vistas mediante
solicitao, pessoalmente ou por meio de emprstimo de CDs.

36
Metadados e Objetos digitais

Metadado significa informaes sobre os dados, informaes criadas


sobre o material e a verso digital, o registro de sua identidade, criao, uso, e
estrutura. O propsito do metadado facilitar a pesquisa, o uso, a administrao e
reutilizao de material digital. Os metadados podem ser divididos em trs
categorias: descritivos, administrativos e estruturais.

Os metadados possibilitam a administrao eficaz do sistema de repositrio


dos objetos digitas e ajudam a limitar o acesso propriedade intelectual da
instituio. Informaes de catalogao descritiva, facilitam para as pessoas
localizarem aquilo que esto pesquisando num repositrio. Porm, cada objeto
requer um grande nmero de metadados para ser armazenado. Portanto,
catalogar os materiais num repositrio um trabalho intenso.

O metadado descritivo descreve e identifica as informaes sobre os


recursos digitais, facilitando a busca, acesso e adminitrao do repositrio. As
informaes so do tipo bibliogrficas tais como: o criador/autor, ttulo, data da
criao, palavras-chave, entre outras.

O metadado administrativo usado para facilitar o rastreamento, migrao


e reuso dos elementos digitais. As informaes tpicas dessa categoria so:
informaes sobre a criao, controle de qualidade, direitos, entre outras. O termo
metadado tcnico tambm utilizado para indicar a data de captura da imagem
e as caractersticas tcnicas da imagem.

O metadado estrutural descreve a estrutura interna do recurso digital e sua


relao com suas partes. usado para possibilitar a navegao e a apresentao.

37
ANEXO I

FONTES COMPLEMENTARES DE INFORMAO

Escaneamento

www.scantips.com/ Um bom site com informaes prticas sobre escaneamento.


Especialmente para avaliar caractersitcas de scanners.

www.tasi.ac.uk/advice/creating/creating.html Contm revises avanadas sobre


scanners e cmeras digitais.

www.flatbed-scanner-review.org/ Avalia scanners de alta resoluo em termos de


sua habilidade para escanear slides e negativos.

www.imaging-resource.com/ Informaes sobre cmeras digitais.

Metadados

Adrienne Muir, Copyright and Licensing for Digital Preservation,


http://www.cilip.org.uk/update/issues/jun03/article2june.html

Dublin Core initiative for administrative metadata


http://metadata.net/admin/draft-iannella-admin-01.txt

Data Dictionary for Administrative Metadata for Audio, Image, Text, and Video
Content to
Support the Revision of Extension Schemas for METS
http://lcweb.loc.gov/rr/mopic/avprot/extension2.html

Dublin Core Metadata Initiative


http://dublincore.org/usage/terms/dc/current-elements/

Harvard University Librarys Digital Repository Services (DRS) User Manual for
Data Loading,
Version 2.04
http://hul.harvard.edu/ois/systems/drs/drs_load_manual.pdf

June M. Besek, Copyright Issues Relevant to the Creation of a Digital Archive: A


Preliminary Assessment, January 2003

38
http://www.clir.org/pubs/reports/pub112/contents.html

Karen Coyle, Rights Expression Languages, A Report to the Library of Congress,


February 2004,
http://www.loc.gov/standards/Coylereport_final1single.pdf

Making of America 2 (MOA2) Digital Object Standard: Metadata, Content, and


Encoding -
http://www.cdlib.org/about/publications/CDLObjectStd-2001.pdf

NARAs Lifecycle Data Requirements Guide (LCDRG), January 2002,


http://www.nara-atwork.gov/archives_and_records_mgmt /archives_and_activities/
accessioning_processing_description/ lifecycle/

Official EAD site at the Library of Congress -


http://lcweb.loc.gov/ead/

Research Library Groups Best Practices Guidelines for EAD -


http://www.rlg.org/rlgead/eadguides.html

Metadata Encoding and Transmission Standard (METS) rights extension schema


http://www.loc.gov/standards/rights/METSRights.xsd

Peter B. Hirtle, Archives or Assets? -


http://techreports.library.cornell.edu:8081/Dienst/UI/1.0/Display/cul.lib/2003-2

Outras fontes de informao

Moving Theory into Practice, Cornell University Library,


http://www.library.cornell.edu/preservation/tutorial/

HANDBOOK FOR DIGITAL PROJECTS: A Management Tool for Preservation and


Access, Northeast Document Conservation Center,
http://www.nedcc.org/digital/dighome.htm

Guides to Quality in Visual Resource Imaging, Digital Library Federation and


Research Libraries Group, July 2000,
http://www.rlg.org/visguides

Project Management Outlines


NDLP Project Planning Checklist, Library of Congress,
http://lcweb2.loc.gov/ammem/prjplan.html

39
Considerations for Project Management, by Stephen Chapman, HANDBOOK
FOR DIGITAL
PROJECTS: A Management Tool for Preservation and Access, Northeast
Document Conservation
Center, available at
http://www.nedcc.org/digital/dighome.htm

Planning an Imaging Project, by Linda Serenson Colet, Guides to Quality in


Visual Resource
Imaging, Digital Library Federation and Research Libraries Group,
http://www.rlg.org/visguides/visguide1.html

40
ANEXO II

GLOSSRIO

Backup Uma cpia exata de um programa, disco ou arquivo de dados, feita para
fins de arquivamento ou para salvaguardar arquivos importantes na eventualidade
de que a cpia ativa (original) seja danificada ou destruda. Por esse motivo, o
backup tambm chamado de cpia de segurana.

Bit A menor unidade de informao processada num computador.

CD - Compact disk ou CD-ROM - Compact Disk Read Only Memory - uma forma
de armazenamento caracterizada pela alta capacidade e pelo uso de tcnicas
ticas de laser para a leitura dos dados.

CD-RW CD Rewritable CD regravvel.

Compactao Reduo do tamanho de arquivo de imagens. A qualidade das


imagens pode ser afetada pelas tcnicas de compactao usadas e o nvel de
compactao aplicado.

CMYK Cyan Magenta Yellow Black. Estas so as quatro cores bsicas usadas
no processo de impresso colorida.

Digitalizar Representar ou expressar em forma digital dados no discretos ou


contnuos.

Downtime Tempo de inatividade, tempo de paralisao. O percentual de tempo


em que um sistema de computador ou algum de seus componentes permanece
fora de funcionamento.

Dpi dots per inch ou ppp pontos por polegada. Expressa o nmero de pontos
uma impressora pode imprimir por polegada, ou que um monitor pode mostrar, na
horizontal e vertical.

Escala de Cinzas - Grayscale Variao de tons de cinza numa imagem. As


escalas de cinza de scanners so determinadas pelo nmero de cinzas (valores
entre preto-e-branco) que eles podem reconhecer e reproduzir.

Escanear Converter uma imagem ou fotografia impressa para a forma digital


(mapa de bits) com um scanner ptico. Converter uma imagem tica de uma
cmera de vdeo para a forma digital, examinando cada pixel em cada linha do
quadro.

41
GIF - Grafic Image File Format Formato de baixa resoluo, adequado para
apresentaes em telas. GIF (e JPEG) so os formatos mais usados para
imagens em miniatura. O formato GIF reconhecido pela maioria das plataformas,
programas de Internet e software de edio de imagens.

Hard copy Cpia impressa em papel, filme ou outro meio permanente.

Imagem derivada Imagem criada a partir de outra imagem atravs de algum


tipo de processo automtico, geralmente com perda de informao. Entre as
tcnicas usadas para criar imagens derivadas, esto: criao de exemplar em
menor resoluo; uso de tcnicas de compactao com perda de informao; e
alterao da imagem com utilizao de tcnicas de processamento.

Interferncia Noise Marca no identificvel e que no corresponde ao


documento original que surge durante o processo de escaneamento ou
transferncia de dados.

Intranet Rede projetada para o processamento de informaes em uma


empresa ou organizao.

JPEG Joint Photographic Experts Group Formato adequado para


apresentao impressa e em tela. JPEG reconhecido pela maioria das
plataformas de computador, programas de Internet e software de imagens.

Links Conectar dois elementos de uma estrutura de dados usando variveis de


ndice de ponteiros.

Metadado significa informaes sobre os dados, informaes criadas sobre o


material e a verso digital, o registro de sua identidade, criao, uso, e estrutura.

Moire Distoro ondulada ou oscilao visvel em uma imagem que


apresentada ou impressa com uma resoluo inadequada.

Off line Programa ou dispositivo computacional que no capaz de se


comunicar com um computador ou ser controlado por ele.

On-line Programa ou dispositivo de computador que est ativado e pronto para


operao, capaz de se comunicar com um computador ou ser controlado por ele.
Um ou mais computadores conectados a uma rede.

Pixel Termo reduzido de picture element. Cada pixel pode representar um


nmero de diferentes tons e cores, dependendo do espao de armazenagem
designado para ele. Muitas vezes o termo pixels per inch (ppi) preferido por
descrever mais acuradamente a imagem digital.

42
Plug in 1. Pequeno programa que se associa a uma aplicao maior para
ampliar sua funcionalidade. 2. Componente de software que se associa ao
Netscape Navigator.

Scanner Dispositivo ptico de entrada que usa sensores de luz para capturar
uma imagem no papel ou algum outro meio. A imagem traduzida em sinais
digitais que podem ser processados por softwares de reconhecimento de
caracteres pticos (OCR) ou softwares grficos.

TIFF - Tagged Image File Format Esse formato permite manter um alto nvel de
detalhe da imagem. indicado como formato para os arquivos de imagens
mestre.

Twain um protocolo padro de comunicao para enviar instrues para


hardware (como o scanner) e receber dados de volta ( como a imagem)

Website Stio da Web.

Zoom Ampliar. A ampliao de uma poro selecionada de uma imagem grfica


ou documento de modo que preencha toda a tela. A ampliao um recurso dos
programas de desenho geomtrico, processadores de textos e de planilhas que
permite ao usurio selecionar uma pequena parte da tela, ampliar a imagem e
fazer alteraes na parte ampliada, com uma riqueza maior de detalhes.

43

Você também pode gostar