Escolar Documentos
Profissional Documentos
Cultura Documentos
Curso 2 PDF
Curso 2 PDF
de documentos
Verso 2.0
Embrapa
Informao
Tecnolgica
Fevereiro 2006
Verso de 2001,
Grupo de trabalho.
Anna Christina Aun de Azevedo Nascimento
Cristiane Vieira Peres
Maria Jos de Oliveira
Karla Igns Corvino Silva
Verso de 2006
Reviso de Anna Christina Aun de Azevedo Nascimento
Empresa Brasileira de Pesquisa Agropecuria Embrapa
SCT Fevereiro de 2006. Braslia, DF
Introduo
Em 2001, a Embrapa Informao Tecnolgica, por meio de sua Gerncia de
Organizao da Informao tomou a iniciativa de desenvolver um Guia Geral de
Digitalizao de Documentos visando orientar as atividades de digitalizao dos
documentos da Empresa. Alm disso, o Guia tambm teve como propsito a
preservao de originais que materializavam as atividades do capital intelectual da
Embrapa, ao mesmo tempo que proporcionava maior disseminao de seus
contedos.
Em dezembro de 2005 a nova verso comeou a ser produzida com o
objetivo de revisar e atualizar o documento original. A Embrapa Informao
Tecnolgica novamente financiou o Guia de Digitalizao cumprindo a sua funo
de estimular e orientar as Unidades da Embrapa no processo de organizao da
informao, assim como integr-las e torn-las parte de uma grande rede de
fornecedores de informaes digitais. recomendvel que esse Guia seja
utilizado para ajudar o desenvolvimento do planejamento e implementao de
digitalizao de materiais.
Recentemente tem-se verificado a importncia de se aplicar tcnicas e
padres de forma inteligente e consistente nos procedimentos relacionados a
desenvolvimento e publicao de contedos digitais. O uso de padres, alm de
adicionar longevidade e escalabilidade ao ciclo de vida dos materiais, tambm
possibilita a um pblico ainda maior do que o originalmente pensado a descobrir e
usar os recursos de informao.
Um dos objetivos desse Guia de Digitalizao mostrar a importncia de se
pensar na questo da sustentabilidade dos programas. Ao adotar prticas que
possibilitam o compartilhamento dos recursos produzidos pela Empresa,
possvel assegurar um uso mais abrangente dos materiais. Tanto hoje quanto no
futuro, audincias que nem mesmo foram consideradas podero estar se
3
Finalidade
O propsito deste documento oferecer orientaes bsicas e prover
recomendaes mnimas necessrias digitalizao de materiais em formatos de
texto, fotografia, mapas e ilustraes. Este guia no deve ser considerado como o
melhor padro disponvel para digitalizao, mas sim como um recurso de
orientao para a captura de imagem, apresentao, armazenagem e preservao
de originais. Alm disso, o guia fornecer aos autores de materiais, tcnicos e
dirigentes da empresa, orientaes necessrias para que eles possam avaliar se
determinada estratgia de digitalizao proposta adequada ou no ao seus
objetivos e materiais. Apesar deste documento no ter a inteno de ser a ltima
palavra no assunto, ele pode ser utilizado como uma referncia para aqueles que
esto iniciando procedimentos de digitalizao e publicao de seus recursos de
informao.
Este guia contempla principalmente orientaes que propem:
Princpios gerais
Escanear em nvel de qualidade apropriado para evitar o re-trabalho e remanuseio dos originais no futuro.
Criar e armazenar um arquivo mestre que poder ser utilizado para produzir
arquivos de imagens derivadas que atendam a uma variedade de
necessidades atuais e futuras.
Tpicos
do Guia de Digitalizao
Introduo.................................................................................................. .3
Finalidade............................4
Princpios gerais ........................................................................................6
Planejamento........................................................................ .......... ............9
Fases do planejamento ... ..................................................... .......... .......... 10
Formas gerenciais de produo digital........................................................ 11
Na prpria Instituio ............................................................ .................... 11
Terceirizao ......................................................................................... 12
Audincia alvo........................................................................................... 13
As demandas e necessidades.................................................................... 14
A seleo de materiais......................................................... ....................15
Caractersticas do material original ............................16
Propriedades fsicas dos materiais ........................................................... 17
Objetivos da digitalizao........................................................................... 18
Direitos autorais ........................................................................................ 19
Equipamento............................................................................................. 19
Computador ............................................................................................... 20
Monitor ........................................................................................................20
Gravador de CD-DVD ................................................................................ 21
Porta de transferncia de alta velocidade .................................................. 21
Scanners ................................................................................................... 21
Resoluo.................................................................................................. 21
Profundidade de cores ............................................................................. . 22
rea de escaneamento .............................................................................. 22
Tempo de digitalizao .............................................................................. 22
Usabilidade .................................................................................................23
Cmeras digitais ...................................................................................... 23
Software..................................................................................................... 24
Criao de arquivos digitais .................................................................. 25
Arquivo mestre.......................................................................................... 26
38
38
38
39
Anexo II
Glossrio................................................................................................... 41
Planejamento
A iniciativa de digitalizar contedo requer um planejamento cuidadoso antes
de sua implementao. Tal planejamento deve sempre considerar o plano
estratgico da instituio como um todo, desde o de mbito tecnolgico ao de
fluxo de trabalho. Um bom planejamento, para qualquer projeto requer um nmero
de decises e questes, tais como as que seguem:
Como ser feito (de acordo com padres, especificaes, modelos bem
sucedidos);
Fases do planejamento
A audincia alvo A identificao da audincia deve ser a sua primeira
preocupao, assim como as respostas s perguntas Quem precisa desse
trabalho? Quem se beneficiar dele?.
Seleo do material As informaes obtidas do levantamento inicial sobre
a audincia influenciaro a etapa de seleo dos materiais que sero digitalizados.
Nesta fase, voc tambm dever pensar sobre medidas relacionadas a direitos
autorais, e sobre como os materiais digitalizados sero distribudos: quais as
tecnologias que sero utilizadas, se o acesso aos contedos sero abertos ou
controlados, e como voc poder alcanar o seu publico alvo.
Estabelecendo padres A utilizao de padres, sempre que possvel,
aumenta a longevidade, portabilidade e interoperabilidade do seu contedo.
importante que voc conhea os padres que se aplicam ao tipo de digitalizao
que voc est pretendendo.
Seleo de equipamentos A seleo de equipamentos deve ser tomada
considerando a funcionalidade requerida e as suas prioridades. Um exemplo disso
poderia ser manter os custos baixos mais importante do que conseguir o melhor
padro de captura de imagem.
Equipe de trabalho A questo sobre metodologia e procedimentos est
intimamente relacionada com a deciso sobre pessoal e, portanto, influenciar as
decises acerca de Quem dever fazer o trabalho? Voc dever identificar o
perfil dos profissionais necessrios e estabelecer as tarefas que espera que sejam
10
Formas gerenciais
de produo digital
As imagens digitalizadas podem ser produzidas sob duas condies:
Na prpria instituio
Nesta categoria enquadram-se as produes realizadas no mesmo
ambiente detentor dos documentos a serem digitalizados ou na prpria instituio.
Esta modalidade oferece vantagens e desvantagens, conforme pode ser
observado abaixo.
Vantagens da produo na prpria empresa:
11
Necessitar mais tempo para a implementao do processo, da infraestrutura tcnica, e de gerao de imagens.
Terceirizao
Caso a Unidade no tenha condies ou no pretenda digitalizar suas
imagens in loco, dever considerar as seguintes vantagens e desvantagens na
terceirizao da atividade:
Vantagens de terceirizar:
Desvantagens de terceirizar:
12
Audincia alvo
Instituies de pesquisa, como a EMBRAPA, atendem s necessidades de
diversas comunidades de usurios de estudantes, acadmicos e pesquisadores,
a agricultores, empresrios e do pblico em geral. Ao iniciar o desenvolvimento e
planejamento do processo de digitalizao, importantssimo que voc conhea o
seu publico alvo. Esta informao influenciar muitas de suas decises, tais como:
os itens que sero digitalizados, a tecnologia que ser utilizada, os mecanismos
para acesso, e a forma de apresentao do material para os usurios. Por
exemplo, voc poder descobrir que tem materiais que interessam tanto a
estudantes de agronomia quanto a pequenos produtores agrcolas, mas que cada
um desses pblicos requer um tratamento diferenciado da interface de
apresentao do material. Neste caso, apesar de voc poder usar a mesma
tecnologia para re-formatar o material, e publicar duas verses usando o mesmo
sistema, voc dever desenvolver duas interfaces distintas, do mesmo material,
para atender aos diferentes usurios.
Portanto, as primeiras questes que devero ser respondidas ao iniciar um
projeto de digitalizao so:
ambiente eletrnico no futuro, o que se sabe hoje sobre os hbitos dos usurios
pode ser usado como referncia. O conhecimento do perfil dos usurios, e suas
preferncias para acessar informao podem indicar vrios aspectos a serem
atendidos, limitaes e possibilidades de desenvolvimento. Considere as
seguintes questes sobre o seu pblico:
14
A seleo de materiais
H uma srie de questes que devem ser consideradas ao decidir sobre o
material que dever ser digitalizado, tais como as metas e caractersticas da
instituio, o perfil e necessidades dos usurios, e as caractersticas dos prprios
materiais.
A seguir, algumas questes importantes que devem ser respondidas para a
seleo de materiais:
15
original?
16
17
Objetivos da digitalizao
Alm dos passos j listados (examinar o valor intelectual dos recursos,
como isto poder ser melhorado com a digitalizao, e considerar os atributos
fsicos dos seus materiais), outros princpios podem ajud-lo a priorizar o processo
de seleo.
Abaixo, esto as principais razes para justificar uma iniciativa de
digitalizao na instituio.
Melhorar o acesso;
18
Direitos autorais
Assim que voc identificar o material que dever ser digitalizado comece a
cuidar dos aspectos relacionados a propriedade intelectual. Se o material que
voc quer digitalizar de domnio publico, ou se a empresa possui os direitos
autorais e controla os direitos para digitalizao, ento voc provavelmente poder
prosseguir sem impedimentos.
Se os materiais que voc quer digitalizar no so de domnio pblico, e
voc no controla os direitos autorais, ser preciso identificar o detentor desses
direitos e solicitar permisso para digitalizar e publicar o material em questo.
Mesmo que voc j saiba quem o detentor dos direitos, e mesmo que voc j
tenha permisso para uso do material para certos propsitos, voc ainda ter que
se certificar que a sua permisso cobre a digitalizao e publicao em meio
digital.
Equipamento
O processo de digitalizao exige, antes de sua implementao, a busca de
informaes bsicas que orientem a escolha de mquinas e equipamentos
diferenciados, que possam atender tanto a tarefa de escanear como a de
armazenar, organizar, visualizar e editar informaes. A escolha do equipamento
depende, sobretudo, do tipo de material que ser escaneado, assim com a
inteno de uso das imagens digitais.
19
Computador
muito importante selecionar o tipo adequado de computador para o
processo
de
digitalizao.
Os
principais
componentes
que
devem
ser
Gravador de CD e DVD.
Monitor
Um monitor de alta qualidade, com tela acima de 17 polegadas, alta
resoluo, alta velocidade, sem tremulaes e com suporte para vdeo RAM que
possa produzir imagens representativas do original digitalizado fundamental para
a manipulao e editorao de imagens.
20
Gravador de CD-DVD
A aquisio de um gravador de CD-ROM ser necessria quando a
Unidade optar pela armazenagem das imagens digitalizadas em CDs. Para salvar
as imagens em CD-ROM necessrio que o equipamento adquirido esteja de
acordo com as normas ISO e que suporte uma variedade de formatos.
Scanners
Existem scanners de vrios tipos, tamanhos e nveis de qualidade. A
escolha de um scanner depende do objetivo do trabalho, do formato, tipo e
tamanho do material que se pretende digitalizar.
A seguir, outros fatores que devem ser considerados quando da escolha de
um scanner:
Resoluo
A resoluo o fator determinante na qualidade de um scanner, isto , o
nvel mximo de detalhamento que pode ser capturado de uma imagem. A
resoluo ptica de um scanner medida pela capacidade de leitura de seu
sensor de imagem. Quanto maior a resoluo ptica melhor.
Valores acima da resoluo ptica podem ser alcanados por meio de um
recurso de software conhecido como interpolao, que gera pontos extra, a partir
21
22
Usabilidade
Algumas interfaces so bastante simples, limitando-se a definir cor,
resoluo, e rea de digitalizao; outras apresentam interfaces complexas com
vrias opes de tratamento de imagem no prprio programa.
A complexidade da interface pode transformar a digitalizao num
complicado processo de captura e tratamento de imagem, que toma tempo,
processamento do computador, e, em muitos casos, a pacincia do usurio.
Cmeras digitais
Embora sejam equipamentos que exigem altos investimentos, as cmeras
digitais manuais disponveis atualmente no mercado no so boas para
escaneamento de grandes arquivos, com exceo das cmeras digitais de alta
resoluo (Kontron, Zeutschel, Leica) usadas por grandes instituies e empresas
no ramo comercial de imagens.
As cmeras digitais de alta resoluo no tm nenhuma limitao para o
escaneamento e podem capturar numa resoluo extremamente alta. Porm elas
tm requerimentos especficos sobre iluminao, e exigem um alto nvel de
habilidade do operador. As vantagens dessas cmeras esto no grande potencial
para escanear materiais de tamanho grande, todos os formatos de mdia,
materiais encadernados, e o baixo risco na operao com os materiais frgeis.
As cmeras digitais no usam filme para capturar imagens. As fotografias
so armazenadas numa mdia interna ou em cartes de memria. A capacidade
varia de 4MB a 512MB e est aumentando cada vez mais com o progresso da
tecnologia. Os cartes de memria guardam um nmero razovel de imagens,
dependendo da resoluo escolhida e da capacidade do carto. Se voc utilizar o
formato TIFF de imagens, ento os arquivos sero grandes, e logo esgotaro a
capacidade do carto. Portanto, voc dever optar por transferir as imagens
diretamente para o seu computador, antes de tirar novas fotografias.
23
Software
H dois tipos de software necessrios para a digitalizao de imagens. Um
deles o software de escaneamento que vem com o scanner; o outro, o
software de edio de imagens, normalmente aplicado aps a captura da imagem.
Alguns softwares, como o Adobe Photoshop, podem servir tanto como
software de escaneamento como de edio de imagem.
O
software
de
escaneamento
geralmente
limitado
quanto
24
25
Arquivo mestre
Trata-se de arquivos de imagens digitais que contm o mximo de atributos
das imagens originais. O arquivo mestre deve ser de alta qualidade, visto que
preserva o contedo informacional do original, possibilitando variados usos e
formatos alternativos para atendimento s vrias demandas, evitando re-trabalho
de digitalizao.
A cpia mestra no deve ser editada nem compactada. Os arquivos de
imagens mestras so muito grandes para serem armazenados on-line. Uma
alternativa armazenar esses arquivos em CD ou DVD.
26
Tipos de escaneamento
Preto-e-branco (Bitonal) Um bit por pixel representando preto-ebranco. O escaneamento bitonal mais apropriado para documentos de
alto contraste como textos impressos.
27
documentos com
informaes coloridas.
Esses trs tipos de escaneamento requerem algumas decises subjetivas.
Por exemplo, um documento datilografado em preto-e-branco pode ter anotaes
em tinta vermelha. Embora o escaneamento bitonal seja freqentemente usado
para textos, o escaneamento em cores pode ser preferido neste caso,
dependendo de como a imagem ser usada.
Manuscritos e documentos impressos antigos podem ter melhor tratamento
se escaneados nas cores contnuas da escala de cinza ou cores, para assegurar a
reproduo das nuances, as condies do papel e outras marcas nele gravadas.
Digitalizao de documentos
As recomendaes tcnicas contidas neste guia foram direcionadas para os
seguintes tipos de documentos:
Mapas
28
29
30
31
32
Controle de qualidade
Deve existir um programa de controle de qualidade em todas as fases do
processo de converso digital dos documentos.
A inspeo de arquivos de imagens digitais finais deve ser incorporada ao
fluxo de trabalho nas propores desejadas de acompanhamento. Recomenda-se
que
procedimentos
de
controle
de
qualidade
sejam
implementados
33
Imagem no aparada
34
Armazenagem
Digitalizar recursos requer a criao de uma infra-estrutura significativa para
arquivar material digital. Entre outros componentes dessa infra-estrutura deve
haver um robusto repositrio digital, um sistema de controle de qualidade e
administrao de acessos.
Existem vrias opes para armazenagem de material digital, e as mais
comuns so: a utilizao de discos rgidos internos, discos ticos, e discos de
rede. Discos rgidos internos de computadores so relativamente rpidos e
capazes, mas como so diariamente utilizados h sempre o risco de falha,
infeco de vrus e outros problemas. preciso estar constantemente
providenciando algum tipo de backup em outro formato de armazenagem. Discos
ticos (que incluem CD-R e DVD-R) so removveis e de razovel durabilidade,
apesar de terem capacidade limitada (640 Mb para CD-R, 6 GB para DVD-R).
Cada uma dessas opes ideal para alguns propsitos e inadequada para
outros. Portanto, quando decidir por um formato de armazenagem, voc deve
considerar primeiramente o tipo de demanda do seu projeto. Se o propsito for
backup e preservao essencial que a mdia de armazenagem seja removvel e
durvel. Dependendo da quantidade de informao que voc precisa guardar,
provvel que tambm seja necessrio uma grande capacidade. Para projetos
menores, ou projetos que lidam com pequenos arquivos, a armazenagem em CDROM ou DVD devem ser suficientes.
35
36
37
ANEXO I
FONTES COMPLEMENTARES DE INFORMAO
Escaneamento
www.scantips.com/ Um bom site com informaes prticas sobre escaneamento.
Especialmente para avaliar caractersitcas de scanners.
www.tasi.ac.uk/advice/creating/creating.html Contm revises avanadas sobre
scanners e cmeras digitais.
www.flatbed-scanner-review.org/ Avalia scanners de alta resoluo em termos de
sua habilidade para escanear slides e negativos.
www.imaging-resource.com/ Informaes sobre cmeras digitais.
Metadados
Adrienne Muir, Copyright and Licensing for Digital Preservation,
http://www.cilip.org.uk/update/issues/jun03/article2june.html
Dublin Core initiative for administrative metadata
http://metadata.net/admin/draft-iannella-admin-01.txt
Data Dictionary for Administrative Metadata for Audio, Image, Text, and Video
Content to
Support the Revision of Extension Schemas for METS
http://lcweb.loc.gov/rr/mopic/avprot/extension2.html
Dublin Core Metadata Initiative
http://dublincore.org/usage/terms/dc/current-elements/
Harvard University Librarys Digital Repository Services (DRS) User Manual for
Data Loading,
Version 2.04
http://hul.harvard.edu/ois/systems/drs/drs_load_manual.pdf
June M. Besek, Copyright Issues Relevant to the Creation of a Digital Archive: A
Preliminary Assessment, January 2003
38
http://www.clir.org/pubs/reports/pub112/contents.html
Karen Coyle, Rights Expression Languages, A Report to the Library of Congress,
February 2004,
http://www.loc.gov/standards/Coylereport_final1single.pdf
Making of America 2 (MOA2) Digital Object Standard: Metadata, Content, and
Encoding http://www.cdlib.org/about/publications/CDLObjectStd-2001.pdf
39
40
ANEXO II
GLOSSRIO
Backup Uma cpia exata de um programa, disco ou arquivo de dados, feita para
fins de arquivamento ou para salvaguardar arquivos importantes na eventualidade
de que a cpia ativa (original) seja danificada ou destruda. Por esse motivo, o
backup tambm chamado de cpia de segurana.
Bit A menor unidade de informao processada num computador.
CD - Compact disk ou CD-ROM - Compact Disk Read Only Memory - uma forma
de armazenamento caracterizada pela alta capacidade e pelo uso de tcnicas
ticas de laser para a leitura dos dados.
CD-RW CD Rewritable CD regravvel.
Compactao Reduo do tamanho de arquivo de imagens. A qualidade das
imagens pode ser afetada pelas tcnicas de compactao usadas e o nvel de
compactao aplicado.
CMYK Cyan Magenta Yellow Black. Estas so as quatro cores bsicas usadas
no processo de impresso colorida.
Digitalizar Representar ou expressar em forma digital dados no discretos ou
contnuos.
Downtime Tempo de inatividade, tempo de paralisao. O percentual de tempo
em que um sistema de computador ou algum de seus componentes permanece
fora de funcionamento.
Dpi dots per inch ou ppp pontos por polegada. Expressa o nmero de pontos
uma impressora pode imprimir por polegada, ou que um monitor pode mostrar, na
horizontal e vertical.
Escala de Cinzas - Grayscale Variao de tons de cinza numa imagem. As
escalas de cinza de scanners so determinadas pelo nmero de cinzas (valores
entre preto-e-branco) que eles podem reconhecer e reproduzir.
Escanear Converter uma imagem ou fotografia impressa para a forma digital
(mapa de bits) com um scanner ptico. Converter uma imagem tica de uma
cmera de vdeo para a forma digital, examinando cada pixel em cada linha do
quadro.
41
GIF - Grafic Image File Format Formato de baixa resoluo, adequado para
apresentaes em telas. GIF (e JPEG) so os formatos mais usados para
imagens em miniatura. O formato GIF reconhecido pela maioria das plataformas,
programas de Internet e software de edio de imagens.
Hard copy Cpia impressa em papel, filme ou outro meio permanente.
Imagem derivada Imagem criada a partir de outra imagem atravs de algum
tipo de processo automtico, geralmente com perda de informao. Entre as
tcnicas usadas para criar imagens derivadas, esto: criao de exemplar em
menor resoluo; uso de tcnicas de compactao com perda de informao; e
alterao da imagem com utilizao de tcnicas de processamento.
Interferncia Noise Marca no identificvel e que no corresponde ao
documento original que surge durante o processo de escaneamento ou
transferncia de dados.
Intranet Rede projetada para o processamento de informaes em uma
empresa ou organizao.
JPEG Joint Photographic Experts Group Formato adequado para
apresentao impressa e em tela. JPEG reconhecido pela maioria das
plataformas de computador, programas de Internet e software de imagens.
Links Conectar dois elementos de uma estrutura de dados usando variveis de
ndice de ponteiros.
Metadado significa informaes sobre os dados, informaes criadas sobre o
material e a verso digital, o registro de sua identidade, criao, uso, e estrutura.
Moire Distoro ondulada ou oscilao visvel em uma imagem que
apresentada ou impressa com uma resoluo inadequada.
Off line Programa ou dispositivo computacional que no capaz de se
comunicar com um computador ou ser controlado por ele.
On-line Programa ou dispositivo de computador que est ativado e pronto para
operao, capaz de se comunicar com um computador ou ser controlado por ele.
Um ou mais computadores conectados a uma rede.
Pixel Termo reduzido de picture element. Cada pixel pode representar um
nmero de diferentes tons e cores, dependendo do espao de armazenagem
designado para ele. Muitas vezes o termo pixels per inch (ppi) preferido por
descrever mais acuradamente a imagem digital.
42
43