Você está na página 1de 48

Gerenciamento Eletrnico de Documentos GED

document imaging

www.laserfiche.com

Copyright 2001 pela Compulink Management Center, Inc. Todos os direitos reservados.

Laserfiche uma marca registrada pela Compulink Management Center, Inc. Todas as marcas mencionadas neste manual so de propriedade de sua respectivas empresas. Nenhuma parte desta publicao poder ser reproduzida, fotocopiada, armazenada em algum sistema de pesquisa ou transmitido sem o consentimento por escrito do publicador.

LaserFiche Document Imaging Uma Diviso da Compulink Management Center, Inc. 3545 Long Beach Blvd. Long Beach, CA 90807 USA Gerenciamento de Documentos Eletrnicos Publicado por LaserFiche Primeira edio em Portugus Outubro de 2001 Impresso no Brasil. Venda Proibida

Contedo
Introduo.......................................................................................................................................................................
1

O que Gerenciamento de Documentos Eletrnicos - GED ........................................................ 2


Trazendo documentos ...................................................... 3 Arquivando documentos................................................... 5 Indexando documentos .................................................... 8 Recuperando documentos................................................ 10 Controlando acesso ........................................................... 11

Benefcios de Gerenciamento de Documentos Eletrnicos ............................................................ 12 Implementando Gerenciamento de Documentos Eletrnicos...................................................... 13


Avaliando suas necessidades ............................................ Avanando de projeto piloto a soluo empresarial... Instalao .............................................................................. Treinamento.......................................................................... Assuntos Legais ................................................................... Suporte e Manuteno ..................................................... 13 13 13 14 15 16

Caractersticas adicionais ....................................................................................................................................... 17


Facilidade de uso.................................................................. Anotaes .......................................................................... Imprimir / Fax / e-mail........................................................ Opes de procura usando texto.................................... Internet/ Intranet................................................................. Segurana............................................................................... Portabilidade e CDs ........................................................... Terceirizao de Escanerizao......................................... Recuperao ps Desastre................................................ Processamento em Lote..................................................... Cdigo de Barras................................................................. Zona OCR ........................................................................... Workflow .............................................................................. Escalabilidade......................................................................... Compatibilidade de Sistemas............................................. Sistemas de Rede................................................................. Arquitetura Cliente/Servidor............................................. Formato de Arquivo No Proprietrios......................... 17 17 17 18 19 19 20 21 22 22 22 23 23 24 24 25 25 26

Contedo
Perguntas Mais Frequentes .................................................................................................................................. 27
Geral...................................................................................... Escanerizao / Importao / Armazenamento............ Visualizao / Impresso / Exportao........................... OCR: Reconhecimento de Caracter ptico................ COLD: Computer Output to Laser Disc...................... 27 28 31 32 33

Glossrio de Termos ................................................................................................................................................... 34 Sobre o Autor ................................................................................................................................................................. 43

Introduo
"Tenho feito buscas que poderiam provavelmente ocupar-me por trs dias de trabalho em dez minutos. Nossos arquivos so tesouros histricos, este um dos motivos que ns usamos LaserFiche e pessoas utilizam nossos documentos histricos para pesquisas. Ns queremos arquivar os materiais originais sem risco de deteriorizao."
Linda Butler, City Clerk Flagstaff, AZ

Papel
Ns todos necessitamos dele para fazer nosso trabalho mas papel acumula-se rapidamente. Nossos arquivos engordam rapidamente, arquivos e sistemas de alimentao facilitam a busca de documentos. Gerentes de registros organizam, arquivam e recuperam nossa informao mas o montante de papel continua crescendo. Arquivos de papel so frequentemente difceis de encontrar Documentos podem no estar na pasta apropriada ou podem estar "emprestados" para algum ou ainda perdidos na mesa de outra pessoa. Estudos mostram que profissionais frequentemente perdem at 500 horas por ano apenas procurando documentos. Esses dias se foram. Gerenciamento Eletrnico de Documentos oferecem uma melhor maneira de gerenciar registros sem dependncia..

Documentos Eletrnicos devem:


Gerenciar milhares de registros e recuperar o que voc necessita em segundos. Fcil de utilizar, idenpendente se voc a pes soa que necessita do documento ou se voc o gerente de sistemas. Permitir que voc compartilhe documentos com colegas enquanto protege informaes confidenciais. Permitir que voc envie e-mails ou envie faxes dos documentos com um clique do mouse. Prover um fcil acesso para compartilhar documentos com outros escritrios ou levando-os consigo. Adaptar-se com a maneira que voc trabalha sem forar mudanas. Desde 1987, ns da LaserFiche temos dedicado horas incontveis para construir o Sistema de Gerenciamento Eletrnico de Documentos. Desenvolvido por experincia, ns criamos esse guia para explicar o que Sistema de Gerenciamento de Documentos Eletrnicos , o que encontrar nele e como fazer de armazenamento e recuperao de documentos um processo simples e transparente.
1

O que Gerenciador de Documentos Eletrnicos?


GED a converso de documentos em papel para imagens eletrnicas em seu computador. Uma vez em seu computador esses documentos podem ser recuperados em segundos. Todas organizaes geram um enorme volume de papis e documentos eletrnicos. Ns temos desenvolvido nosso prprio jeito de arquivar documentos importantes. Todos sabem a frustrao de no ser capaz de encontrar um documento certo quando ele muito necessrio. Mtodos tradicionais de arquivamento de papel e registros eletrnicos requerem um grande esforo para gerenciar, distribuir e encontrar esses documentos. Proporcional ao nmero de arquivos que cresce, o tempo e esforos necessrios para gerenci-los tambm aumentam. GED revoluciona o arquivamento de informao e provm meios de rapidamente recuperar e compartilhar todos documentos em seu sistema. Todos os sistemas GED devem possuir os seguintes cinco componentes bsicos: Ferramentas de escanerizar para trazer os documentos para o sistema Mtodos de arquivamento e armazenamento de documentos Ferramentas de recuperao para encontrar documentos Controle de acesso para prover documentos para pessoas autorizadas Como a Internet explodiu em popularidade por motivo do rpido acesso que provem s informaes armazenadas em web pages, sistemas GED provem um imenso valor pelo seu rpido acesso a informaes armazenadas entre documentos de organizaes. GED constroe pontos fortes em documentos de papis: Arquivos so escanerizados ou eletronicamente convertidos e uma alta resoluo de fotografia armazenada em um disco rgido ou ptico. Eletrnico cartes de ndices podem anexar informaes para um documento como autor, nmero de referncia ou data de criao. Arquivos podem ainda ser visualizados, impressos, compartilhados e armazenados e as imagens adicionam uma enorme vantagem oferencedo aos documentos um contedo ativo. No mais apenas imprimir uma pgina, documentos textos so lidos por tecnologia de reconhecimento de caracteres pticos, Optical Character Recognition (OCR). Um sistema deve permitir que voc recupere arquivos procurando por qualquer palavra ou frase no texto, por localizao de pastas ou por informaes em cartes de ndice. Quais documentos podem ser acessados e lidos e quais aes e modificaes pode-se executar nesses documentos, depende do nvel de segurana de acesso o qual deve ser controlado pelo sistema GED.

Selecionar o adequado sistema GED pode ser uma tarefa excitante. Existem vrios aspectos a considerar para assegurar que adaptar-se- s necessidades de sua organizao. Seguem as descries dos cinco componentes bsicos em o qu deve ser avaliado na escolha de seu sistema.

acelerando assim o processo de escaneamento.Scannrs sem ADF so primariamente designados para imagens grficas e requerem que cada pgina seja colocada manualmente, uma por uma.

Trazendo os Documentos
Scanner com ADF

Existem trs mtodos primrios para trazer arquivos de documentos para um sistema GED: Escanear arquivos de papel Converso, criando arquivos de imagens inal terveis Importao, criando verses modificveis de documentos eletrnicos

Escaneando
Escanear um documento produz uma imagem que pode ser armazenada em um computador. Quando escolher um scanner, importante considerar o total do oramento e o tamanho e volume de documentos a serem escanerizados. A capacidade de utilizar uma grande variedade de scanners uma das caractersticas de um bom sistema de imagem. Um scanner para sistemas GED deve possuir ADF (Automatic Document Feeder), alimentador de documentos automtico. Esse dispositivo permite que uma pilha de papis seja colocado na bandeja do scanner e automaticamente alimentar o scanner pgina por pgina,

Scaners podem suportar uma variedade de tamanho de papis, de cartes de visita desenhos de engenharia. A maioria dos departamentos apenas necessitam escanear documentos at tamanho (8 x 14). Para organizaes ou departamentos que utilizam blueprints, planos e desenhos arquitetnicos, existem os scaners de largo formato que suportam documentos esized ( 34 x 44). Em geral, quanto maior o tamanho de papel que o scanner pode suportar, mais caro ele custa. Outras opes como coloridos ou escalas de cinza, utilizado para fotografias, podem aumentar o preo do scanner. A velocidade do scanner outro fator a considerar. Scanners para GED podem suportar de 10 200 pginas por minuto. So disponveis em modo simples e/ou duplo. Scanner de modo duplo (duplex) permitem que os dois lados do documento sejam escanerizados ao mesmo tempo em uma nica passada pelo scanner. Como as outras opes, alta velocidade de scanners tambm aumentam o preo do scanner. Algumas vezes mais barato comprar dois scanners de 20 pginas por minuto do que um scan-

ner de 40 pginas por minuto. Essa opo apenas compatvel com sistemas GED que suportam mltiplas estaes de escaneamento. Se existe um enorme nmero de documentos a escanear, por exemplo, milhares de pginas, pode ser mais prtico e econmico utilizar um servio terceirizado de escaneamento. Para suportar essa opo, o sistema GED deve acomodar facilmente a sincronizao entre as pginas escanerizadas, o servio terceirizado e as pginas escanerizadas dentro da organizao. O volume de dados que contm imagens e informaes de ndice necessitam ser modulares e facilmente portteis. Isso assegura que os documentos escanerizados pelo servio terceirizado podem ser incorporados no sistema ao vivo sem interrupes de sistema e sem interrupes e/ou reindexao do trabalho existente. Essa opo frequentemente referida como volume portteis . Se uma organizao tem vrios escritrios e necessita compartilhar os documentos escanerizados um por um, volumes portteis tem a capacidade e a maneira de facilmente distribuir arquivos.

umento. Essas imagens so usualmente armazenadas com arquivo de qualidade TIFF (Taggeg Image File Format). O processo de converso tambm gera um completo arquivo de texto enquanto mantm o formato visual do arquivo original. Esse arquivo de texto tambm pode ser usado para indexao de texto do documento para auxiliar em pesquisas e recuperaes futuras. Converter documentos eletrnicos descongestiona o uso do scanner e economiza papel e recursos de impresso alm de produzir uma imagem clara do que scannear documentos de papel. Esse mtodo o melhor para arquivos permanentes.

Convertendo documentos em imagens

Importando
Importar tambm conhecido EDM Eletronic Document Management, o segundo melhor mtodo para trazer documentos eletrnicos como documentos do Office, grficos, clips de audio ou filmes para um sistema GED. Arquivos podem ser clicados e arrastados para um sistemas GED mas so modificveis e mantm seu formato nativo. Esses arquivos podem ser visualizados no seu formato original sendo inicializados pela aplicao original ou utilizando pelo prprio sistema GED .
4

Converso
Converter documentos um processo de transformar documentos do processador de textos ou planilhas eletrnicas para um permanente formato de imagem para ser armazenado com um sistema de imagem. Aplicaes Windows como Microsoft Word, Excel ou Autodesk AutocadCAD podem imprimir arquivos existntes em uma imagem inaltervel do doc-

to no proprietriodo. A indstria de informtica avana mais rapidamente do que armazenar imagens de documentos ou arquivos de textos, um formato proprietrio pode deixar uma organizao refm das aplicaes proprietrias em capricho a uma nica empresa. Nesse momento, existem cinco primrias de armazenamento; Mdia magntica (Discos Rgidos) Armazenamento ptico-magntico
Importando arquivos

opes

Discos compactos DVDs WORM As vantagens e desvantagens de cada uma so descritas a seguir.

Arquivando documentos
Uma vez que os documentos foram trazidos para o sistema, eles devem ser arquivados. Sistemas GED devem incluir mudanas tecnolgicas, aumento de volumes de documentos e testes de tempo. A necessidade e oramento para armazenamento de imagens so melhores determinadas por organizaes individuais envolvidas. Um bom sistema GED deve ser capaz de utilizar qualquer dispositivo de armazenamento atualmente disponvel, e os que estaro sendo lanados futuramente, para manter uma longa durao para armazenamento de documentos. Isso permite que voc selecione o equipamento que melhor adaptar-se com sua necessidade, tanto agora como no futuro. Para assegurar a habilidade de leitura no futuro, se um sistema GED no utilizado para arquivo digital, os arquivos devem ser em um forma-

Mdias Magnticas (Discos Rgidos)


A cada vez mais aumentam a velocidade de resposta ao acesso na recuperao de documentos e uma grande reduo do preo fazem que as mdias magnticas, tanto como os discos rgidos isolados ou um sistema RAID (Redundant Array of Independent Disks) so uma escolha popular. Sistemas RAID significam o agrupamento de vrios discos rgidos de mesmo tamanho e modelo configurados para que apaream como um nico disco no armazenamento de grandes volumes. Esse sistema protege dados contra perdas provendo redundncia de dados entre os discos e tolerante a falhas de hardware contra os possveis problemas em discos. Esses disposi-

tivos no possuem um custo alto e podem ser agrupados para armazenar grandes volumes de documentos e prover um rpido acesso. A desvantagem dessa opo que enquanto no so caros ainda possuem a possibilidade de conter problemas de hardware como falhas mecnicas. Arquivos de dados tambm so facilmente deletados, ento operaes de backup desses dados fator muito importante para assegurar os dados pois podem ser restaurados.

Disquete ptico Magntico

Armazenamento ptico Magntico


Anos anos atrs , as mdias pticas Magnticas (OM) como disquetes e discos foram uma soluo popular para fazer backup de arquivos pessoais de um computador. Como o termo diz por si s, um dispositivo OM utiliza tecnologias tanto ptica como magntica que obtm ultra e alta densidade. Um tpico OM um pouco maior que o convencional disquete de 3.5 que podem armazenar at 1.44 Mb de dados, um OM pode armazenar at 100Mb at alguns gigabytes (Gb). Um sistema OM arquiva os dados em alta densidade utilizando laser e combinao entre leitura e gravao magntica. Ambos, laser e magntico so utilizados para adicionar os dados no disquete. O laser aquece a superfcie do disquete e ento pode ser facilmente magnetizado. Dados podem ser deletados e/ou sobregravados sem limite de vezes, como um convencional disquete de 3.5.

OM drivers incluem convenincia, custo modesto e confiabilidade. Arquivos de dados podem ser completamente apagados. Com a baixa do custo dos discos rgidos , a popularidade dos OM cairam. Os discos OM podem serem instalados em jukeboxes que suportam centenas de discos.

Discos Compactos
So pequenos discos plsticos usados para armazenar informaes digitalmente. Desenvolvidos inicialmente para sistemas de audio e como uma alternativa para registros fonogrficos , CDs so atualmente tambm utilizados para armazenar dados de sistemas provenientes de computadores. Informaes digitais so gravadas no CD codificando como uma srie de microscpicos pontos na superfcie reflexiva do alunnio do disco. O disco coberto com um plstico transparente que executado em um equipamento que utiliza uma interface laser para ler as estampas dos pontos na rea de superfcie dos discos. Os CDs no tm a habilidade de gravar no processo de execuo quando acessados. Formatos padres de CDs incluem CD-ROM (Compact Disc-Read
6

Only Memory), um CD gravvel, CD (CD Recordable) que permite a gravao uma nica vez e ainda CD-RW (CD Rewritable) que permitem vrias gravaes em um mesmo CD. CDs oferecem um seguro e confivel meio que provm um termo longo de armazenamento de imagens, em alguns casos at 100 anos. CDs utilizam especificaes ISO-9600 que significa que os dados podem ser lidos em vrias plataformas de computadores como por exemplo PCs, MACs.... A desvantagem bsica dessa soluo o limite de armazenamento a capacidade do CD e podem ser acessados pelos dispositivos de CDRoms, Torres de CD e jukeboxes at 500 discos fazendo disso um mtodo conveniente para armazenamento de grandes nmeros de documentos.

computadores e informaes em negcios com um nico sinal. Iro substituir os CDs, fitas de videos e talvez os cartuchos de jogos. DVDs tm a capacidade de arquivar mais dados do que o espao fsico em um CD. Como um CD ou DVD, permite acesso randmico em qualquer parte do disco sem a necessidade de passar para a frente ou para trs como uma fita . Como um OM , um DVD nunca encosta a midia no momento do acesso, no caso de msica tocada por um feixe de raio laser, sendo assim no produzem arranhos ou gastos na midia se voc persistir acessando o mesmo dado. A superfcie plstica sensvel a toque de dedos , poeira e sujeira. Cuide deles com os mesmos cuidados dos CDs mas sem tratamentos especiais. Isso significa que DVDs podem ser executados milhes de vezes e continuam a representar a melhor opo de longa durao para um seguro armazenamento de documentos GED. As desvantagens dessa opo so os altos custos e o diferente padro entre unidades de DVDs e unidades de CD-ROMs como no caso dos videos VHS e Beta , diferentes empresas esto usando diferentes formatos para gravar DVDs.

Torre de disco compacto

DVDs
DVD significa Digital Video Disc ou Digital Versatile Disc que a prxima gerao de tecnologia de armazenamento em discos pticos. essencialmente maior, mais rpido e podem armazenar maiores volumes de informaes que os CDs e ainda capacidade para vdeo e audio. DVD apontam para diverso e lazer,

Discos Digitais

WORM
WORM significa , Write Once Read Many , ou seja, Grave uma vez e leia vrias. uma tecnologia de disco ptico que permite que grave dados em um disco apenas uma vez. Os dados so permanentes e podem ser lidos inmeras vezes. Esse formato de mdia requer um especial dispositivo de hardware e software para execut-lo. Diferente dos CD-ROMS eles apenas podem ser lidos em drivers compatveis. No existe muita aceitao, embora tenham encontrado um pequeno mercado de arquivo de mdia. Por motivo de um limitado nmero de empresas que provm, materiais e suporte para tecnologia WORM no altamente recomendado.

Indexando Documentos
Quando documentos em papis so recebidos em um escritrio, eles devem ser organizados para serem utilizados. Eles so normalmente etiquetados, organizados, indexados, grampeados e localizados em pastas em armrios. Sem esses passos nada poderia ser encontrado em um local de trabalho. Documentos eletrnicos no so diferentes. Um sistema GED deve prover diferentes mtodos de organizar as informaes para um uso futuro. No importando qual o tipo de combinao de metodologia de indexao utilizada, necessita ser fcil de usar e de fcil entendimento por pessoas que recuperam os documentos bem como por aqueles que armazenam os mesmos. Existem vrias idias de como introduzir a metodologia para adicionar os documentos no sistema GED. Em geral quanto mais um sistema GED puder adaptar-se no sistema atual da empresa, menor ser as mudanas internas e a necessidade de treinos. Existem trs maneiras primrias para organizar documentos em sistemas GED:
Disquete WORM

Arquivos de ndices Indexao de texto Estrutura de pastas

Arquivos de ndices
Indexando documentos utilizando campos e palavras-chaves um mtodo tradicional utilizado com papel que traduz muito bem aos sistemas eletrnicos. Um sistema GED deve permitir usurios a customizar modelos de ndices, criar vrios modelos e ter diferentes tipos de ndices de dados com cada um desses modelos como data e caracteres numricos e alfabticos. Campos de indexao podem ser usados para criar categorias de documentos, rastrear data de criao e/ou reteno , descrio do documento entre usurios. Em adio um sistema GED deve permitir caractersticas de caixas de opes para acelerar a entrada de dados nos campos e ter ferramentas disponveis para auxiliar a entrada automtica de dados nos ndices de informao..

idiomas requerido, um sistema GED dever suportar OCR e indexao em texto nos mesmos idiomas em questo. Para previnir trabalho extra , um bom sistema GED deve permitir o OCR e indexao de texto automtico sem requerer envolvimento humano

Estrutura de pastas
Com campos indexados e texto completo indexado, um sistema GED deve prover um mtodo visual para localizar documentos. Na maioria dos escritrios, arquivos so localizados procurando por pastas ou em gavetas especficas. Um sistema GED deve ter a habilidade de eletronicamente recriar esse sistema atravs de vrios nveis de pastas A flexibilidade da estrutura de pastas facilita o preenchimento dos documentos eletrnicos e faz do sistema de GED mais eficiente.

Indexao de textos Full-text


Provendo indexao de texto, sistemas GED eliminam o tempo necessrio para pessoas qualificadas ler e manualmente indexar documentos usando palavras-chaves. Para fazer isso, o software deve ter a capacidade de executar OCR, Optical Character Recognition . Esse processo l uma pgina escanerizada e ento indexa cada palavra. Isso reduz dramaticamente os custos de indexao enquanto provm capacidades de pesquisa. Com as indexaes de texto completo voc pode localizar os documentos utilizando qualquer palavra mesmo quando a(s) palavra(s) no esto contidas em um ndice de palavras. Tipicamente , quando um computador utiliza OCR, o documento utiliza como padro o idioma Ingls. Se a utilizao de diferentes
9

Exemplo de estrutura de pasta/arquivo

Recuperando Documentos
Recuperao de documentos onde um potente sistema de indexao pago. Usurios necessitam utilizar ferramentas para encontrar documentos entre sistemas baseados no que eles conhecem. Em alguns casos, isso significa procurando atravs de pastas, em outros casos isso pode significar conduzir buscas em campos de indexao. Se tudo que se sabe sobre o documento que se quer buscar uma palavra que ele contm, uma indexao de texto completa ir auxiliar a encontrar esse arquivo relevante. Entretanto, o mtodo de recuperao deve ser simples e de fcil utilizao. Usurios que so familiarizados com documentos textos devem ser capaz de utilizar as informaes para encontrar o que eles necessitam. Alguns sistemas podem apenas encontrar pginas baseadas em palavras chaves. Esse mtodo no sempre o melhor porque a pessoa que seleciona as palavras chaves no necessariamente a mesma pessoa que faz a busca. Para ser totalmente til , um sistema GED deve utilizar recuperao de texto completo.

Como isso, utilizar um nome de documento e pastas para localizar e encontrar um documento pode auxiliar e ser intuitivo mas nem sempre o melhor mtodo. As vezes uma pessoa ir saber exatamente quais documentos ela necessita, mas no em que pasta eles esto e/ou o nome do documento. Utilizando as informaes de campos de indexao para encontrar um documento em particular pode ser til. Um sistema com caractersticas completas ir possuir campos de modelos definidos pelo usurio. Campos de indexao para encontrar um especfico documento pode ser til. Campos de indexao permitem usurios a combinar milhes de registros em segundos para encontrar seus documentos. Claro que uma pessoa necessitar conhecer como o documento foi categorizado e a que campos de modelo foram associados a ele. Para maximizar a eficcia da busca, um sistema de busca inteligente deve ser capaz de combinar buscas pelos modelos com textos completos com os nomes dos documentos e a localizao nas pastas. Um bom sistema GED faz a recuperao de documentos relevantes rpida, fcil e eficiente.

10

Controlando Acesso
O componente final e obrigatrio de um sistema GED o controle de acesso. Em muitos ambientes de computadores, diferentes pessoas utilizam diferentes tipos de computadores em diferentes localidades para buscar informaes. Um sistema GED completo deve prover a esses diferentes usurios apropriados nveis de acesso, sem compromoter confidencialidade e/ou segurana. Para fazer isso, um sistema deve possuir duas caractersticas fundamentais: Ampla disponibilidade Segurana adequada

CDs , notebooks e/ou documentos via e-mail. Sistemas GED sem essa flexibilidade limitam as habilidades para o usurio. Em adio, compartilhar documentos atravs da Internet e Intranet permitem aos administradores de sistema a desenvolverem um sistema GED atravs da rede corporativa e/ou para o pblico. Usurios devem ser capazes de buscar, recuperar e visualizar documentos com um Web Browser. Documentos acessados pelo browser remove as limitaes de localizaes e de plataformas de computadores como (Windows, Macintosh , Unix , etc)

Segurana Adequada Ampla disponibilidade


Um sistema GED deve oferecer diferentes caminhos para acessar arquivos. Um amplo nvel de acesso economiza recursos financeiros, capital intelectual e sistema de rede. O mtodo mais comum de acessar pelo computador do usurio. Todo sistema GED deve prover uma interface cliente-servidor que permita escanerizao, indexao e recuperao de documentos. Sem essa interface bsica, o sistema no pode funcionar. Para prover ampla disponibilidade e flexibilidade de acesso, sistemas GED hoje em dia devem combinar as necessidades dos escritrios com suas diversas utilidades e lotaes remotas. Sistemas GED no so mais um processo dentro do escritrio. Muitos usurios requerem portabilidade para trocar documentos com outros colegas e com outros escritrios em outra localidade. Isso frequentemente feito atravs de As organizaes utilizam sistemas GED para arquivar uma enorme variedade de documentos, tanto pblico como privados, um sistema de controle de acesso necessita estar presente. Um adequado sistema de seguranca deve permitir ao administrador do sistema controlar em que pastas e documentos os usurios podem visualizar, que aes podem executar nesses documentos (editar, copiar, deletar, etc). Esse sistema deve controlar acesso as pastas, documentos e at imagens com tarjas e textos de uma maneira simples. A habilidade de desenvolver GED para uma grande variedade de usurios requer um robusto sistema de segurana combinado com a interface do usurio. Um bom sistema de acesso ir fazer um sistema GED disponvel para todas as pessoas autorizadas tanto em um escritrio como em uma localidade remota pela web, tudo sem comprometer a segurana do sistema.

11

Benefcios de Gerenciamento de Documentos Eletrnicos


Milhes de organizaes ao redor do mundo utilizam GED todos os dias ao invs de sistemas de papis. GED oferece um nmero de benefcios sob papel e microfilmes Recuperao Rpida permite que voc encontre documentos rapidamente sem deixar a sua mesa de trabalho. Papel e microfilme so lentos porque usurios devem ir at os arquivos e acess-los manualmente. Indexao Flexvel pode indexar documentos em vrias diferentes maneiras simultaneamente. Indexar papel e microfilme em mais de uma maneira inoportuno, caro e consome tempo. Busca em texto- full text GED podem recuperar arquivos por qualquer palavra no documento , recurso impossvel com papel e microfilme. Sem perda de arquivos documentos escanerizados mantm-se nas suas pastas quando so visualizados, nenhum perdido ou no localizado. Ainda mais , modelos de ndice e buscas no texto completo podem localizar documentos se eles foram acidentalmente movimentados. Perdas de documentos so caras e consomem tempo para repor. Arquivo Digital O risco de perda ou danificao de papel para documento eletrnico e reduzido com um sistema GED. Mantendo as verses de arquivos em sistemas GED, auxilia a proteger documentos em papel de serem sobre carregados e mantm os documentos em um formato no proprietrio. Compartilhe arquivos facilmente sistemas de GED fazem o compartilhamento de documentos facilitado entre colegas de trabalho e cliente pela mesma rede de computadores, por um CD ou pela WEB. Documentos de papel normalmente requerem uma fotocpia para serem compartilhados e microfilmes requerem converses para papis. Melhora de Segurana GED pode prover melhor e mais flexibilidade de controle sobre documentos. Controles de segurana nas pastas, documento individual, nvel de palavras e/ou para diferentes grupos ou indivduos. Em contraste, todos documentos de papis arquivados em um armrio possuem o mesmo nvel de segurana. Economize Espao GED ir ajudar a recuperar valioso espao fsico no escritrio tirando as pilhas de papis. Recuperao de desastres GED provm um fcil caminho para fazer um backup dos documentos que podem ser localizados fora do escritrio. Papis so caros e uma cara maneira de fazer cpia de documentos tambm sendo vulnerveis a incndios, enchentes e roubos.

12

Implementando Gerenciamento de Documentos Eletrnicos


Avaliando suas necessidades
Quando decidir para um sistema GED, existe um nmero de questes a considerar. Quantos documentos devem ser armazenados, considerando tanto o nmero de documentos existentes como os documentos adicionados manualmente? Essa informao determina quanto espao de armazenamento necessrio, a configurao de hardware e o custo do sistema. Quantos usurios iro utilizar o sistema ao mesmo tempo? Isso determina os custos de softwares preliminares e o tamanho do servidor. Quais departamentos iro utilizar o sistema e o que o pblico ter acesso? Isso determina quais caractersticas de especificao e nveis de segurana que sero necessrios Quais os problemas srios devem absolutamente ser resolvidos, e quais tens devem serem encaminhados para especificar caractersticas e nveis de segurana necessrios Voc necessita de uma soluo padro ou customizada? Isso determina o nmero de consultores, instalaes, treinos, configuraes e suporte que sero necessrios. Que tipo de rede esta sendo atualmente utilizada, NT, NLM, LAN ou outras, ir manter-se? Isso determina restries, configuraes de sistemas e atualizaes de estaes de trabalho.
13

Avanando de Projeto Piloto a Soluo Empresarial


Muitas vezes, escritrios encontram a melhor maneira de iniciar um projeto piloto envolvendo um ou mais departamentos antes de expandir o sistema por toda a empresa. Muitas empresas iniciam com Departamentos de Documentao mas GED pode ser implementado em qualquer departamento que seja necessrio. Projetos pilotos permitem as organizaes desenvolver completamente e testar os procedimentos de imagens antes de compromoter-se com uma soluo empresarial.

Instalao
O primeiro passo de uma instalao deve ser a inspeo do local pelo revendendor do software para determinar o equipamento necessrio e os problemas de conectividade de redes. Instalar hardware envolve em desempacotar, conectar e configurar todos os componentes como instalando os sistemas operacionais e drivers. Isso tambm inclue testar os equipamentos para assegurar a funcionalidade adequada do hardware e as conectividades de rede. Depois de testar hardware, a instalao de software consiste em instalar o sistema GED no servidor e nas estaes clientes e testar. Geralmente o revendedor ir executar essas atividades.

Treinamento
Programa de treinamento deve direcionar diferentes nveis de usurios e diferentes preocupaes.

Usurio Final
Isso envolve ensinar usurios finais os mecanismos do sistema. Esse treino deve ser no local de trabalho. Cada grupo de usurios devem receber instrues necessrias para assegurar conforto com o novo sistema GED. O tempo de treinamento necessrio ir depender do nvel dos usurios em utilizar aplicaes Windows, o sistema GED facilita o uso das nova mudanas para procedimentos existentes fornecendo uma operao amigvel e poucas mudanas nos procedimentos. A maioria dos usurios aprendem muito rpido. aconselhado classes com at 10 usurios e que os participantes no sejam interrompidos.

eletrnico. Os gerentes de atividades como registros de documentos necessitam entender a diferena nessa atividade entre papel e eletrnico , decises de retenes de tempos, armazenamento e metodologias de trabalho devem ser definidas antes de iniciar o trabalho. A durao do treinamento depende da complexidade do sistema.

Operao Prtica Supervisionada


Isso envolve a superviso do escritrio utilizando personalizadamente. Isso permite aumentar o conforto com o sistema e a fazer as perguntas diretamente ao tcnico. Essa forma de treino um excelente caminho de fazer as pessoas confortveis com o novo sistema.

Administrao do Sistema
Para assegurar que o sistema GED funciona tranquilamente importante treinar alguns indivduos como adminstrar o sistema. O treinamento no prprio ambiente de trabalho o mais recomendado porque aumenta a familiaridade com detalhes especficos do sistema GED.

Implementao de Consultoria
Esse envolve aqueles que so responsveis por gerenciamento de registros e documentos que desenvolvem estratgias para traduzir os documentos existntes em papel para sistema

14

Assuntos Legais
Como sistemas GED so triviais hoje em dia, vrias leis reconhecem valor em arquivos de documentos eletrnicos. Muitas agncias de governo, afirmam que documentos originrios de papis podem ser destrudos uma vez que: Registros devem ser arquivados em um formato que no permite alterao como CD, DVD ou WORM O sistema tenha controles sensatos para assegurar integridade, preciso e confiabilidade. O sistema deve prover algum tipo de auditoria para detectar criaes , adies , delees de registros. Uma completa e precisa transferncia de arquivos pode ser feita.

O sistema possui confiveis controles para prever e detectar deteriorizao de registros Existir um sistema de indexao que permite localizar registros Permite imprimir os documentos O sistema deve permitir regerncias cruzadas entre outros sistemas de registros. O sistema deve possuir documentao explicativa de como o produto funciona e como pode ser configurado. A legalidade dos sistemas de GED variam de cada agncia federal, estado, pas e departamento envolvido. Organizaes devem consultar advogados para especificar os estatutos de governo para sua rea.

15

Suporte e Manuteno
Como manter um carro funcionando tranquilamente, sistemas GED requerem suporte externo. Revendas devem oferecer diversos tipos e nveis de suporte de atualizaes de softwares a manutenes em clientes. Vrios fatores afetam o nvel de suporte que a organizao necessita: Tamanho do sistema comprado Quantidade do sistema em uso Sistemas de misses crticas que devem ser operacionais 24 horas por dia em 7 dias da semana Pessoa certificada com um nvel de experincia em sistema GED Acesso a Internet Mudanas na rede e/ou infraestrutura da organizao Mudanas entre pessoas

Suporte pode incluir qualquer uma das seguintes: Atualizao de softwares Linha telefnica Hotline Acesso remoto via dial-up no seu sistema Software patches disponveis via FTP Boletins tcnicos regularmente publicados Visitas de manutenes em clientes Adicional e avanadas sesses de treinos Suporte de hardware Quando comprar hardware como servidores, dispositivos de armazenamento e estaes de trabalho, empresas devem escolher revendas com boa reputao para servio e suporte. Enquanto o custo inicial pode ser mais alto, os benefcios incluem menos tempo com equipamentos sem uso por problemas e maior consistncia na preciso de sua funcionalidade.

16

Caractersticas Adicionais
Sistemas GED devem prover o bsico em escanerizao, recuperao e visualizao. Embora um sistema GED seja designado para vrios usurios e/ou muitos documentos tero necessidades mais rigorosas. Essa sesso discute esses requerimentos e vrias maneiras de abord-los. Adicionar tarjas (preto e/ou branco) nas imagens e preservar a integridade do documento original Adicionar imagens como confidencial, importante , enviado via fax nos documentos denotando aprovao ou rejeio Adicionar notas que contenham comentrios adicionais. Todas anotaes devem ser sobre-postas e no podem mudar a imagem original. Deste modo, um documento pode ser impresso com ou sem as anotaes. E mais importante ainda, de um ponto de vista legal, um documento arquivado em um sisteama GED pode oferecer frequentemente cpias atualizadas dos documentos sem alterar sua forma original.

Facilidade de uso
Uma das mais importantes caractersticas de sucesso de um sistema GED a facilidade de uso. Um sistema apenas ser utilizado se a incluso de documentos for fcil e simples. Os melhores sistemas so flexveis, possui interface grfica intuitiva e adapta-se com a maneira que as pessoas j trabalham .

Anotaes
Anotaes provm informaes adicionais sobre um documento sem alterar sua imagem original. Registros de papis so geralmente anotados selecionando , adicionando mensagens, tarjas ou notas e registros de imagens podem suportar essas anotaes. A segurana de um sistema GED deve controlar quem pode visualizar anotaes como selees, notas e quem pode ler atravs das tarjas. As anotaes tpicas de um sistema GED incluem: Selecionar imagens e textos em vrias cores e enfatizar palavras e sesses
17

Imprimir/ Fax / E-mail


Sistemas de GED devem prover caminhos para obter informao do sistema. Imprimir, enviar faxes e e-mails so algumas maneiras de fazer isso. Para maximizar sua utilizao, sistemas GED devem suportar as mais comuns impressoras e faxes e ainda serem capazes de imprimir imagens, textos e anotaes. Com o crescimento em popularidade da Internet, mais pessoas usam e-mail para se comumicarem e enviarem informao. Organizaes tero uma grande economia se transmitirem seus documentos via e-mail ao

invs de fax ou servios de correio. Sistemas GED deveriam ter uma opo que permitisse facilmente o envio de imagens para qualquer sistema de correio eletrnico compatvel com MAPI (Mail Application Program Interface), e que fosse lido por quem no possui GED.

Wildcards
Wildcards so caracteres, como * (asterisco) e ? (interrogao), que podem ser usados em um texto completo ou no ndice de busca de palavras-chave para compensar por erros de escrita, ou quando a escrita incerta. O asterisco representa qualquer caracter ou caracteres, enquanto que a interrogao representa um nico caracter. Por exemplo, procurando por b*m, voc acharia as palavras bem, bom, bombom. Procurando por b?m apenas encontrar as palavras beme bom.

Opes De Procura Usando Texto


Para maximizar a eficcia da procura de texto, existem vrias opes de ajuda. Essas opes consideram possveis erros de OCR, oferecem ferramentas para restringir a busca, prov linhas de contexto para as palavras procuradas, e facilitam a busca da palavra quando o documento visto.

Operadores Booleanos
Quando uma busca de texto for realizada, normalmente vrios documentos iro corresponder aos critrios de busca. Os operadores booleanos (E, OU, e NO) ajudam a ajustar a busca e reduzem o nmero de documentos no relacionados. Por exemplo, para encontrar documentos relacionados ao Ministrio da Educao, a busca seria Ministrio E Educao.

Lgica Fuzzy
A procura de um texto assume que as palavras procuradas foram escritas corretamente e o OCR est correto. Infelizmente, as pessoas erram na escrita e no existe um pacote de OCR 100% perfeito. A lgica Fuzzy compensa esses erros atravs da procura de variaes na forma como a palavra escrita. Um sistema GED deve permitir que o usurio controle a quantidade de fuzzines da busca atravs da escolha do nmero de letras que podem estar erradas na palavra ou qual o percentual uma palavra pode estar errada. Por exemplo, uma busca utilizando a lgica fuzzy da palavra caneta poderia achar a palavra caneta, careta, gaveta.

Buscas por Aproximao


Buscas por aproximao podem ser usadas para limitar os resultdos da busca. So utilizadas para encontrar palavras que ocorrem dentro de um certo nmero de palavras, sentenas ou pargrafos. Por exemplo, para achar documentos relacionados a processos contra tabaco, mas no sobre plantao de tabaco ou processamento de tabaco, usurios poderiam procurar por tabaco dentro de uma sentena que tenha processos.

18

Linhas de Contexto
At buscas especficas geralmente resultam em vrios documentos possveis. Alm de prover usurios com uma lista de documentos que atendem aos critrios de busca, algums sistemas GED apresentam linhas de contexto que mostram como cada ocorrncia da palavra usada em cada documento encontrado. As linhas de contexto permitem ao usurio encontrar o documento apropriado sem a necessidade de ver todos os documentos na lista de resultados.

Segurana
A segurana de um sistema de GED um ponto crtico para uma implementao de sucesso. Enquanto que segurana pode no ser a primeira preocupao para uma instalao departamental, ela se torna mais importante medida que o sistema se expande e permite o acesso a diferentes departamentos e acesso pblico aos arquivos. Um GED deve prover segurana em vrios nveis, permitindo que cada instalao utilize o mtodo que melhor se adaptar s suas necessidades. A segurana do sistema deve ser capaz de realizar esse nvel de segurana e ser simples de administrar.

Highlight de palavras encontradas


Uma vez que o documento foi selecionado, as palavras de busca precisam ser localizadas dentro dele. Para ajudar esse encontro, alguns sistemas de GED mostram a pgina apropriada do documento e ressaltam a palavra de busca no texto e em imagens. Dessa forma fica fcil para o usurio encontrar imediatamente a parte do documento que o interessa e ampli-la, ao invs de ter que procurar pelo documento inteiro.

Direitos de Acesso
Um sistema GED deve permitir que organizaes controlem o acesso s pastas e documentos individuais, tanto no nvel de grupo quanto individual. A utilizao de grupos e direitos adquiridos permite aos administradores rapidamente assinalar privilgios de leitura, enquanto que a segurana a nvel de usurio permite que usurios especficos como gerentes vejam documentos que o resto do grupo no v. Por exemplo, o departamento de Polcia pode ter acesso aos prprios arquivos e aos do de Planejamento, mas o departamento de Planejamento pode apenas ver os prprios arquivos.

Internet/Intranet
Um GED deve ser capaz de prover uma forma simples the publicar informaes na Internet ou Intranet. Isso permite que organizaes compartilhem informaes com outros departamentos, escritrios remotos, clientes ou para o pblico. Sistemas na WEB devem ser totalmente aptos buscas de palavras e tambm suportar protocolos de segurana como sistemas de rede. Idealmente, um sistema GED no requer HTML ou cdigos complexos para publicao de pginas na WEB.

Direito a Funes
Um sistema GED deve tambm permitir que a organizao controle o direito s funes em relao s pastas e documentos individuais, em ambos os grupos e a nvel individual. Enquanto

19

que direitos de acesso controlam quais pastas ou documentos um usurio pode ver, direito a funes controla as aes que o usurio pode exercer em um documento, tais como adicionar, editar, copiar ou apagar arquivos. Por exemplo, enquanto departamentos diferentes podem ter privilgios de leitura de minutas da Prefeitura, apenas os funcionrios da prefeitura podem modificar esses arquivos.

quer lugar, de tal forma que possam ler os documentos em um outro computador. Quando as pessoas viajam a negcios, frequentemente necessrio trazer os documentos nas viagens. Carregar vrios documentos em papel praticamente impossvel, e assim informaes importantes so deixadas para trs. Com um sistema que suporta volumes portveis, documentos podem ser copiados para outros locais. Pastas contendo documentos relevantes podem ser transferidas para outros bancos de dados rpida e facilmente utilizando CDs que permitem a procura de documentos, e podem armazenar at 12.000 pginas cada.

Tarjamento de texto
O tarjamento de texto (em preto ou branco) permite que a segurana seja controlada a nvel de palavras. Um sistema GED deve oferecer a habilidade de bloquear imagens ou textos. A habilidade do usurio de ver textos bloqueados ir depender do seu acesso de sergurana. Por exemplo, relatrios de crime podem estar disponveis para mltiplos departamentos, mas apenas o departamento de polcia capaz de ver informaes de identificao como nomes.

Auditoria
Como um nvel adicional de segurana, um sistema GED deve oferecer a habilidade de rastrear quem est usando o sistema, quais documentos esto sendo lidos, quais aes esto sendo aplicadas aos documentos, e quando essas aes aconteceram. A habilidade de auditoria especialmente importante quando documentos so confidenciais e quando existem vrios usurios.
Discos pticos pesam muito menos que arquivos em papel.

Se um sistema GED no fornecer esse tipo de portabilidade, usurios desse sistema vo achar difcil trazer seus documentos em viagens, alm de transferir arquivos entre escritrios distintos. Pastas transitrias e volumes portteis ajudam usurios a transferir seus documentos para outros escritrios ou clientes, rpida e facilmente.

Portabilidade e CDs
Sistemas GED podem permitir que usurios carreguem documentos importantes para qual-

20

Pastas Transitrias
Para usurios que possuem uma cpia do sistema de GED em seu laptop ou escritrio remoto, vrios sistemas permitem a usurios simplesmente mover as pastas apropriadas para uma pasta transitria e transferir essa pasta para o laptop ou sistema remoto.

Para ser mais eficiente um sistema de GED deveria oferecer Royalty-free na publicao do CD e prover um visualizador que permita as pessoas que no possuem um sistema GED de pesquisar os documentos dentro do CD distribuido.

Volumes Portteis
Volumes portteis so como enorme pastas transitrias e permitem atualizaes constantes para compartilhamento do banco de dados de imagens em diferentes localizaes. Essa habilidade proveitosa para organizaes que utilizam um bureau de servios ou para aquelas com vrios escritrios. Em vrios sistemas de imagem de grande escala, os arquivos de documentos so armazenados em mltiplos drivers ou volumes na rede. Volumes portteis permitem que volumes inteiros contendo imagens de documentos e texto sejam transferidos em massa para outros bancos de dados.

Terceirizao de Escanerizao
Algumas vezes organizaes acham mais rpido ou mais eficiente financeiramente ter um bureau de servios realizando a converso dos documentos para meio digital. Geralmente, o sistema GED mantido pela organizao e o bureau de servio entrega regularmente CDs contendo os documentos escanerizados. Alm do armazenamento das imagens e informao sobre os textos, esses CDs devem tambm carregar dados descrevendo os nomes dos documentos, campos de indexao, pastas, etc. Caso a organizao modifique os documentos existentes e crie novos ao mesmo tempo, no possvel simplesmente sobrepor o banco de dados com o novo providenciado pelo bureau de servios. O sistema GED deve ser capaz de fundir os novos dados do bureau de servios com os dados existentes da organizao. Volumes portteis fazem isso automaticamente.

Distribuio de Documentos
A maioria das organizaes precisa compartilhar documentos com seus parceiros de negcios ou clients. Com um sistema de papel, muitas cpias devero ser impressas, talvez recuperadas e ento enviadas. Um sistema de GED permite organizao copiar com rapidez o arquivo desejado em um CD e ento envi-lo, economizando no custo de impresso e de postagem.

21

Recuperao ps Desastre
Desastres podem ocorrer a qualquer momento e danificar ou destruir os documentos de uma organizao. Para ajudar na recuperao aps um desastre, aconselhado manter cpias de segurana dos documentos com a ajuda de um sistema GED. Volumes portteis que permitam a recriao de um sistema do zero podem simplificar esta tarefa.

de indexar palavras-chave e mov-los para as pastas apropriadas. O sistema deve permitir que as pginas sejam rearranjadas, retiradas ou adicionadas a um documento para corrigir qualquer engano que possa haver ocorrido na organizao do arquivo

Cdigo de Barras
Em operaes de alto volume de escanerizao, separar e indexar documentos automaticamente utilizando cdigo de barras pode salvar tempo e dinheiro. O cdigo de barras pode ser usado para indexar documentos atravs da extrao de campos de um banco de dados externo, atravs do preenchimento de campos com valores pr-assinalados, ou atravs da associao de certos documentos a um particular ndice de fichas. O cdigo de barras pode at funcionar como marcadores que indiquem o comeo de um documento, automatizando a separao entre documentos. Enquanto que o cdigo de barras requer alguma preparao do banco de dados, os benefcios podem ser enormes. Por exemplo, em 2.000 registros de votos, 500 indagaes e 2.500 pginas de minutas legislativas tem de ser escanerizadas, marcas de cdigo de barras podem ser colocadas em cada documento. O sistema ento poder ler cada marca, determinando o incio de cada documento, assinalando o tipo correto de ndice de fichas para cada documento, e preenchendo informaes das fichas.

Processamento em Lote
Organizaes que lidam com vrios arquivos de Organizaes que lidam com vrios arquivos de imagens diariamente iro rapidamente entender a importncia do processamento em lote. Quando h necessidade de trazer um largo nmero de documentos para dentro do GED, ineficiente processar um a um individualmente. Um sistema GED deve permitir que os documentos sejam trazidos de uma vez s para o sistema para aumentar a velocidade do processo. A lentido do sistema durante a escanerizao ou converso de documentos individuais devido ao recomear/parar do processo, pode ser evitado se os documentos forem trazidos para o GED como um nico grande lote. Uma vez que todas as imagens tenham sido trazidas, o sistema deve permitir aos usurios facilmente agrup-las nos documentos apropriados antes

22

Zona OCR
Organizaes que processam os mesmos formulrios repetidamente podem desejar utilizar a zona de OCR para salvar tempo e memria de sistema. A zona de OCR economiza tempo pela automao da indexao de documentos, atravs da leitura de certas regies (ou zonas) de um documento e depois colocando o texto no campo de ndice apropriado. A quantidade de espao para armazenamento necessrio tambm reduzido porque apenas as respostas que foram entradas so indexadas e processadas pelo OCR. Para minimizar erros, o sistema deve permitir ao usurio setar um percentual mnimo de nvel de acuracidade para o OCR. Se qualquer poro do formulrio no atender ao padro, o sistema deve notificar o usurio, e um membro da organizao poder ler o formulrio e entrar o campo correto de informao manualmente.

comunicao estabelecida com o servidor de e-mail existente para o envio de notificao do evento para o recipiente. O Workflow deve incluir uma srie de tabelas condicionais que incluam o uso de recibo de retorno e de respostas pr-estabelecidas. Se uma tabela consicional for usada, o servidor de imagens deve enviar uma mensagem lembrete ou uma 2a. mensagem para um recipiente alternativo. Essas tabelas adicionais ajudam a eliminar gargalos e otimizar processos de negcios. Um componente essential em um sistema de workflow a automao de documentos. Um Workflow de documentos baseado em regras requer que a informao se movimente em um sistema hierrquico sem interveno externa. O Workflow deve ser capaz de automaticamente mover, copiar ou eliminar documentos dentro do banco de dados de imagem, baseado em uma srie de regras pr-determinadas. O administrador de sistemas usa a lista de regras para estabelecer os protocolos de roteamento e condies. Qualquer ambiente de escritrio pode ser considerado ideal e prtico, quando se trata de automao de escritrio e distribuio de trabalho. O sucesso de qualquer Workflow no est na habilidade de seguir as caractersticas exatas de roteamento ou reltorios gerados de um sistema totalmente automatizado, mas em gerenciar as excees s regras que aparecem. Um sistema de workflow eficiente deve prover acesso completo para o roteamento de documentos e informaes atravs da sua estrutura de pastas e sistema de segurana. Utilizando o acesso de segurana como a chave para implementao de

Workflow
Workflow pode aumentar os benefcios de um sistema GED atravs do roteamento de documentos para vrias pessoas. Enquanto essa funcionalidade adicional pode no ser vlida durante uma fase piloto, ela se torna fundamental a medida que o sistem expande. O Workflow deve notificar automaticamente usurios especficos de eventos especficos do sistema, baseado em uma lista criada pelo administrador do sistema. Uma vez que o evento detectado, a

23

sistemas permite ao Administrador de Sistemas facilmente modificar os direitos de acesso da forma necessria para acomodar o que ocorre realmente em um ambiente de trabalho dinmico. Um sistema de workflow deve oferecer aos administradores a simplicidade de copiar e arrastar, uma interface GUI simples e uma estrutura de pasta fcil de entender. Aplicaes de workflow devem ser compatveis com ODBC para conectar o banco de dados de imagem a banco externos de terceiros e aplicaes customizadas para criar um workflow completamente funcional. Como um componente final, o workflow deve prover uma segurana adequada atravs de relatrios da funo de auditoria.

Compatibilidade de Sistemas
Compatibilidade a habilidade de um sistema de GED trabalhar com computadores e sistemas de rede existentes. Para maximizar a probabilidade dessa compatibilidade com os sistemas existentes, um sistema GED deve: Trabalhar com sistemas operacionais existentes como servidores Novell ou Windows NT, e Windows desktop. Comunicar-se usando protocolos de rede populares como IPX/SPX ou TCP/IP Usar uma arquitetura aberta e um banco de dados no-proprietrio Usar uma arquitetura cliente/servidor com compresso/descompresso de imagens do lado do cliente e procura e indexao do lado do servidor para minimizar o volume de trafgo na sua rede. Armazenar arquivos em formatos padro de indstria.

Escalabilidade
A escalabilidade do sistema determina quanto o sistema GED ir crescer com as necessidades de sua organizao. Para uma escalabilidade completa, o sistema deve ter os seguintes atributos: Suportar at 1000 usurios concorrentes Armazenar pelo menos 100 milhes de pginas por banco de dados Arquitetura de sistema robusta Armazenar informao atravs de mltiplos drivers ou servidores Suporte a mltiplos bancos de dados Expanso para Web Publicar informao para CD ou DVD

24

Sistemas de Rede
Em qualquer escritrio documentos so utilizados para transmitir informaes entre as pessoas. Para um sistema GED ser realmente utilizado em um ambiente de escritrio, documentos devem ser acessveis para qualquer um que tenha autorizao. importante para um sistema GED ter um repositrio central de registros acessvel de qualquer PC. Armazenar documentos em PC individuais prejudica o fluxo de informao entre trabalhadores e desperdia tempo valioso e energia. Sistemas de rede tambm podem suportar certas funes de imagens mais eficientemente que PCs individuais. Por exemplo, o Reconhecimento de Caracter ptico (OCR) de uma imagem requer um grande poder computacional. Leva em torno de 10 segundos para uma tipica estao de trabalho para OCR cada pgina de um documento. Em uma instalao GED de rede, um lote de documentos podem ser OCR atravs de processamento paralelo com mltiplas estaes de trabalho. Por exemplo, uma organizao pode escanerizar 600 pginas de um documento em um dia tpico. Com uma nica estao de trabalho tentando OCR todos os documentos, pode levar at 100 minutos para o computador ler todas as pginas. Se um servidor com o dobro de velocidade tentar OCR os documentos, poder levar apenas 50 minutos. Entretanto, se cinco estaes de trabalho forem usadas para OCR esses documentos, a tarefa pode ser finalizada em 10 minutos

Arquitetura Cliente/Servidor
Aplicaes de imagens consomem recursos computacionais: os arquivos so enormes e os bancos de dados devem lidar com um grande nmero de registros. Com uma arquitetura cliente/servidor de verdade, tarefas como indexao, OCR e buscas so distribudas entre o cliente ( a estao de trabalho PC) e o servidor para otimizao da performance. Algumas tarefas possuem uma performance melhor no cliente, enquanto outras so mais eficientes se realizadas no servidor. Aonde tarefas especficas sero realizadas depende do sistema GED. Quando usurios de um sistema cliente/servidor querem procurar em um banco de dados, o PC cliente envia uma requisio ao servidor. O servidor ento procura no banco de dados central e envia uma resposta de volta ao cliente. A corrupo de dados por problemas na rede eliminada porque os arquivos nunca deixam o servidor. O trfego da rede minimizado porque o servidor apenas envia os documentos requisitados de volta para estao de PC. Alm do mais, funes como OCR, exibio de imagens e busca requerem um poder computacional extensivo. A arquitetura cliente/servidor se torna um requerimento quando um certo nmero de pessoas necessitam acessar documentos de um sistema GED. Mesmo que uma instalao comece com um projeto piloto de apenas um usurio, importante garantir que o sistema ser capaz de suportar um crescimento futuro.

25

Buscas podem ser realizadas mais rapidamente no servidor, que normalmente mais poderoso que uma estao individual. No entanto, pelo tradicional compartilhamento de arquivos de sistemas GED, uma cpia do banco de dados enviada atravs da rede para o PC, e esse performa as buscas. Esse mtodo leva a: (a)corrupo dos dados devido problemas na rede; (b) aumento do trfego na rede, por exemplo, o banco de dados possui 800MB em tamanho; e (c) tempo de busca depende da velocidade da estao PC. Sistemas de compartilhamento de arquivos podem ser mais baratos para comear, mas suas limitaes restringem expanso futura e flexibilidade.
Network Desktops

e melhoria no gerenciamento de registros significa que muitos escritrios necessitam encontrar um soluco GED hoje. Para enderear essas preocupaes, sistemas GED devem usar formatos de texto e imagem no-proprietrios. Com os exemplos de processadores de texto mostram, documentos salvos em WordStar, WordPerfect antigo ou at o antigo MS Word j so difices de ler. Sendo que cada empresa de processadores de palavras utiliza formatos proprietrios para seus documentos, adquirir o mais recente software para ler um formato antigo pode ser frustrante ou uma tarefa cara. O mesmo se aplica no mundo das imagens. Os formatos no-proprietrios disponveis para armazenar informao de documentos so poucos, mas estveis. ASCII tem sido um padro para informao de texto desde 1963 e se tornou um bloco de construo bsico para praticamente qualquer programa envolvendo texto. TIFF tem sido usado como um padro, um formato grfico no-proprietrio desde 1981. usado amplamente para transmitir informao de documento atravs de sistemas de imagens, mquinas de fax e software, e por projetistas. Dado que os padres ASCII e TIFF tem prevalecido desde ento, compradores de sistemas se sentem confortveis, e no importa qual novo paradigma aparea no futuro, os desenvolvedores de um novo formato tero um interesse nico em prover a converso para esses padres.Com formatos de documento proprietrio, no h essa garantia.

Servidores Administrao Marketing

Financeiro

Exemplo de um sistema Cliente-Servidor

Formatos de Arquivo No Proprietrios


Preocupao com a capacidade de leitura futura faz com que vrios gerentes de registros hesitem em implementar um sistema GED. Com as rpidas mudanas na indstria de computadores, difcil prever o que acontecer com os computadores em dez ou vinte anos. Entretanto, a necessidade de recuperao rpida

26

Perguntas Mais Frequentes


Geral
P: O que um documento? R. Um documento pode ter de uma a vrias pginas, e pode incluir imagens e/ou texto, alm de anotaes, e fichas (carto de ndice) P: O que ICR (Reconhecimento Inteligente de Caracter)? R: ICR o reconhecimento de um texto escrito a mo e tambm conhecido como reconhecimento de escrita a mo. Textos escritos a mo so mais difceis para o computador reconhecer e os resultados possuem uma taxa de erros maior do que os textos impressos. Reconhecimento de ICR geralmente atua melhor em texto confinado, o que significa letras impressas em blocos com uma letra em cada caixa. Um reconhecimento preciso de uma escrita a mo requer que a ferramenta de ICR seja treinada para reconhecer o estilo de escrita de cada usurio.

P: Eu posso editar ou alterar imagens? R: Um sistema de imagens no deve prover nenhuma ferramenta para edio ou alterao de imagens. Isso importante pois muitos usurios consideram que imagens no devem ser tocadas e que qualquer alterao ir indeterminar a integridade do sistema. Alm do mais, o sistema deve prover uma auditoria para manter registros de quais usurios acessaram quais documentos e quando.

P: O que OMR (Reconhecimento de Marca ptica)? R: OMR, tambm chamado de Reconhecimento sensvel a marcas, o reconhecimento de marcas comumente usados em formulrios, como mltipla escolha, crculos, e bolhas. OMR pode ser uma parte importante do sistema para organizaes que processam muitos formulrios padro. Pesquisa de consumidor um exemplo do OMR em ao.

P: Sistemas de imagem suportam auditoria? R: A auditoria de um sistema de imagem deve gravar o nome de um usurio, data, hora, nome do documento e a ao quando o usurio acessar o banco de dados ou documento. Vrios nveis de detalhes de registros de auditoria e acompanhamento de atividades devem estar disponveis. O sistema deve ter capacidade de selecionar esses registros por classificao e filtragem.

P: Qual o formato padro usado para armazenar imagens? R: Imagens em preto e branco so mais comumente armazenadas em arquivos padro TIFF usando CCITT compresso grupo 4 (duas dimenses). Escala em cinza e imagens colori27

das so frequentemente armazenadas em arquivos TIFF com compresso JPEG. P: Quais os tipos de sistemas operacionais so normalmente suportados? R: A maioria dos sistemas GED possuem aplicaes cliente que podem rodar aplicaes em Windows 95, 98 e Windows NT. Sistemas de Internet/Intranet podem rodar em plataformas adicionais, como Macintosh, Unix, dentre outras. P: Quanto espao em disco um sistema GED tipicamente requer? R: O software no cliente normalmente requer cerca de 20MB de espao livre em disco para instalar. O Software no servidor requer apenas cerca de 5MB de espao livre em disco no servidor, e 15MB para o banco de dados. Espao adicional pode ser neessrio para o banco de dados real. P: E se o meu banco de dados for muito grande para caber em um volume de dados? R: Um sistema GED ir permitir que dados e imagens sejam armazenados atravs de mltiplos volumes com cada volume residindo em um diretrio diferente ou em um drive, disk array, CD ou MO diferente. P: Quanto de RAM um sistema GED necessita? R: O software no cliente geralmente requer de 16 a 20MB de RAM para rodar, com requerimentos maiores para escanerizao e OCR. A maioria dos sistemas recomenda ter 64MB ou mais.

P: H necessidade de placa grfica ou monitor especial? R: A maioria dos sistemas trabalha com qualquer placa grfica compatvel com Windows e monitor VGA (ou melhor), e recomendvel que se use um monitor de pelo menos 15 com resoluo de 800 x 600 dpi pelo menos.

Escanerizao/ Importao/ Armazenamento


P: Quais os fabricantes de scanners para GED? R: Alguns dos top fornecedores de scanner incluem Ricoh, Fujitsu, Panasonic, Bell & Howell, Canon, Hewlett Packard e Avision. Scanners para sistemas de GED possuem alimentadores de alta velocidade para escanerizar grandes quantidades de documentos. P: Quais so as interfaces de hardwares e softwares para scanners mais comuns? R: Driver ISIS para scanner da Pixel Translations e Kofax Image Controls (http://www.kofax.com) so as interfaces de scanner mais comuns. Muitos scanners conectados a uma placa Adaptec SCSI ou placa Kofax de processamento de imagem TWAIN no geralmente uma boa interface de scanner para alta velocidade e alto volume de escaneamento. Enquanto que a maioria dos scanners incluem o driver TWAIN, cada driver escrito por uma companhia diferente e trabalha um pouco distinta. Se um scanner suporta uma interface TWAIN apenas, ele provavelmente desenhado para um baixo volume de escaneamento e editorao, no para GED.
28

P: Como eu posso escanerizar cheques? R: Vrias empresas, incluindo Visionshape, fabricam escaners especialmente desenhados para cheques que lem o nmero MICR codificado magneticamente na parte de baixo do cheque. Se voce no tem um desses scanners, a maioria dos cheques pode ser escanerizado com um scanner regular para GED e pela funo OCR normalmente, apesar de que os nmeros MICR no sero lidos.

P: E arquivos coloridos ou fotografias? R: Sistemas GED devem suportar imagens em preto e branco, cinza e colorida. Arquivos coloridos podem ser escanerizados com um scanner colorido, importados ou convertidos para o sistema GED. Fotografias tendem a escanear melhor em escala cinza, uma tcnica de cpia com pixel decimation que ocorre quando a imagem mostrada em uma tela com baixa resoluo. As bordas dos caracteres podem se tornar irregulares com pontos insuficientes. A escala cinza simplesmente preenche esses pontos marginais com cinza para melhorar a imagem, fazendo com que apaream fceis de ler. Sendo que apenas uma melhoria na visualizao, no h melhoria no OCR ou na qualidade de impresso. P: Como eu posso escanerizar documentos de dois lados? R: Um sistema GED deve prover dois modos diferentes de se fazer isso. Ele deve suportar scanner duplex, que simultaneamente escaneriza ambos os lados da pgina. Com um scanner simplex, o usurio deve poder escanerizar todas as pginas da frente, virar os documentos e escanerizar o verso da pgina, e o sistema deve automaticamente colocar as pginas na ordem correta. P: Posso escanerizar pginas landscape e portrait juntas em um lote apenas? R: A maioria dos sistemas permite que voc troque a orientao das pginas medida que voc escaneriza ou aps a escanerizao. Muitos sistemas tambm incluem a opo de checar automaticamente e corrigir a orientao das pginas.
29

P: Como eu posso escanerizar documentos de formato grande? R: Vrios fornecedores, incluindo Contex, Oc and Calcomp, fabricam scanners especificamente projetados para documentos de formato grande, at tamanho E(34"x 44")e A-0 (33"x 46.8"). Se voc no tem um desses, o documento pode ser reduzido em tamanho atravs de uma copiadora e depois escanerizado com um escaner normal, ou enviando para um bureau de servios que tenha scanner para formato grande.

P: Qual resoluo de imagem eu devo usar? R: A maioria dos sistemas GED podem suportar documentos escanerizados em vrias resolues, de 50 a 600 dpi (ou mais), dependendo do seu scanner. Dependendo do propsito e do tamanho da pgina, a maioria dos documentos so escanerizados em preto e branco com 200, 240 ou 300 dpi.

P: Como imagens enviesadas so tratadas? R: Imagens enviesadas (curvas ou inclinadas) podem afetar a preciso do processo OCR, de forma que sistemas GED incluem software que reconhecem imagens enviesadas e as compensam. Isso particularmente importante quando escanerizando cortes pressionados em um scanner flat bed ou quando escanerizando documentos atravs de um ADF (alimentador de documento automtico) usado ou projetado probremente. P: Quais formatos de arquivos a maioria dos sistemas importa? R: A maioria dos sistemas pode importar texto ASCII em 20 ou mais formatos grficos, incluindo TIFF 4, TIFF 3, TIFF Raw, TIFF LZW, PCX, BMP, CALS, JPEG, GIF, PICT, PNG e EPS visualizao de imagem. A maioria dos sistemas converte arquivos grficos em preto e branco para o formato Grupo 4 TIFF durante a importao, e imagens cinzas/coloridas para TIFF JPEG.

gerado pelo OCR. Aps a compresso, uma imagem tpica requer 50KB, apesar de poder variar de 16KB a 150KB, dependendo do tamanho do papel, resoluo e complexidade da pgina. Um texto OCRizado tipicamente requer 2KB de espao por pgina.

P: E se o meu banco de dados for muito grande para caber em uma localidade? R: Vrios sistemas GED permitem que imagens sejam armazenadas atravs de mltiplos volumes com cada volume residindo em um diretrio diferente ou em um drive, disk array, CD ou MO diferente.

P: Qual a diferena entre CD ou jukeboxes/changer de DVD e torres? R: Em um jukebox/changer, existe mais slots e discos do que drivers. Mecanismos de robs automaticamente colocam o disco correto em um dos drivers quando o disco necessitado. Em uma torre, vrios drivers de CDs ou DVDs esto empilhados juntos em uma nica unidade, e cada disco est sempre em um drive. Torres provm um rpido acesso ao dado, mas custam muito mais por disco e no carregam muitos discos. Jukeboxes/changers custam menos por disco e podem carregar at 500 discos, mas so mais lentos devido ao consumo de tempo na troca de discos nos drivers.

P: Quanto espao de armazenamento eu necessito? R: Documentos escanerizados tipicamente requerem cerca de um gigabyte para cada 17.000 pginas, assumindo papel tamanho carta, resoluo 300 dpi, e escanerizao em preto e branco. Isso inclui o espao para o texto

30

Visualizao /Impresso / Exportao


P: Posso ver combinaes de imagens, textos e campos de indexao lado a lado? R A maioria dos sistemas GED permite que a tela de visualizao seja configurada para mostrar qualquer uma das duas a qualquer hora: texto, imagens, campos de indexao, imagens pequenas ou dicumentos com vrias pginas ou nada. O tipo de fonte e o tamanho do texto pode ser alterado para servir necessidades individuais.

P: Eu vou precisar de um monitar especial para visualizao de imagens? R: No, a maioria dos sistemas roda perfeitamente bem em monitores padro VGA e melhores. Um display de 15usando uma controladora Super VGA pode ser considerado o mnimo display prtico para um usurio adhoc do sistema. Usurios frequentes devem usar um monitor de 17, e usurios cujo trabalho escanerizar e rever documentos com imagens o tempo todo podem considerar um monotor de 19ou 21. P: Qual a vantagem de um monitor grande para usurios com poder? R: Para pessoas que usam um sistem GED intensivamente, o tamanho da tela pode ser um fator crtico. Se os usurios quiserem mover entre as pginas com a facilidade do papel, eles tem que ser capazes de ver a pgina inteira de uma vez de tal modo que o texto seja visvel. Se uma pgina de 8 x11 o tamanho dominante de papel, ento um monitor se 21capa de mostrar 1600 x 1200 ser timo. Usando um monitor padro VGA de 14 ir necessitar movimentar pelo documento para visualizar a imagem toda no seu tamanho normal.

P: Posso abrir e visualizar mais de um documento ao mesmo tempo? R: A maioria dos sistemas GED permite a visualizao de vrios documentos , sendo a memria disponvel a nica limitao para o nmero de documentos abertos ao mesmo tempo. P: Como posso fazer uma nova sequncia de pginas? R: Se as pginas esto fora de ordem e necessitam ser re-sequenciadas, a maioria dos sistemas permite vistas das pginas de um tamanho peuqeno (Thumbnails) para serem simplesmente arrastadas pra a posio requerida. Da mesma forma, pginas individuais podem ser selecionadas e apagadas, suheitas ao controle de acesso de seguranca apropriados e privilgios.

31

P: O que importante alm do tamanho do monitor? R: A resoluo da tela e a velocidade de varredura do monitor tambm so importantes. Geralmente, quanto maior o tamanho do monitor e maior sua resoluo, mais difcil ser obter a maior velocidade de varredura que requerida para sustentar a visualizao sem que a tela cintile. O melhor ponto inicial para a menor cintilao de tela geralmente considerada a taxa de varredura horizontal de 72MHz em um monitor de 21. A taxa de varredura mxima uma funo do monitor e da controladora grfica.

OCR: Reconhecimento de Caracter ptico


P: O que OCR? R: OCR significa Reconhecimento de Caracter ptico, como um computador que converte palavras de uma imagem escanerizada sem capacidade de busca em um texto com capacidades de busca. OCR normalmente necessrio para se usar indexao de texto e buscas, e deve estar includo em um sistema GED. Ferramentas OCR podem geralmente reconhecer textos digitados ou impressos, no escritos mo..

P: Eu vou precisar de uma impressora especial para imagens ou texto que utilizaram o OCR? R: Geralmente no. A maioria dos sistemas GED suporta a maioria das impressoras compatveis com Windows, mas se recomenda que utilize uma impressaora laser com no mnima 4MB de memria RAM. Se voce et usando um sistema instalado na rede e imprimindo um alto volume de pginas em uma impressora de rede, voce pode considerar instalar uma impressora laser localmente ou no seu prprio segmento de rede para minimizar o trfego da rede durante impresses pesadas de vrias pginas

P: O quanto o OCR preciso? R: A preciso em uma pgina recm impressa a laser tipicamente melhor que 99.6%. A preciso em documentos enviados por fax, sujos ou degradados ser naturalmente menor, mas a maioria dos sistemas GED possuem tecnologia de limpeza de imagem que pode melhorar a preciso do OCR.

P: Eu terei que corrigir os erros de OCR? R: No se o sistema GED suportar lgica fuzzy, que encontrar palavras mesmo se a ferramenta OCR tiver feito alguns enganos.

P: Em quais formatos posso exportar documentos? R: A maioria dos sistemas GED pode exportar imagens para vrios formatos grficos incluindo TIFF 3,TIFF 4,TIFF Raw,BMP,GIF,CALS e JPEG,e C.
32

P: Qual a velocidade do processo de OCR? R: A performance do OCR e processos de indexao totalmente dependente de fatores tais como a velocidade e configurao do sistema e do contedo da imagem. Um Pentium 133MHz geralmente necessita aproximadamente de 6 segundos por pgina, enquanto que um Pentium II 450MHz levar cerca de 2 a 3 segundos por pgina.

COLD: Computer Output to Laser Disc


P: Qual a diferena entre COLD e GED? R: GED realiza a escanerizao, compresso, armazenamento, indexao, funes de OCR, busca e recuperao de milhes de pginas de documentos em papel ou documentos eletrnicos armazenados como imagens permanentes. COLD realiza armazenamento, indexao, busca e impresso de relatrios de enormes arquivos de texto gerados por mainframes, mini-computadores e aplicaes de sistemas antigos em grande volumes de impresso. COLD armazena arquivos de texto enormes e extrai chaves de indexao em disco rgidos, cartuchos pticos ou CD-ROM ao invs de imprimir toda a informao em papel ou armazen-la em microfilme. P: Quantos campos de indexao pode um servidor COLD extrair de cada relatrio? R: O nmero de campos de indexao normalmente ilimitado. Entretanto, o maior nmero de campos extrados de cada relatrio, mais lento o processo de extrao ir rodar e maiores sero os arquivos de indexao.

P: Qual a diferena entre OCR e indexao? R: OCR processo de converso de imagens escanerizadas para texto, e indexao o processo de fazer o arquivo texto resultante fcil e rpido de ser pesquisado..

P: Um texto que utilizou OCR pode ser exportado e reutilizado em um processador de palavras? R: Sim, voc pode copiar textos entre o sistema GED e uma aplicao Windows, ou voc pode exportar arquivos de textos inteiros (todas as pginas de um documento) para um diretrio e abr-lo com seu processador de textos favorito.

P: Posso corrigir manualmente erros de OCR? R: A maioria dos sistemas permite que os usurios corrijam os erros de OCR dentro do sistema. Entretanto, com capacidades de busca da lgica fuzzy, isso normalmente desnecessrio.

33

Glossrio de Termos
ADF
Alimentador automtico de documento. Esse o meio pelo qual um scanner alimenta um documento de papel.

Arquitetura Cliente-Servidor vs Compartilhamento de Arquivos


Duas arquiteturas comuns de aplicaes de software encontradas em rede de computadores. No compartilhamento de arquivos, todas as buscas ocorrem na estao de trabalho, enquanto que o banco de dados de documentos reside no servidor. Na arquitetura cliente-servidor, processos intensivos de CPU (tais como buscas e indexao) so realizados no servidor, enquanto que a visualizao da imagem e o OCR ocorrem no cliente. Aplicaes de compartilhamento de arquivos so fceis de desenvolver, mas tendem a gerar um tremendo trfego de dados na rede. Alm disso, h a exposio do banco de dados corrupo devido s interrupes nas estaes de trabalho. Aplicaes cliente-servidor so mais difceis de desenvolver, mas reduzem dramaticamente o trfego de dados na rede e isolam o banco de dados de interrupes nas estaes de trabalho.

Anotaes
So as mudanas ou adies realizadas em um documento utilizando notas adesivas, um marcador, ou outra ferramenta eletrnica. Imagens ou textos em um documento podem ser marcadas em cores diferentes, carimbadas (por exemplo CONFIDENCIALou FAX), ou ter notas adesivas eletrnicas anexadas. Anotaes devem ser sobrepostas e no alteram o documento original.

Exemplos de carimbos, anotaes e highlight

ASCII - American Standard Computer Information Interchange


Usado para definir o texto para computador que foi criado como um conjunto de 255 caracteres. ASCII tem sido usado como um padro, um formato de texto no-proprietrio desde 1983.

Armazenamento ptico Magntico


Um drive que combina tecnologia laser e magntica para criar armazenamento apagvel de alta capacidade.

34

Bitmap/Bitmapped
Veja Raster/Rasterized

CD-R
Abreviao para CD Regravvel. Significa um CD que pode ser escrito (ou gravado) apenas uma vez. Pode ser copiado para distribuio de um grande volume de dados. CD-Rs podem ser lidos em qualquer driver de CD, em um computador isolado ou em uma rede. Isso torna o intercmbio entre os sistemas mais fcil.

BMP
Um formato nativo do Windows para armazenar imagens chamadas bitmaps.

Browser de Pastas
Um sistema usado para organizar documentos (geralmente hierrquico or empilhado). Por exemplo, o programa de Gerenciamento de Arquivos no Microsoft Windows um tipo de Browser de Pastas que mostra os diretrios no seu disco.

CD-ROM
Compact Disc Read Only Memory. Gravado em grande escala e no em um gravador de CD (CD writer), uma mdia de armazenamento em disco ptico popular para armazer arquivos de computador, assim como gravao de msicas digitais.

Caching (de Imagens)


Armazenamento temporrio de arquivos de imagem em um disco rgido para uma posterior transferncia para um armazenamento permanente, como um ptico ou jukebox de CD.

Cdigo de Barras
Um modelo de linhas verticais que lido por um laser ou um scanner ptico, e que corresponde a um registro em um banco de dados. Como um componente adicional de um sistema GED, essa caracterstica foi desenhada para aumentar a velocidade na qual um documento pode ser armazenado.

Campo Chave
Campos de banco de dados usados para busca e recuperao de documentos. Sinnimo para campo de indexao.

COLD Campos de Indexao


Campos de banco de dados usados para categorizar e organizar documentos. Frequentemente definidos pelo usurio, esses campos podem ser usados para buscas. Computer Output to Laser Disk. Processo de programao que gera registros eletrnicos e relatrios impressos em em disco laser ao invs de uma impressora. Pode ser usado no lugar do COM (Computer Output to Microfilm) ou impresso de relatrios em formulrios contnuos.

35

COM
Computer Output to Microfilm. Um processo que gera registros eletrnicos e relatrios de computador em microfilmes.

Discos pticos
Mdia de computador similar ao disco compacto que no pode ser escrito. Um disco ptico usa laser para ler o dado armazenado.

CPU
Central Processing Unit (Unidade de Processamento Central). o crebro do computador..

Dithering
O processo de converso da cor cinza em duas densidades de pontos preto, geralmente com o propsito de impresso ou armazenamento de imagens coloridas ou acinzentadas em imagens branco e preto.

De-shading
Remoo de reas de sombras para reconhecimento da imagem mais fcil pelo OCR. Um software de-shading tipicamente procura por reas com um padro regular ou pequenos pontos.

Drag-and-Drop
O movimento de objetos na tela do computador (monitor) quando arrastados com o mouse.

Drive de CD-ROM De-skewing


O processo de endireitar imagens enviesadas (descentralizadas). De-skewing uma das melhorias de imagem que pode aumentar a preciso do OCR. Documentos muitas vezes ficam enviesadas quando enviados por fax ou escanerizados. O movimento de objetos na tela do computador Um drive de computador que l discos compactos.

Drive ptico Apagvel


Um tipo de drive ptico que usa discos pticos apagveis.

De-speckling
Remoo de salpicos isolados de um arquivo de imagem. Geralmente ocorre quando um documento enviado por fax ou escanerizado.

36

Drivers de Scanner ISIS e TWAIN


Digital Video Disc or Digital Versatile Disc. Um Aplicaes especializadas usadas para comunicao entre escaners e computadores. Drivers TWAIN foram desenvolvidos para edio de fotos e publicao. Eles tratam imagens em cores e em escala em cinza muito bem, mas no suportam escanerizao em alta velocidade. Drivers ISIS foram desenvolvidos para escanerizao de imagens em alta velocidade. Foram desenhados para rpida escanerizao de imagens em preto e branco atravs do ADF. Nos ltimos anos, a diferena entre eles tem diminudo e drivers ISIS agora incluem suporte a cores e em escala em cinza, enquanto drivers TWAIN agora suportam ADF.

nando a visualizao mais fcil. Uma visualizao em escala de cinza utiliza sombreamento em cinza para preencher os vazios ou furos que ocorrem quando a imagem visualizada em uma tela de computador. Tambm conhecido como escala acinzentada.

Escalabilidade
Capacidade de expanso de um sistema sem requerer maiores reconfiguraes ou reentrada de dados. Mltiplos servidores ou armazenamento podem ser adicionados facilmente.

Fichas
Conjunto de campos de ndices para documentos.

Formato ISO 9660 CD DVD


Digital Video Disc or Digital Versatile Disc. Um disco de plstico, como um CD, aonde o dado pode ser escrito e lido. DVDs so mais rpidos, podem armazenar mais informaes e suportam mais formatos que os CDs. O Formato da Organizao de Padres Internacionais para criao de CD-ROMs que podem ser lidos no mundo todo.

GED (Gerenciamento Eletrnico de Documentos)


Software usado para armazenar, gerenciar, recuperar e distribuir documentos rapidamente e facilmente no computador.

EDM Eletronic Document Management


Software de Imagem que gerencia documentos eletrnicos

Escala de cinza
Uma opo para visualizar um imagem em preto e branco de um modo aperfeioado, tor-

Gerenciamento Hierrquico de Armazenamento


Um software que transfere automaticamente arquivos on-line para mdia de armazenamento near-line, geralmente com base na frequncia de uso dos arquivos.
37

GIF
Padro CompuServer para arquivos de imagem.

Interface de Video Scanner


Um tipo de dispositivo usado para conectar scanners com computadores. Scanners com essa interface requerem uma placa de controlde desenhada pela Kofax, Xionics ou Dunord.

Gigabyte
Um bilho de bytes. Tambm expresso como mil megabytes. Em termos de capacidade de arquivamento de imagem, um gigabyte equivale aproximadamente a 17.000 pginas no formato de 81/2x11 escanerizadas a 300 dpi, armazenadas como imagens TIFF Grupo IV.

IPX/SPX
Protocolo de comunicao usado pela rede Novell.

JPEG
Um formato de compresso de imagem usado para armazenar fotografias coloridas e imagens.

Gravao (CDs ou DVDs)


Gravao ou escrita de dados em um CD ou DVD.

Jukebox
Um dispositivo de armazenamento de discos pticos e os carrega em um drive.

Habilitador de Imagem
Uma funo do software que cria conexes entre aplicaes existentes e imagens armazenadas.

Jukebox ptico
Veja Jukebox.

ICR
Reconhecimento Inteligente de Caracteres. Um processo que reconhece textos escritos a mo e impressos como caracteres alfanumricos.

Lgica Booleana
O uso dos termos E, OU e NO durante buscas de palavras ou textos. Usado para ampliar ou restringer o escopo da busca.

Lgica Fuzzy Interface de Scanner SCSI


O dispositivo usado para conectar um scanner a um computador. Um procedimento de procura para uma palavra exata ou similar ao critrio de busca, compensando erros de escrita e interpretao da funo OCR.

38

MAPI
Mail Application Program Interface. Esse software padro de Windows tornou-se uma interface de e-mail popular e usado pelo MS Exchange, GroupWise e outros pacotes de email.

Off-Line
Arquivo de documentos armazenados em discos pticos ou discos compactos que no esto conectados ou instalados no computador, e requerem interveno humana para serem acessados.

Mdulo Carregvel NetWare (NLM)


Aplicao que roda como parte de um sistema operacional de rede (NOS network operating system) de um servidor Novell Netware.

On-Line
Documentos armazenados em um disco rgido ou disco magntico em um computador e que esto disponveis imediatamente.

Pastas Transitrias Mudana de Fase


Mtodo de armazenamento de informao em discos pticos regravveis. Um mtodo para simplificar o transporte de um grupo de documentos de um computador para outro.

Near-Line
Documentos armazenados em discos pticos ou discos compactos que se encontram o jukebox ou no trocador de CD, e podem ser recuperados sem interveno humana.

Pixel
Um nico ponto em uma imagem fotogrfica. Pode ser preto e branco, cinza ou colorido.

Placa de Processamento de Imagem (IPC)


Uma placa localizada no computador, scanner ou impressora que facilita a aquisio e visualizao de imagens. A funo primria da maioria dos IPCs a rpida compresso de descompresso de arquivos de imagem.

NT
Network Technology. Se refere ao servidor Microsoft Windows NT e software de estao de trabalho.

OCR
Optical Character Recognition. Um processo de software que reconhece textos impressos como caracteres alfanumricos.

39

Processador de Formulrios
Uma aplicao de imagem especializada em formulrios pr-impressos. Sistemas de processamento de formulrios geralmente usam ferramentas OCR de ponta (ou vrias) e elaboram rotinas de validao de dados para extrao de formulrios escritos a mo ou com qualidade muito ruim. Esse tipo de aplicao de imagem possui vrios desafios, sendo que muitos documentos escanerizados no foram desenhados para sistemas GED ou OCR.

Publicao na Internet
Software de imagem especializado que permite que um grande volume de documentos em papel seja publicado na Internet ou Intranet. Esses arquivos podem ser disponibilizados para outros departamentos, colegas de outras localidades ou pblico geral para busca, visualizao ou impresso.

RAID
Redundant Array of Independent Disks.Uma coleo de discos rgidos que atua como uma unidade nica. Arquivos em drives RAID podem ser duplicados (espelhados) para preservar os dados. Sistemas RAID podem variar em nveis de redundncia, sendo: sem redundncia - nvel nico, disco sem-espelhamento - nivel 0, dois discos que se espelham um no outro - nivel 1, at o nvel 5, o mais comum.

Processamento em lote
O nome da tcnica usada para a entrada de uma enorme quantidade de informao de uma nica vez, processo oposto entrada individual de dados.

Procura e indexao de textos


Possibilita a recuperao de documentos atravs de uma palavra ou frase. Todas as palavras no documento so indexados em uma lista mestre de palavras com apontadores para os documentos e pginas onde cada ocorrncia da palavra ou frase aparecem.

Raster/Rasterized
Um mtodo de representao de imagem com uma grade (ou mapa) de pontos ou pixels. Formatos tpicos de arquivos raster so GIF, JPEG, TIFF, PCX, BMP, etc ..

Publicao em CD
Uma alternativa para copiar um grande volume de documentos em papel. Esse mtodo envolve acoplar imagens e textos de um documento em um software de visualizao em CDs. Algumas vezes softwares de busca so includos nos CDs para melhorar as capacidades de busca.

Regio (de uma imagem)


Uma rea de um arquivo de imagem que selecionado para um processamento especfico. Tambm chamado de zona.

40

Scanner
Um dispositivo de entrada normalmente usado para converter documentos em papel em imagens de computador. Scanner tambm pode escanerizar microfilmes e microfichas.

Taxa de Compresso
a relao entre o tamanho de um arquivo comprimido e o de um no comprimido. Por exemplo, uma taxa de compresso de 20:1 significa que um arquivo de 1MB no comprimido tem o tamanho de 50KB quando comprimido.

Scanners Duplex v. Scanner Double-Sided


Scanner duplex automaticamente escanerizam ambos os lados de uma pgina de dois lados simultaneamente, produzindo duas imagens de uma vez. Scanner Double-Sided utilizam um nico scanner para escanerizar pginas de dois lados, escanerizando uma pilha ordenada de papis, depois virando e escanerizando o outro lado.

TCP/IP
Protocolo de comunicao de redes. Esse o protocolo usado pela Internet.

Thumbnails
Verso pequena de uma imagem usada para uma vista geral rpida ou ter-se uma idia do que a imagem aparenta.

Scanner Flatbed
Scanner com superfcie plana que permite escanerizar livros e outros documentos.

TIFF
Tagged Image File Format. Um formato grfico raster de imagem no-proprietrio que possue vrios formatos de compresso. TIFF tem sido usado desde 1981.

SCSI - Small Computer Systems Interface.


Um padro para conectar perifricos a computadores. Um SCSI permite que at 7 dispositivos sejam conectados por cabos. O atual padro SCSI o SCSI II, tambm conhecido como SCSI rpido..

TIFF Grupo III (compresso)


Um formato de compresso unidimenional de armazenamento de imagens em branco e preto que utilizado pela maioria de mquinas de fax.

TIFF Grupo IV (compresso) SQL


Structured Query Language. Um padro popular para rodar buscas em banco de dados (queries) e relatrios.
41

Um formato de compresso bidimensional de armazenamento de imagens em branco e preto. Tipicamente compressa em uma taxa de 20-1 para documentos padro.

Volumes Portteis
Uma caracterstica que facilita a movimentao de um grande volume de documentos sem a necessidade de copiar mltiplos arquivos. Volumes portteis permitem que CDs individuais sejam facilmente reagrupados, destacados e reatados a diferentes bancos de dados para uma maior troca de informaes.

ZIP
Um formato padro de compresso de arquivos que permite rpido e fcil armazenamento para transporte.

Zona OCR
Uma caracterstica adicional de um sistema GED que preenche ficha de documentos atravs da leitura de certas regies ou zonas de um documento, e depois coloca o texto no campo de indexao do documento.

Workflow, Ad Hoc
Um processo manual simples atravs do qual documentos podem ser transportados em um sistema GED de multi-usurios baseado nas necessidades reais.

Workflow, Baseado em regras


Uma srie programada de passos automatizados que direcionam documentos para vrios usurios em um sistema GED

WORM Disks
Write Once Read Many Disks. Uma mdia popular dos anos 80 para armazenamento de arquivos. Reconhecido como o primeiro disco ptico, usado para armazenar arquivos de dados que no podem ser alterados. Discos WORM so criados por PCs isolados e no podem ser usados em rede, como os CD-Rs.

42

Sobre o Autor
LaserFiche desenvolveu esse guia para prover uma idia geral sobre sistemas de Gerenciamento Eletrnico de Documentos (GED). Ns identificamos a necessidade de um recurso que fosse certo para pessoas que esto aprendendo sobre sistemas de imagem, aqueles que esto se preparando para comprar um sistema, e para todas as pessoas que estiverem interessadas nesta tecnologia. Desde 1987 LaserFiche tem sido pioneira em sistemas de armazenamento e recuperao de um alto volume de documentos. O sistema GED da LaserFiche tem ajudado a gerenciar documentos em mais de 15,000 escolas, escritrios de advocacia, empresas de seguro e outros tipos de negcios ao redor do mundo, incluindo milhares de municpios, estados e agncias federais. O principal recurso da LaserFiche o grupo de profissionais excepcionalmente competentes e experientes, com um vasto conhecimento tanto terico como prtico dos aspectos da automao de escritrio. Nossos analistas e programadores j possuiam experincia prvia na indstria e nos negcios nas reas de desenvolvimento de programas, consultoria e solues customizadas. Para cada projeto, LaserFiche empenha-se para oferecer: Objetividade, competncia e imparcialidade Experincia, atravs da anlise e solues similares de problemas para outras organizaes. Entendimento, das complexidade e relacionamento entre seres humanos.
43

Tempo, para concentrar sem interrupo at obter a soluo de um problema. A experincia de trabahlo diretamente com profissionais de gerenciamento de arquivos ensinou muito a LaserFiche sobre o que funciona, o que funciona melhor, e o que funciona melhor ainda. Diferentemente de empresas que possuem conhecimento apenas na tecnologia, LaserFiche combina o seu conhecimento em sistemas com a capacidade da tecnologia para criar um ambiente de trabalho melhor. LaserFiche uma diviso da CompuLink Management Center,Inc. Compulink certificada em WBE e MBE, e possue uma histria de sucesso em assistir organizaes a estabelecer sistemas de gerenciamento eletrnico de documentos. LaserFiche agradece a oportunidade de responder em detalhes qualquer questes sobre GED e de demonstrar o sistema LaserFiche.

LaserFiche Document Imaging


3545 Long Beach Blvd. Long Beach, CA 90807 USA.

(310) 793-1888 (800) 985-8533 (310) 793-8531 fax www.laserfiche.com

Notas

Você também pode gostar