Você está na página 1de 106

INFORMAES

LEGAIS

Copyright 2002 ScanSoft, Inc. Todos os direitos reservados. O software descrito neste livro fornecido sob licena e pode ser usado ou copiado somente de acordo com os termos desta licena. INFORMAO
IMPORTANTE

A ScanSoft, Inc. fornece esta publicao assim "como est", sem garantias de nenhum tipo, explcitas ou implcitas, incluindo, dentre outras, garantias implcitas de capacidade de comercializao ou de adequao a um determinado propsito. Alguns estados ou jurisdies no permitem iseno de responsabilidade de garantias implcitas ou explcitas em certas transaes, neste caso, esta declarao pode no se aplicar a voc. A ScanSoft reserva-se o direito de revisar e fazer alteraes no contedo desta publicao, de tempos em tempos, sem haver obrigao de sua parte de avisar qualquer pessoa sobre tal reviso ou alteraes. MARCAS
REGISTRADAS E CRDITOS

ScanSoft, OmniPage, OmniPage SE, OmniPage Pro, PaperPort, Pagis, True Page e DirectOCR so marcas registradas ou marcas comerciais da ScanSoft, Inc., nos Estados Unidos e/ou em outros pases. Todos os demais nomes de empresas ou nomes de produtos referidos no presente documento podem ser marcas comerciais de seus respectivos proprietrios.

ScanSoft, Inc.
9 Centennial Drive Peabody, MA 01960 EUA

ScanSoft Blgica BVBA


Guldensporenpark 32 BE-9820 Merelbeke Blgica

Nmero do referencia 58-281201-08A

U M R I O

BEM-VINDO
Como usar este manual Obteno de Ajuda on-line Ajuda HTML on-line Ajuda sensvel ao contexto Notas tcnicas Glossrio OmniPage SE

7
8 9 9 9 10 10 10

INSTALAO E CONFIGURAO
Requisitos do sistema Instalao do OmniPage SE Configurao do scanner com OmniPage SE Como iniciar o programa Registro do software Novos recursos no OmniPage Pro 12 OmniPage SE e OmniPage Pro 12

11
12 13 14 16 17 17 19

INTRODUO
O que reconhecimento ptico de caracteres Recursos de OCR do OmniPage SE Documentos no OmniPage SE Etapas bsicas de processamento O ambiente do OmniPage A barra de menus

21
22 22 23 23 24 25

OmniPage SE Manual do usurio

iii

As Barras de ferramentas O Painel de imagem O Editor de texto A caixa de ferramentas do OmniPage Gerenciamento de documentos Miniaturas Gerenciador de documentos Personalizar colunas do Gerenciador de documentos Excluso de pginas de um documento Impresso de um documento Fechar um documento Documentos do OmniPage Por que salvar em OPD Como salvar como OPD Configuraes

25 26 26 27 28 28 29 30 30 31 31 31 32 32 33

PROCESSAMENTO DE DOCUMENTOS
Guia de incio rpido Carregamento e reconhecimento de amostras de arquivos de imagem Digitalizao e reconhecimento de uma nica pgina Viso geral do processamento Processamento automtico Interromper e reiniciar o processamento automtico Processamento manual Processamento combinado Processamento com o Assistente de OCR Processamento a partir de outros aplicativos Como configurar o Direct OCR

35
36 36 36 38 40 41 42 43 45 46 46

iv

Sumrio

Como usar o Direct OCR Como usar o OmniPage SE com o PaperPort Processamento de documentos com Programar OCR Definio da origem das imagens de pgina Entrada de arquivos de imagem Entrada do scanner Digitalizao com um ADF Digitalizao sem um ADF Descrio do layout de documento Zonas e planos de fundo Zoneamento automtico Zoneamento manual Tipos de zona e propriedades Trabalho com zonas Grades de tabela na imagem Uso de gabaritos de zonas

47 48 49 50 50 51 52 53 53 54 55 56 57 59 61 63

CORREO E EDIO
Exibio e visualizaes do editor Correo de resultados de OCR Verificao de texto Dicionrios do usurio Treinamento Treinamento manual IntelliTrain Arquivos de treinamento Edio de texto e de imagem Edio em tempo real Leitura de texto em voz alta

65
66 67 68 70 71 72 72 73 75 77 78

OmniPage SE Manual do usurio

GRAVAO E EXPORTAO
Gravao de imagens originais Gravao dos resultados de reconhecimento Selecionar um nvel de formatao Selecionar opes avanadas de salvamento Salvar como PDF Copiar pginas para a rea de transferncia Enviar pginas via correio

81
82 83 85 86 88 88 89

Salvar um documento enquanto voc trabalha 84

INFORMAES TCNICAS
Soluo de problemas Solues para tentar primeiro Teste do OmniPage SE Aumentar recursos de memria Aumentar espao em disco O texto no reconhecido corretamente Problemas com reconhecimento de fax Problemas de desempenho ou de sistema durante o OCR Suporte a ODMA Recursos avanados em Programar OCR Tipos de arquivo compatveis Tipos de arquivo para abrir e salvar imagens Tipos de arquivo para salvar resultados de reconhecimento Desinstalao do software

91
92 92 93 94 94 95 96 96 97 97 98 98 99 100

vi

Sumrio

Bem-vindo
Seja bem-vindo ao OmniPage SE e obrigado por usar nosso software! A documentao a seguir fornecida para ajud-lo a se familiarizar com o programa e dar-lhe uma viso geral do mesmo. Este manual do usurio Este manual lhe ensina como utilizar o OmniPage SE (Special Edition). Ele inclui instrues de instalao e configurao, uma descrio dos comandos e reas de trabalho do programa, instrues orientadas por tarefas, formas de personalizar e controlar o processamento e informaes tcnicas. Este manual apresentado em formato PDF, permitindo que voc use hyperlinks em referncias cruzadas e outras ferramentas de navegao em seu visualizador PDF. Ajuda on-line A ajuda on-line do OmniPage SE contm informaes sobre recursos, configuraes e procedimentos. Ela fornecida como ajuda HTML e foi projetada para que as informaes sejam obtidas de forma rpida e fcil. A ampla ajuda sensvel ao contexto visa fornecer a assistncia exata que voc precisa para continuar a trabalhar sem perda de tempo. Consulte Obteno de Ajuda online na pgina 9. Arquivo leiame O arquivo leiame contm informaes de ltima hora sobre o software. Leia-o antes de usar o OmniPage SE. Para abrir este arquivo HTML, escolha Leiame no programa de instalao do OmniPage SE ou, mais tarde, no menu Ajuda. Digitalizao e outras informaes O site da ScanSoft na Web no endereo www.scansoft.com fornece informaes atuais sobre o programa. O manual do scanner contm informaes atualizadas sobre scanners compatveis e questes relacionadas. A ScanSoft testa os 25 modelos de scanner mais utilizados. Acesse o site da ScanSoft na Web a partir do programa de instalao do OmniPage SE ou, mais tarde, a partir do menu Ajuda.

OmniPage SE Manual do usurio

Como usar este manual


Este manual foi escrito partindo-se do pressuposto que voc sabe como trabalhar no ambiente Microsoft Windows. Consulte a documentao do Windows se voc tiver dvidas sobre como usar caixas de dilogo, comandos de menu, barras de rolagem, funcionalidades de arrastar e soltar, menus de atalho etc. Partimos tambm do princpio que voc est familiarizado com o scanner e seu software de suporte e que o scanner est instalado e funciona corretamente antes da configurao para o OmniPage SE. Consulte a documentao do scanner se necessrio. As seguintes convenes so usadas neste manual: Negrito Itlico
Sem serifa

Introduz termos novos e apresenta sub-cabealhos. Usado no nome dos tpicos do sistema de ajuda on-line. Apresenta textos mais longos das opes em caixas de dilogo. Apresenta nomes de arquivos: sample.tif Uma nota apresenta um item de informao adicional. Uma dica apresenta idias de uso dos recursos do programa para realizar tarefas especficas. Este manual e utilizando o cone SE para indicar as diferenas entre os Edio Especial do OmniPage e OmniPage Pro 12. Consulte OmniPage SE na pgina 10.

Bem-vindo

Obteno de Ajuda on-line


Alm de usar este manual, voc pode usar a Ajuda on-line do OmniPage SE para aprender sobre recursos, configuraes e procedimentos. A ajuda on-line fica disponvel aps a instalao do OmniPage SE.

Ajuda HTML on-line


Abra a Ajuda on-line do OmniPage SE no nvel superior escolhendo os tpicos de Ajuda do OmniPage SE na parte superior do menu Ajuda. Isto permite que voc veja os tpicos organizados em um ndice analtico, procure por uma lista alfabtica de palavras-chave ou faa buscas de texto completo atravs dos tpicos. Os outros itens no menu Ajuda fornecem acesso a tpicos teis ou pginas na Web. Pressione F1 conforme voc estiver trabalhando no programa para ver um tpico de ajuda on-line relacionado rea da tela, caixa de dilogo ou mensagem de advertncia atual.

Ajuda sensvel ao contexto


Voc pode obter informaes concisas no local, que aparecem em uma janela instantnea, sobre um item particular do menu, boto de ferramentas, rea da tela ou caixa de dilogo do OmniPage SE da seguinte forma: Clique no boto Ajuda na barra de ferramentas Padro para obter o cone de ajuda. Com este cone, clique em qualquer item na rea de trabalho fora de uma caixa de dilogo ou de uma mensagem de advertncia. Pressione Shift + F1 para obter o mesmo cone de ajuda. Use Shift + F1 para obter ajuda sensvel ao contexto sobre itens do menu de atalho. Clique no boto de ponto de interrogao no lado superior direito de uma caixa de dilogo e, em seguida, clique no item na caixa de dilogo para ver a janela instantnea. Algumas caixas de dilogo ou mensagens de advertncia possuem seu prprio boto de Ajuda ou um texto de ajuda. Clique no boto ou texto para obter informaes sobre a caixa de mensagem ou de dilogo. Clique em qualquer lugar para remover uma janela de Ajuda instantnea sensvel ao contexto.

OmniPage SE Manual do usurio

Notas tcnicas
O site da ScanSoft na Web em www.scansoft.com contm notas tcnicas sobre questes relatadas freqentemente, referentes ao uso do OmniPage. As pginas da Web tambm podem oferecer assistncia sobre o processo de instalao e soluo de problemas.

Glossrio
Este manual no inclui um glossrio. A Ajuda on-line possui um glossrio amplo, com seu prprio ndice alfabtico e um ndice analtico. Consulte-o se quiser encontrar o significado de um termo usado neste manual ou no programa.

OmniPage SE
O produto que voc tem uma edio especial do software OmniPage Pro, mundialmente conhecido. Esta edio foi desenvolvida para ser distribuda por um grupo seleto de fabricantes de scanners e contm um subconjunto de recursos do produto OmniPage Pro 12. Este manual e a Ajuda on-line descrevem os recursos do produto completo, utilizando o cone SE para indicar as diferenas entre os dois produtos. Caso constate que outros recursos do produto profissional podem ser vantajosos para voc, use as ferramentas on-line para fazer a atualizao da Edio Especial 2.0 para o OmniPage Pro 12. Consulte OmniPage SE e OmniPage Pro 12 na pgina 19.

10

Bem-vindo

Captulo 1

Instalao e configurao
Este captulo fornece informaes sobre como instalar e iniciar o OmniPage SE. Ele apresenta os seguintes tpicos:
x x x x x x x

Requisitos do sistema Instalao do OmniPage SE Configurao do scanner com OmniPage SE Como iniciar o programa Registro do software Novos recursos no OmniPage Pro 12 OmniPage SE e OmniPage Pro 12

OmniPage SE Manual do usurio

11

Requisitos do sistema
Voc precisa dos seguintes requisitos mnimos de sistema para instalar e executar o OmniPage SE 2.0:
x x

Um computador com processador Pentium ou superior Microsoft Windows 98 (da segunda edio em diante), Windows Me, Windows NT 4.0 (com pelo menos o Service Pack 6), Windows 2000 ou Windows XP 64 MB de memria (RAM), 128 MB recomendado 90 MB disponvel em disco rgido para os arquivos do aplicativo alm de espao de trabalho de 5 MB durante a instalao 5 MB para o Microsoft Installer (MSI) caso ele no esteja presente (Este mdulo est presente como parte do sistema operacional no Windows Me, Windows 2000 e Windows XP) Monitor SVGA com 256 cores, mas preferencialmente cor de 16 bits (chamada High Color no Windows 2000 e Medium Color no XP) e resoluo de 800 x 600 pixels Dispositivo indicador compatvel com Windows Unidade de CD-ROM para instalao Um scanner compatvel, com seu prprio software do driver do scanner se voc pretende digitalizar documentos. Consulte o Guia do scanner no site da ScanSoft na Web (www.scansoft.com) para obter uma lista de scanners compatveis.
O desempenho e a velocidade sero melhorados se o processador, a memria e o espao em disco disponvel do seu computador excederem os requisitos mnimos.

x x x

x x x

12

Instalao e configurao

Captulo 1

Instalao do OmniPage SE
O programa de instalao do OmniPage SE o conduz pela instalao com instrues em todas as telas. Antes de instalar o OmniPage SE:
x x x

Feche todos os outros aplicativos, especialmente programas antivrus. Faa o login em seu computador com privilgios de administrador se estiver instalando no Windows NT, 2000 ou XP. Se voc tiver o software OCR do ScanSoft anterior em seu sistema, o programa de instalao solicitar sua permisso para desinstal-lo primeiro.

w Para instalar o OmniPage SE:

1. Coloque o CD-ROM do OmniPage SE na unidade de CD-ROM. O programa de instalao deve iniciar automaticamente. Se ele no iniciar, localize a unidade de CD-ROM no Windows Explorer e clique duas vezes no programa Autorun.exe no nvel superior do CD-ROM. 2. Escolha um idioma para usar durante a instalao. O idioma ser usado pelo sistema de converso de texto em fala e como o idioma de interface do programa. O idioma de interface do programa usado para exibies como itens de menu, caixas de dilogo, mensagens de advertncia etc. Voc pode alterar o idioma de interface posteriormente a partir do OmniPage SE, mas a sua escolha no momento de instalao determina qual sistema de converso de texto em fala ser instalado no programa. As referncias ao recurso Texto para fala no se aplicam ao OmniPage SE. 3. Siga as instrues em cada tela para instalar o software. Todos os arquivos necessrios para digitalizao so copiados automaticamente durante a instalao.
Algumas vezes a desinstalao e reinstalao do OmniPage SE resolver o problema. Consulte Desinstalao do software na pgina 100. No OmniPage Pro 12, o recurso Texto para fala est disponvel para os idiomas ingls (britnico e dos Estados Unidos), francs, alemo, italiano, portugus ou espanhol. O recurso no est disponvel no OmniPage SE. Consulte Leitura de texto em voz alta na pgina 78.

Instalao do OmniPage SE

13

Configurao do scanner com OmniPage SE


Todos os arquivos necessrios para configurao e suporte do scanner so copiados automaticamente durante a instalao do programa. Antes de usar o OmniPage SE para digitalizao, o scanner deve ser instalado com seu prprio software do driver do scanner e testado quanto ao seu funcionamento correto. O software do driver do scanner no acompanha o OmniPage SE. A instalao do scanner e a sua configurao so feitas pelo Assistente do scanner. Voc pode iniciar este processo sozinho, como descrito abaixo. Caso contrrio, o Assistente do scanner aparece quando voc tenta realizar a digitalizao pela primeira vez. Siga estas etapas para usar o Assistente do scanner para configurar o scanner com o OmniPage SE:
x

Escolha IniciarProgramasScanSoft OmniPage SE 2.0 Assistente do scanner ou clique no boto Configurao no painel Scanner da caixa de dilogo Opes. ou escolha uma configurao de digitalizao na lista suspensa Obter pgina na caixa de ferramentas do OmniPage e clique no boto Obter pgina.

O Assistente de configurao do scanner iniciado. O primeiro painel aparece apenas na primeira configurao quando chamado de dentro do OmniPage SE. x Escolha Selecione scanner ou cmera digital e clique em Avanar. Voc ver uma lista com todos os drivers de scanner TWAIN detectados, na qual estar selecionado o scanner padro do sistema. x Clique uma vez para selecionar o driver do scanner que deseja usar. Clique em Outros drivers... se voc precisar procurar um driver. Selecione Configurar definies avanadas para abrir um outro painel caso deseje que a prpria interface do scanner seja ocultada durante a digitalizao ou para modificar o mtodo de transferncia de imagem. Clique em Avanar. x Escolha Sim para testar a configurao do scanner e, em seguida, clique em Avanar. O assistente testar agora a conexo do computador com o scanner. Ao trmino, clique em Avanar.

14

Instalao e configurao

Captulo 1

x x x x x x

x x x x

Coloque uma pgina de teste no scanner. O assistente agora est preparado para fazer uma digitalizao bsica usando o software do fabricante do scanner. Clique em Avanar. A interface de usurio original do scanner aparecer. Clique em Digitalizar para iniciar a digitalizao do teste. Se necessrio, clique em Imagem invertida... ou Faltando imagem... e faa as selees apropriadas. Depois que a imagem aparecer corretamente na janela, clique em Avanar. Selecione o item que descreve mais adequadamente o scanner e, em seguida, clique em Avanar. Clique em Avanar para ir para o tamanho da pgina. Os tamanhos de pgina que o Assistente do scanner acredita que so compatveis com seu scanner so listados na janela. Para fazer alteraes nos tamanhos da pgina, clique em Avanado, faa as alteraes e clique em Avanar. Coloque uma pgina com texto mas sem imagens no scanner. Clique em Avanar para comear a digitalizar no modo preto e branco. Se necessrio, clique em Imagem invertida... ou Faltando imagem... e faa as selees apropriadas. Depois que a imagem aparecer corretamente na janela, clique em Avanar. Se voc tiver um scanner colorido, coloque uma fotografia ou uma pgina colorida com uma imagem colorida no scanner. Clique em Avanar para comear a digitalizar no modo colorido. Se necessrio, clique em Imagem invertida... ou Faltando imagem... e faa as selees apropriadas. Depois que a imagem aparecer corretamente na janela, clique em Avanar. Se o scanner no puder digitalizar em cores, pule esta etapa. Coloque uma fotografia ou uma pgina com uma imagem no scanner. Clique em Avanar para comear a digitalizar no modo de tons de cinza. Se necessrio, clique em Imagem invertida... ou Faltando imagem... e faa as selees apropriadas. Depois que a imagem aparecer corretamente na janela, clique em Avanar. Voc configurou o scanner com xito para trabalhar com o OmniPage SE! Clique em Concluir.

Para alterar as configuraes do scanner posteriormente ou para configurar um scanner de modo diferente, abra novamente o Assistente de configurao do scanner no menu Iniciar do Windows ou no painel Scanner da caixa de dilogo Opes. Para testar e consertar um scanner que no est funcionando adequadamente, abra o Assistente de configurao do scanner no menu Iniciar

Configurao do scanner com OmniPage SE

15

do Windows e selecione Testar o scanner ou cmera digital no primeiro painel e ento execute o procedimento descrito acima.

Como iniciar o programa


Para iniciar o OmniPage SE, siga um dos procedimentos abaixo: x Clique em Iniciar na barra de tarefas do Windows e escolha ProgramasScanSoft OmniPage SE 2.0OmniPage SE 2.0.
x x

Clique duas vezes no cone do OmniPage SE na pasta de instalao do programa ou na rea de trabalho do Windows se voc o colocou l. Clique duas vezes no cone de documento (OPD) do OmniPage ou no nome de arquivo. O documento clicado carregado pelo programa. Consulte Documentos do OmniPage na pgina 31.

Na abertura, a tela com o ttulo do OmniPage SE exibida e, em seguida, seu ambiente de trabalho. Consulte O ambiente do OmniPage na pgina 24. Ele fornece uma introduo s principais reas de trabalho do programa. H vrias formas de executar o programa com uma interface limitada:
x

Use o programa Programar OCR. Clique em Iniciar na barra de tarefas do Windows e escolha ProgramasScanSoft OmniPage Pro 12.0 Programar OCR. Consulte Processamento de documentos com Programar OCR na pgina 49. Esse recurso no est disponvel no OmniPage SE. Clique em Obter texto no menu Arquivo de um aplicativo registrado com o recurso Direct OCR. Consulte Como configurar o Direct OCR na pgina 46. Clique com o boto direito no cone de arquivo de imagem ou no nome de arquivo para obter um menu de atalho. Selecione um item no sub-menu de Converter para... para definir um destino. Use o OmniPage SE com o PaperPort da ScanSoft ou com os produtos de gerenciamento de documentos Pagis para acrescentar servios de OCR . Consulte Como usar o OmniPage SE com o PaperPort na pgina 48.

16

Instalao e configurao

Captulo 1

Registro do software
O assistente de registro da ScanSoft executado no final da instalao. Fornecemos um formulrio eletrnico simples que pode ser preenchido em menos de cinco minutos. Quando o formulrio preenchido e voc clica em Enviar, o programa procurar por uma conexo com Internet para realizar o registro on-line imediatamente. Se voc no tiver registrado o software durante a instalao, ser convidado periodicamente a registr-lo. Voc pode acessar www.scansoft.com para fazer o registro on-line. Clique em Support (Suporte) e na tela principal de suporte, escolha Register (Registrar) na coluna esquerda. Para obter uma declarao sobre o uso dos seus dados de registro, consulte a Poltica de privacidade da ScanSoft.

Novos recursos no OmniPage Pro 12


A famlia de produtos OmniPage foi ampliada com o OmniPage Pro 12 e o OmniPage SE. Esta seo relaciona as melhorias introduzidas no produto profissional OmniPage Pro 12. Algumas foram incorporadas no OmniPage SE, como detalhado na prxima seo. Os novos recursos do OmniPage Pro 12, em comparao ao OmniPage Pro 11, so:
x

Aumento significativo na preciso Uma sinergia aperfeioada entre os mecanismos de reconhecimento, suporte para dicionrios profissionais e a capacidade de treinar caracteres escolhidos pelo usurio impulsionam a preciso a novos nveis. Interface otimizada O processamento automtico e manual so agora acionados diretamente da Caixa de ferramentas do OmniPage sem barras de ferramentas separadas. Veja pgina 27. Agora as miniaturas so exibidas no Painel Imagem; escolha entre ver a pgina atual, miniaturas ou ambos. Veja pgina 28. A visualizao Detalhe anterior tornou-se o Gerenciador de documentos e inclui uma coluna Notas para comentrios e palavras-chave que podem ser pesquisadas.

Registro do software

17

Novos conceitos de zoneamento Zoneamento em tempo real permite que alteraes na zona sejam processadas imediatamente sem a necessidade de reconhecer a pgina inteira novamente. Veja pgina 77. Planos de fundo da pgina so definidos como processar (zoneamento automtico) ou ignorar, de modo que todas as instrues de zoneamento apaream na pgina e possam ser salvas em gabaritos de zona. Veja pgina 54. Zonas irregulares podem ser definidas e zonas podem ser divididas ou agrupadas mais facilmente, sem a necessidade de ferramentas separadas. Veja pgina 59. Melhor correo e verificao A caixa de dilogo Correo exibe agora palavras suspeitas em um contexto mais amplo. Um verificador dinmico pode permanecer aberto enquanto o texto verificado, com a visualizao e janela da imagem acompanhando a posio de edio. Veja pgina 67. Nveis de formatao para exibio e salvamento Existem trs nveis de formatao para a visualizao do Editor de texto. Veja pgina 66. Agora o nvel de formatao de sada escolhido no momento da exportao; as opes dependem do tipo de arquivo especificado. Uma opo de exportao Pgina ligada uma verso melhorada da visualizao anterior Manter colunas ligadas. Ela preserva o layout da pgina, sem caixas e quadros, sempre que possvel, de modo que o texto possa fluir entre as colunas. Veja pgina 85. Melhor anlise da pgina A transferncia de formatao de tabela melhorou, particularmente a deteco de tabelas sem linhas de grade nas pginas originais. Endereos Web e de correio eletrnico podem ser detectados e transferidos para o Editor de texto; hyperlinks podem ser inseridos. Agora a ordem de leitura pode ser visualizada e alterada depois do reconhecimento na visualizao True Page do Editor de texto. Veja pgina 75. Tratamento melhorado do formato PDF O OmniPage Pro 12 procura texto de fundo nos arquivos PDF que abrir, proporcionando uma maior preciso de reconhecimento. Um novo tipo de arquivo PDF editado permite uma boa reteno de formato em pginas que foram modificadas no Editor de texto aps o reconhecimento. Opes avanadas de salvamento Uma gama mais ampla de opes de salvamento oferecida para cada tipo de arquivo de sada. Podem ser criados tipos de arquivo de sada

18

Instalao e configurao

Captulo 1

definidos pelo usurio com configuraes personalizadas. Veja pgina 86. Se sua edio do OmniPage Pro 12 incluir os novos formatos de salvamento XML e eBook, veja pgina 99.

OmniPage SE e OmniPage Pro 12


Esta lista indica os recursos que no foram incorporados no OmniPage SE, mas que podem ser obtidos por meio da atualizao para o OmniPage Pro 12:
x x x x x x x x x x x x x

Aperfeioamento significativo da preciso do reconhecimento.

Acesso ao recurso de treinamento, de IntelliTrain e arquivos de treinamento. Capacidade para abrir e ler o contedo de arquivos PDF. Capacidade para salvar documentos reconhecidos no formato PDF. Recurso Programar OCR para processamento automtico de tarefas OCR em horrios definidos. Suporte digitalizao de 2 pginas para facilitar a digitalizao de livros. Nvel de formatao com sada de pgina ligada para reteno superior do layout da pgina. Gerenciamento de arquivos de imagem TIFF LZW e GIF para entrada e sada. Exportao para os formatos eBook e XML. Suporte para sada em HTML 4.0 'WYSIWYG'. Suporte para idiomas ampliado, de cerca de 50 para mais de 100. Acesso a dicionrios mdicos e jurdicos profissionais em idiomas selecionados. Acesso ao software RealSpeak, Texto para fala, permitindo leitura em voz alta de textos reconhecidos.

Para obter mais informaes ou fazer a atualizao, visite o site www.scansoft.com.

OmniPage SE e OmniPage Pro 12

19

20

Instalao e configurao

Captulo 2

Introduo
Provavelmente, voc usa o computador para correspondncia comercial, elaborao de relatrios, tratamento de dados e um nmero cada vez maior de outros usos. O desafio que, apesar da revoluo digital, algumas fontes de informao ainda circulam na forma de papel impresso e no podem ser usadas imediatamente em um computador. Por exemplo, se voc quiser incluir informaes de um artigo de revista em um relatrio que estiver preparando, precisar obter o texto do artigo de alguma forma e coloc-lo em seu computador. Digitar todo o artigo no uma soluo interessante. Este captulo lhe apresenta a soluo: reconhecimento ptico de caracteres (OCR). Ele descreve como o OmniPage SE usa tecnologia de OCR para transformar o texto contido em arquivos de imagem ou pginas digitalizadas em texto editvel para ser usado em seus aplicativos favoritos. Apresentamos os seguintes tpicos:
x

O que reconhecimento ptico de caracteres Documentos no OmniPage SE Etapas bsicas de processamento

x x x x

O ambiente do OmniPage Gerenciamento de documentos Documentos do OmniPage Configuraes

OmniPage SE Manual do usurio

21

O que reconhecimento ptico de caracteres


O reconhecimento ptico de caracteres o processo de extrair texto de uma imagem. Esta imagem pode resultar da digitalizao de um documento em papel ou abertura de um arquivo de imagem eletrnica. As imagens no possuem caracteres editveis de texto; possuem muitos pontos pequenos (pixels) que juntos formam um caractere. Estes apresentam uma figura do texto em uma pgina. Durante o OCR, o OmniPage SE analisa as formas de caracteres em uma imagem e define solues para produzir texto editvel. Aps o OCR, voc pode salvar o texto resultante em vrios aplicativos de processamento de texto, de editorao eletnica ou planilhas.

Recursos de OCR do OmniPage SE


Alm de reconhecimento de texto, o OmniPage SE pode manter os seguintes elementos de um documento atravs do processo de OCR. Imagens grficas Fotos, logos e desenhos so exemplos de imagens grficas. Formatao de texto Tipos de fonte, tamanhos e estilos (como negrito, itlico e sublinhado) so exemplos de formatao de caracteres. Recuos, tabulaes, margens e espaamento de linha so exemplos de formatao de pargrafos. Formatao de pgina Estrutura de colunas, formatao de tabela e colocao de imagens grficas e cabealhos so exemplos de formatao de pgina. Os elementos de formatao de pgina, texto e imagens grficas que o OmniPage SE mantm so determinados pelas configuraes que voc seleciona. Consulte Instrues de configuraes na Ajuda on-line para obter mais informaes sobre como selecionar as configuraes.
O OmniPage SE reconhece apenas caracteres gerados por mquina como texto em offset, impresso a laser ou escrito por mquina de escrever. Entretanto, ele pode manter um texto escrito a mo, como uma assinatura, como uma imagem grfica.

22

Introduo

Captulo 2

Documentos no OmniPage SE
O OmniPage SE trata os documentos um por vez. Quando voc obtm a sua primeira imagem (do scanner ou do arquivo) um novo documento iniciado. Outras imagens obtidas so adicionadas ao mesmo documento, at voc salv-lo e fech-lo. Um documento no OmniPage SE consiste em uma imagem para cada pgina de documentos. Depois de realizado o OCR, o documento tambm conter texto reconhecido, exibido no Editor de texto, possivelmente com imagens grficas e tabelas. Consulte O ambiente do OmniPage na pgina 24.

Etapas bsicas de processamento


Existem duas formas principais de tratamento de documentos: com processamento automtico ou manual. Consulte Processamento automtico na pgina 40 e Processamento manual na pgina 42. As etapas bsicas dos dois mtodos de processamento so praticamente as mesmas: 1. Colocar um conjunto de imagens no OmniPage SE. Voc pode digitalizar um documento em papel com ou sem um alimentador automtico de documentos (ADF) ou carregar arquivos de imagens. As imagens resultantes podem aparecer como miniaturas no Painel Imagem junto com a imagem da primeira pgina inserida. As pginas do documento esto resumidas no Gerenciador de documentos. Consulte Definio da origem das imagens de pgina na pgina 50. 2. Realizar OCR para gerar texto editvel. Durante o OCR, o OmniPage Pro cria zonas ao redor de elementos na pgina que sero processadas e interpreta os caracteres de texto ou as imagens grficas em cada zona. O zoneamento manual e de gabaritos tambm possvel. Depois do OCR, voc pode verificar e corrigir erros no documento usando o Corretor de OCR e editar o documento no Editor de texto. 3. Exportar o documento para o local desejado. Voc pode salvar o documento com um nome e tipo de arquivo especificado, coloc-lo na rea de transferncia ou envi-lo como anexo de correio eletrnico. Voc pode salv-lo como um documento (OPD) do OmniPage como descrito posteriormente. Voc pode salvar o mesmo documento repetidamente em vrios destinos, tipos de arquivo diferentes, com nveis de formatao e configurao diferentes. Consulte Gravao e exportao na pgina 81.

O que reconhecimento ptico de caracteres

23

O ambiente do OmniPage
O ambiente do OmniPage possui uma barra de ttulos e uma barra de menu ao longo da parte superior e uma barra de status ao longo da parte inferior. Ele tem trs reas de trabalho principais, separadas por divisores: o Gerenciador de documentos, o Painel de imagem e o Editor de texto. Cada uma possui botes de fechar, maximizar e restaurar no canto superior direito. O Painel de imagem tem uma barra de ferramentas de imagem e o Editor de texto tem uma barra de ferramentas de formatao.
Barra de ferramentas padro Caixa de ferramentas do OmniPage Miniaturas exibem uma imagem de cada pgina no documento. Barra de ferramentas de formatao

A pgina atual possui o cone de um olho. Esta pgina foi reconhecida. Barra de ferramentas de imagem

Botes de navegao de pgina Arraste esses divisores para redimensionar as reas de trabalho. Painel de imagem: Exibe a imagem da pgina atual juntamente com suas zonas. O painel de imagem pode exibir a pgina atual, miniaturas ou ambos. Os botes de visualizao do Editor de texto oferecem trs nveis de formatao. Editor de texto: Exibe os resultados de reconhecimento da pgina atual na visualizao True Page.

Botes para exibir ou ocultar o Gerenciador de documentos, o Editor de texto e as miniaturas e a pgina atual do Painel de imagem. Isso tambm pode ser feito no menu Visualizar.

24

Introduo

Captulo 2

Mostramos o programa com um documento de trs pginas. A pgina um a pgina atual, que foi reconhecida e corrigida. A pgina dois foi reconhecida, mas ainda no foi corrigida. A pgina trs foi obtida e zoneada manualmente, mas ainda no foi reconhecida. Os cones na parte inferior das imagens em miniatura mostram o status da pgina. Os botes da barra de status permitem que voc mostre ou oculte as reas da tela principal e v para outras pginas no documento. Um clique com o boto direito do mouse em uma rea qualquer da tela exibe um menu de atalho com os comandos mais teis da rea.

A barra de menus
Para obter informaes concisas sobre qualquer item de menu, clique no boto de ajuda sensvel ao contexto e, em seguida, clique no item de menu. Um texto instantneo explica o propsito do item de menu. Clique em qualquer lugar para fechar o texto instantneo.

As Barras de ferramentas
O programa possui trs barras de ferramentas principais; todas podem flutuar. Use o menu Visualizar para exibir, ocultar ou personalizar essas barras de ferramentas. A ajuda sensvel ao contexto explica a finalidade de todas as ferramentas. Duas outras barras de ferramentas controlam tarefas especficas.
Barra de ferramentas
Padro

Local padro
Horizontal sob a barra de Menu Verticalmente esquerda da atual imagem da pgina Horizontal na parte superior do Editor de texto

Outros locais de acoplamento


Qualquer extremidade do Ambiente do OmniPage Verticalmente direita da atual imagem da pgina

Finalidade
Executar funes bsicas do programa. Consulte pgina 31 e pgina 67. Operaes de imagem, zoneamento e tabela. Consulte pgina 54 e pgina 61. Formatao reconheceu texto no Editor de texto. Veja pgina 75. Controlar a localizao e aparncia do verificador. Veja pgina 68. Modificar a ordem dos elementos em pginas reconhecidas. Veja pgina 75.

Imagem

Formatao

Nenhum

Verificador

Passe o cursor sobre a janela do verificador para ver esta barra de ferramentas flutuante. Clique na ferramenta Alterar ordem de leitura. Esta barra de ferramentas substitui a barra de ferramentas Formatao.

Reordenar

O ambiente do OmniPage

25

O Painel de imagem
Quando exibida a imagem da pgina atual, a barra de ferramentas Imagem fica disponvel. Todas as imagens de pgina tm um valor de plano de fundo: processar ou ignorar. Zonas podem ser desenhadas manualmente em imagens de pgina ou podem ser colocadas automaticamente depois do reconhecimento. Existem cinco tipos de zona: Processar, Ignorar, Texto, Tabela, Imagens grficas. reas dentro de zonas do tipo processar e em um plano de fundo do tipo processar fora de outras zonas tm suas zonas desenhadas automaticamente e seus tipos de zona determinados durante o processamento. Consulte Zonas e planos de fundo na pgina 54. Se a imagem da pgina atual est oculta, aparecem miniaturas nas linhas para usar o espao disponvel da melhor maneira.

O Editor de texto
Isso exibe os resultados do reconhecimento em qualquer um dos trs nveis de formatao: x Visualizao Sem formatao (NF) x Visualizao Preservar fontes e pargrafos (RFP) x True Page (TP) True Page mantm o layout da pgina usando texto, tabela e caixas de imagem e quadros. possvel exibir reas com vrias colunas para mostrar blocos de texto que podem ser tratados como colunas ligadas no momento da exportao. True Page tambm um nvel de formatao de exportao, juntamente com Pgina ligada que mantm o layout da pgina sem caixas ou quadros. Consulte Exibio e visualizaes do editor na pgina 66. O OmniPage SE no oferece o recurso de sada de pgina ligada.

26

Introduo

Captulo 2

A caixa de ferramentas do OmniPage


Esta caixa de ferramentas permite controlar o processamento. Por definio, ela est localizada ao longo da parte superior do ambiente do OmniPage, exatamente acima das reas de trabalho. Ela pode ser movida e fixada ao longo da parte inferior do ambiente.
Boto Iniciar Boto Obter pgina Boto Efetuar OCR Boto Exportar resultados

Lista suspensa Obter pginas

Lista suspensa Descrio do layout

Lista suspensa Resultados da exportao

O processamento automtico iniciado e pode ser interrompido e reiniciado com o boto Iniciar (1-2-3). Consulte Processamento automtico na pgina 40. O processamento manual permite processar documentos pgina por pgina e passo a passo. Inicie cada etapa com os trs botes grandes: o boto Obter pgina (1), o boto Executar OCR (2) e o boto Exportar resultados (3). Consulte Processamento manual na pgina 42. Voc pode alternar entre o processamento manual e automtico a qualquer momento, desde que o programa no esteja ocupado com o processamento. Isto significa que voc pode alternar entre eles enquanto est trabalhando em um documento. Voc pode processar automaticamente algumas pginas e, em seguida, adicionar mais pginas com processamento manual. Aps processar uma pilha de pginas automaticamente, voc pode inspecionar os resultados e, em seguida, voltar para processar novamente certas pginas manualmente. Este procedimento descrito no Captulo 3. Consulte Processamento combinado na pgina 43. O Assistente de OCR foi projetado para novos usurios. Consulte Processamento com o Assistente de OCR na pgina 45. Se voc tiver um documento aberto quando iniciar o Assistente de OCR, o documento ser fechado aps um aviso para salv-lo. Quando voc usa o Assistente de OCR para processar e salvar um documento, ele continua no programa e pode ser processado novamente (adicionando mais pginas, reconhecendo novamente pginas etc.) com o processamento automtico ou manual.

O ambiente do OmniPage

27

Gerenciamento de documentos
O gerenciamento de documentos pode ser feito atravs de miniaturas no Painel de imagem ou do Gerenciador de documentos, localizado ao longo da parte inferior do Ambiente do OmniPage. As duas visualizaes resumem as pginas no documento e so sincronizadas: As nossas figuras mostram as duas visualizaes com o mesmo documento de sete pginas. As pginas 1 e 2 so selecionadas e a pgina 4 a pgina atual, isto , aquela exibida no Painel de imagem. O status da pgina exibido da seguinte maneira:
Pgina
1 2 3

Status
Obtida Reconhecida Reconhecida, Corrigida Modificada Modificada, corrigida Pendente

cone

A imagem da pgina foi...


obtida mas ainda no reconhecida. reconhecida mas no corrigida, ou a correo foi interrompida na pgina. reconhecida e a correo chegou ao fim da pgina. reconhecida com pelo menos uma mudana de edio ou formatao feita no Editor de texto. reconhecida, editada no Editor de texto e a correo chegou ao fim da pgina. obtida, talvez reconhecida; algumas mudanas de zona esto armazenadas mas ainda no foram processadas. reconhecida e salva pelo menos uma vez.

5 6

Salva

Miniaturas
Isto apresenta um conjunto de imagens miniaturas numeradas, uma para cada pgina no documento. Percorra para ver as pginas, conforme necessrio. A pgina atual possui o cone de um olho. Voc pode selecionar vrias pginas no documento; estas possuem uma aparncia particular. Use miniaturas para operaes com pginas, da seguinte forma: Pular para uma pgina: Clique na miniatura da pgina desejada. Reordenar uma pgina: Clique na miniatura da pgina que deseja mover e arraste-a para cima do nmero da pgina desejada. As pginas so renumeradas automaticamente. Excluir uma pgina: Selecione a miniatura da pgina que voc deseja excluir e pressione a tecla Delete.

28

Introduo

Captulo 2

Selecionar vrias pginas: Mantenha a tecla Shift pressionada e clique em duas miniaturas para selecionar todas as pginas entre elas e inclu-las. Mantenha a tecla Ctrl pressionada conforme voc clica nas miniaturas para adicionar pginas a uma seleo, uma a uma. Em seguida, voc pode mover ou excluir as pginas selecionadas como um grupo ou envi-las para (novo) reconhecimento. Voc tambm pode exportar pginas selecionadas.
Para obter informaes sobre uma imagem de entrada, passe o cursor sobre sua miniatura (desde que o recurso Dicas sobre ferramentas esteja ativado). Um texto instantneo exibe o tamanho da imagem em pixels e a unidade de medio do programa. A resoluo da imagem tambm mostrada.

Gerenciador de documentos
Isso fornece uma viso geral do documento em uma tabela. Cada linha representa uma pgina. As colunas apresentam informaes estatsticas ou de status sobre cada pgina e (quando for o caso) sobre totais de documento. A figura mostra colunas especificadas por um usurio.

Mova o cursor sobre o cone de status de uma pgina para ver uma miniatura da pgina.

Digite aqui comentrios ou palavras-chave que podem ser pesquisadas.

A pgina atual possui o cone de um olho. Voc pode usar o Gerenciador de documentos para operaes na pgina, da seguinte forma: Pular para uma pgina: Clique na parte mais esquerda da linha da pgina ou clique duas vezes em qualquer parte de sua linha. Reordenar uma pgina: Clique na linha da pgina que deseja mover e arraste-a para o local desejado. Um indicador na esquerda mostra onde a pgina ser inserida. As pginas so renumeradas automaticamente. Excluir uma pgina: Selecione a linha da pgina que voc deseja excluir e pressione a tecla Delete. Selecionar vrias pginas: Mantenha a tecla Shift pressionada e clique em duas linhas de pgina para selecionar todas as pginas entre elas e inclu-las. Mantenha a tecla Ctrl pressionada conforme voc clica nas linhas para adicionar pginas a uma seleo, uma a uma. Em seguida, voc pode mover ou excluir as

Gerenciamento de documentos

29

pginas selecionadas como um grupo ou envi-las para (novo) reconhecimento. Voc tambm pode exportar pginas selecionadas. Quando vrias pginas estiverem sendo selecionadas, a pgina definida como atual no muda. Todas as pginas selecionadas ficam em destaque.

Personalizar colunas do Gerenciador de documentos


Voc pode especificar quais colunas de informaes deseja ver no Gerenciador de documentos. Clique em Personalizar colunas ... no menu Visualizar para a seguinte caixa de dilogo:

Esse item est em destaque. Clique em uma caixa de seleo para selecionar o item. Os tamanhos das imagens so expressos em pixels.

Destaque um item e use estas setas para alterar a ordem das colunas.

Defina uma largura para o item destacado.

Defina quais colunas devem aparecer, suas larguras e ordem de coluna. O tpico Personalizar colunas do Gerenciador de documentos na Ajuda on-line esclarece o que apresentado em cada coluna. Voc pode alterar as larguras de coluna facilmente no Gerenciador de documentos; basta arrastar os divisores de coluna na barra de ttulo.

Excluso de pginas de um documento


As excluses de pgina precisam ser confirmadas e podem ser desfeitas. Exclua a pgina atual somente com o item Excluir pgina atual no menu Editar. Exclua todas as pginas selecionadas no Gerenciador de documentos ou nas miniaturas pressionando a tecla Delete ou usando o comando Limpar do menu de atalho.

30

Introduo

Captulo 2

Impresso de um documento
Voc pode imprimir o documento com o item Imprimir no menu Arquivo. Escolha se deseja imprimir imagens ou texto (isto , os resultados de reconhecimento conforme aparecem no Editor de texto). Voc pode imprimir todas as pginas ou um intervalo de pginas. A ferramenta Imprimir na barra de ferramentas Padro imprime imagens ou texto, dependendo se o Painel de imagem ou o Editor de texto estiverem ativos.

Fechar um documento
Escolha Fechar no menu Arquivo para fechar um documento. Voc avisado para salvar o documento se no o tiver salvo ou se o tiver modificado desde a ltima gravao. Consulte a prxima seo sobre como salvar o documento como um documento *.opd do OmniPage. Voc tambm ser avisado para salvar dados de treinamento no salvos se tiver selecionado Perguntar se deseja salvar dados de treinamento ao fechar o documento no painel Correo da caixa de dilogo Opes. A ltima frase no se aplica ao OmniPage SE.

Documentos do OmniPage
O documento do OmniPage o tipo de arquivo patenteado do programa; ele tem a extenso .opd. Ele um dos tipos de arquivo oferecidos ao salvar um documento em um arquivo. Voc salva o documento com o tipo de arquivo OPD se quiser trabalhar com ele novamente no OmniPage em uma sesso futura. Em seguida, voc pode processar as pginas inacabadas, adicionar mais pginas e corrigir ou editar resultados de reconhecimento. Um documento do OmniPage contm as imagens originais da pgina (desentortadas e pr-processadas) com todas as zonas colocadas nela. Aps o reconhecimento, o OPD tambm conter os resultados de reconhecimento. Os caracteres reconhecidos so armazenados com os dados de confiana e de coordenadas. Isto preserva os vnculos entre imagem e texto, de forma que a verificao e a correo continuem disponveis quando o OPD for reaberto em sesses futuras. Quando voc salva um documento do OmniPage, as configuraes atuais (e o treinamento no salvo) tambm so salvos. Quando voc abre um documento do OmniPage, as suas configuraes so aplicadas, substituindo as existentes no programa.

Documentos do OmniPage

31

Um documento OmniPage criado e salvo no OmniPage SE no inclui dados de treinamento. Todos os dados de treinamento contidos em arquivos OPD abertos no OmniPage SE sero ignorados.

Por que salvar em OPD


Voc no tem que salvar os documentos no tipo de arquivo OPD. Normalmente, isto feito pelas seguintes razes:
o o

Voc no pode terminar de trabalhar com o documento na sesso atual. Voc quer passar o documento para outros usurios que possuem OmniPage Pro ou OmniPage SE. Por exemplo, voc pode passar um arquivo OPD a um especialista para correo. Em uma rede em um escritrio, voc pode fazer com que um scanner gere imagens para reconhecimento e que sejam corrigidas em vrias estaes de trabalho. Voc deseja construir um arquivo de documentos reconhecidos cujas imagens originais continuam acessveis. Os textos reconhecidos permitem a busca por palavras-chaves e outras tcnicas de pesquisa em documentos.
Os resultados do reconhecimento devem ser salvos a partir de arquivos OPD antes de instalar uma atualizao do OmniPage. Pode ser que estes arquivos no sejam totalmente compatveis com formatos de arquivos OPD ou que somente as imagens sejam mantidas quando os arquivos forem atualizados. Quando voc abre um OPD criado pelo OmniPage Pro 10, apenas as imagens so carregadas. Quando voc abre um OPD criado pelo OmniPage Pro 11 ou sua edio especial, so carregadas imagens e pginas reconhecidas mas as zonas no so mantidas.

Como salvar como OPD


Se voc estiver pensando em criar um OPD, pode salvar neste formato em um estgio inicial, por proteo. Use o boto Salvar para salvar periodicamente conforme voc trabalha. Salve-o novamente no final da sua sesso. O boto Salvar salva o documento com o nome e tipo de arquivo de sua ltima gravao. Voc pode salvar o documento repetidamente em formatos diferentes. Se a sua primeira gravao for com outro formato (por exemplo .doc), use o item Salvar como... do menu Arquivo para salv-lo como um OPD. Se um documento salvo como OPD e voc posteriormente o salva com outro formato, ele no salvo novamente automaticamente como OPD. Quando voc fechar um documento ou sair do programa, ser avisado para salvar o documento como OPD. A barra de ttulo exibe o nome de arquivo do mais recente documento completo salvo.

32

Introduo

Captulo 2

Configuraes
A caixa de dilogo Opes o local central para as configuraes do OmniPage SE. Acesse essa caixa de dilogo a partir da bar de ferramentas Padro ou do menu Ferramentas. A ajuda sensvel ao contexto fornece informaes sobre cada configurao. Na viso geral, os painis de configurao so: OCR Use isto para especificar os idiomas de reconhecimento, um dicionrio de usurio ou profissional, um caracter rejeitado e uma correspondncia de fonte. Clique na caixa de verificao ao lado do idioma para selecion-lo ou cancelar a seleo. possvel fazer vrias selees; selecione apenas os idiomas que aparecem no documento a ser reconhecido. Os itens na parte superior so os idiomas selecionados recentemente. Digite as primeiras letras de um idioma para acess-lo.O OmniPage SE no oferece suporte para dicionrios profissionais. Scanner Use isto para definir o tamanho da pgina e orientao para digitalizao. Voc tambm pode fazer configuraes de brilho e contraste e definir opes para digitalizar documentos de vrias pginas, com ou sem um alimentador automtico de documentos (ADF). Voc pode alterar as definies de configurao do scanner ou instalar um novo scanner ou alterar o scanner padro. Consulte Entrada do scanner na pgina 51. Este painel no estar disponvel se voc solicitou a exibio da interface TWAIN nativa de seu scanner durante sua configurao. Consulte Configurao do scanner com OmniPage SE na pgina 14. Direct OCR Este recurso fornece servios de OCR diretamente de seu processador de texto favorito ou aplicativo semelhante. Use este painel para registrar e eliminar o registro de aplicativos para o Direct OCR e ativar ou desativar este servio. Voc tambm pode especificar zoneamento automtico ou manual e se a correo ortogrfica desejada ou no. Consulte Como configurar o Direct OCR na pgina 46. Processamento Use isto para definir o local onde novas imagens devem ser colocadas no documento, para configurar que sejam solicitadas mais pginas durante a digitalizao, para especificar digitalizao de pgina dupla quando se tratar de livros e outras configuraes. Voc pode alterar o idioma da interface aqui. O OmniPage SE no oferece suporte para a digitalizao de 2 pginas.

Configuraes

33

Correo Use isto para definir se a correo deve comear automaticamente aps o reconhecimento. Defina tambm se o IntelliTrain deve ser executado e use-o para carregar ou trabalhar com um arquivo de treinamento. Consulte Correo de resultados de OCR na pgina 67. As referncias a treinamento no se aplicam ao OmniPage SE. Layout personalizado Use isto para descrever o layout das pginas do documento de entrada com bastante preciso. Isto d o controle mximo sobre o processo de zoneamento automtico, instruindo-o a procurar ou ignorar colunas, imagens grficas e tabelas. Consulte Descrio do layout de documento na pgina 53. Editor de texto Use isto para mostrar ou ocultar alguns recursos no Editor de texto, para definir a unidade de medida a ser usada e para ativar ou desativar a mudana de linha. Consulte Edio de texto e de imagem na pgina 75.

No OmniPage Pro 12, se voc tiver acesso a um Sistema de Gerenciamento de Documentos (DMS) em seu computador e sua edio do OmniPage Pro 12 incluir suporte a ODMA, um painel ODMA tambm pode aparecer. Consulte Suporte a ODMA na pgina 97.

Algumas configuraes s afetam os reconhecimentos futuros. Alguns exemplos so os idiomas do reconhecimento, um arquivo de treinamento ou o nvel de brilho do scanner. Estas configuraes devem ser ajustadas corretamente antes de voc iniciar o processamento. Para que todas as alteraes nestas configuraes sejam aplicadas nas pginas j reconhecidas, voc ter que reconhec-las novamente. As outras configuraes so implementadas imediatamente em todas as pginas existentes. Alguns exemplos so as configuraes de Editor de texto como mudana de linha e unidades de medida.

34

Introduo

Captulo 3

Processamento de documentos
Este tutorial descreve diferentes maneiras de processar um documento e tambm fornece informaes sobre partes fundamentais deste processamento.
x x x x x x x x

Guia de incio rpido Viso geral do processamento Processamento automtico Processamento manual Processamento combinado Processamento com o Assistente de OCR Processamento a partir de outros aplicativos (Direct OCR, PaperPort) Processamento de documentos com Programar OCR

Os tpicos detalhados so: x Definio da origem das imagens de pgina x Descrio do layout de documento x Zonas e planos de fundo Zoneamento automtico Zoneamento manual Tipos de zona e propriedades Trabalho com zonas x Grades de tabela na imagem x Uso de gabaritos de zonas

OmniPage SE Manual do usurio

35

Guia de incio rpido


Este tpico o conduz passo a passo pelo processo bsico de OCR.

Carregamento e reconhecimento de amostras de arquivos de imagem


Voc encontrar amostras de arquivos de imagem na pasta de programas, que contm arquivos de uma e de vrias pginas. Tente ler estes arquivos inicialmente usando o procedimento apresentado abaixo, exceto no que se refere a um scanner. Consulte Entrada de arquivos de imagem na pgina 50. Os resultados fornecem uma avaliao da qualidade do reconhecimento que voc deve esperar de seus prprios arquivos com qualidade comparvel. Em seguida, experimente digitalizar uma pgina do scanner.

Digitalizao e reconhecimento de uma nica pgina


Ligue o scanner e certifique-se de que ele est trabalhando corretamente. Escolha uma pgina com texto claro de boa qualidade para este teste. Partimos do pressuposto de que as configuraes padro do OmniPage SE esto definidas e que o documento est no idioma que voc especificou como o idioma de interface durante a instalao. Abra a caixa de dilogo Opes no menu Ferramentas e escolha Usar padres se voc no estiver usando o programa pela primeira vez. Voc processar o documento automaticamente e salvar os resultados de reconhecimento em um arquivo. Voc corrigir o documento, mas no o editar dentro do Editor de texto.

36

Processamento de documentos

Captulo 3

O que voc faz


1. 2. 3. 4. Configure o scanner usando o Assistente de scanner, se isto ainda no tiver sido feito. Selecione Iniciar Programas ScanSoft OmniPage SE 2.0 OmniPage SE 2.0 Coloque o documento corretamente no scanner. Na lista suspensa Obter pgina, selecione uma opo de digitalizao para o documento: preto e branco, tons de cinza ou em cores. Na lista suspensa Descrio do Layout, verifique se Automtico est selecionado. Para uma ampla gama de documentos, esta a melhor opo. Na lista suspensa Exportar resultados, verifique se Salvar como arquivo est selecionado. Clique no boto Iniciar.

O que acontece
Configura o OmniPage SE para trabalhar com o scanner. Abre o OmniPage SE no computador.

 

Permite que voc determine como as imagens ou textos coloridos e fundos aparecero no documento exportado. necessrio um scanner colorido para realizar digitalizao em cores. Configura o programa para colocar as zonas na pgina e decidir suas propriedades automaticamente. Isto significa que voc poder nomear o arquivo exportado aps ter corrigido o documento. O OmniPage SE comear a digitalizar o documento. Surge uma miniatura com um indicador de progresso. Surge o Corretor de OCR. O Corretor de OCR funciona como um corretor ortogrfico em um programa de processamento de texto, mas com recursos adicionais especficos de OCR. Ele remove as marcaes de palavras que foram corrigidas.

5.

6. 7.

8.

Use o Corretor de OCR para modificar as palavras que o programa suspeita no terem sido reconhecidas corretamente.

9.

Clique no Editor de texto. Selecione as visualizaCada visualizao de Editor de texto define um nvel es do Editor de texto uma aps a outra, para de formatao. Isto indica qual nvel escolher no ver como a pgina aparece em cada visualizamomento de salvar. o. Clique em Continuar para reiniciar a correo. Isto termina o processo de correo de OCR. A caixa Quando a mensagem A correo de OCR termide dilogo Salvar como aparecer. nou aparece, clique em OK. Escolha um nome de arquivo, tipo de arquivo, caminho e nvel de formatao para salvar seu documento reconhecido. Clique em OK. Inspecione o documento no programa de processamento de texto. Por definio, Salvar e iniciar ativado, de forma que o seu documento ser aberto automaticamente no programa de processamento de texto associado ao tipo de arquivo selecionado. Voc usou com xito o OmniPage SE para reconhecer o documento e abri-lo no aplicativo de destino!

10.

11.

12.

Se voc teve xito em obter bons resultados com as amostras de arquivos de imagem, mas no com a pgina digitalizada, verifique a instalao e as configuraes do scanner: especialmente o brilho e a resoluo da imagem. Consulte Entrada do scanner na pgina 51. Isso fornece um modelo de brilho

Guia de incio rpido

37

timo. Consulte tambm os tpicos de ajuda on-line Configurao do scanner e Soluo de problemas do scanner.

Viso geral do processamento


O seguinte diagrama de fluxo resume as etapas do processamento:
Obter pginas do arquivo pgina 50 do scanner pgina 51 Descrever layout da pgina pgina 53 Aplicar um gabarito pgina 63 Zoneamento automtico pgina 55 Zoneamento manual pgina 56 Realizar OCR com as configuraes atuais pgina 33 Exportar pginas Verificar e editar pgina 68 Corrigir pgina 67 para o arquivo pgina 83 para a rea de transferncia pgina 88 via Correio pgina 89

Aqui est uma viso geral dos mtodos de processamento que voc pode usar. Voc encontrar instrues passo a passo para cada um deles nas pginas seguintes. Automtico A forma mais rpida e fcil de processar documentos deixar o OmniPage SE fazer isso automaticamente. Selecione as configuraes na caixa de dilogo Opes e nas listas suspensas Caixa de ferramentas do OmniPage e clique em Iniciar. Cada pgina ser processada do incio ao fim, quando possvel funcionando em paralelo. Normalmente, ser feito o zoneamento automtico nas pginas. Manual O processamento manual lhe d controle mais preciso sobre a forma com que as suas pginas so tratadas. Voc pode processar o documento pgina a pgina com configuraes diferentes para cada pgina. O programa tambm pra entre cada etapa: obteno de imagens, realizao de reconhecimento, exportao. Isto lhe permite, por exemplo, delimitar zonas manualmente ou alterar os idiomas de reconhecimento. Voc pode iniciar cada etapa clicando nos trs botes na Caixa de ferramentas do OmniPage. Combinado Voc pode processar um documento automaticamente e visualizar os resultados no Editor de texto. Se a maior parte das pginas estiverem em ordem, mas algumas no tiverem sado como esperado, voc pode alternar para processamento manual para ajustar as configuraes e reconhecer novamente

38

Processamento de documentos

Captulo 3

somente as pginas com problema. Outra alternativa obter imagens com processamento manual, desenhar zonas em algumas ou todas elas e ento enviar todas as pginas para o processamento automtico. Uso do Assistente de OCR O Assistente de OCR o conduz durante a seleo de configuraes e comandos fazendo perguntas. Em seguida, ele aciona o processamento automtico. Esta uma boa forma de se familiarizar se o OmniPage SE for uma novidade.

Em outros aplicativos Voc pode usar o recurso Direct OCR para chamar os servios de reconhecimento do OmniPage SE enquanto trabalha em seu processador de texto normal ou aplicativo semelhante. O OmniPage SE se associa automaticamente ao PaperPort da ScanSoft e aos programas de gerenciamento de documentos Pagis. Mais tarde Voc pode programar para que trabalhos de OCR sejam realizados automaticamente mais tarde, mesmo quando no estiver diante de seu computador. O Assistente de Nova tarefa do Programar OCR permite que voc especifique configuraes e a hora de incio. O OmniPage SE no oferece suporte para o recurso Programar OCR.

Viso geral do processamento

39

Processamento automtico
O processamento automtico fornece uma forma eficaz de tratamento de documentos, especialmente os maiores. Primeiro, selecione todas as configuraes necessrias e, em seguida, pode usar o boto Iniciar na Caixa de ferramentas do OmniPage para processar um novo documento do incio ao fim ou reiniciar e terminar o processamento de um documento aberto.
Boto Iniciar Boto Obter pgina Boto Efetuar OCR Boto Exportar resultados

Lista suspensa Obter pgina

Lista suspensa Resultados da exportao

Lista suspensa Descrio do layout

1. Selecione a configurao Obter pgina desejada na lista suspensa. Voc define a origem de documentos, que pode ser de arquivos de imagem ou de um scanner. Consulte Definio da origem das imagens de pgina na pgina 50. 2. Selecione uma configurao na lista suspensa Descrio do Layout, conforme exibido acima. Isto guia o programa no zoneamento automtico das pginas. Voc descreve as pginas de entrada ou especifica um arquivo de gabarito de zonas. Consulte Descrio do layout de documento na pgina 53. 3. Selecione uma configurao da lista suspensa Exportar resultados. Voc pode salvar o documento como um arquivo de Documento do OmniPage. Voc pode salvar pginas (atual, selecionadas, todas) em um arquivo, copilas para a rea de transferncia ou envi-las como anexos de e-mail. Consulte Gravao e exportao na pgina 81.

40

Processamento de documentos

Captulo 3

4. Escolha na barra de ferramentas Padro ou Opes no menu Ferramentas e verifique se as configuraes so apropriadas para o documento. Voc pode, por exemplo, especificar idiomas de reconhecimento e se deseja corrigir o documento ou no. Consulte Configuraes na pgina 33. 5. Clique no boto Iniciar ou escolha Iniciar processamento automtico no menu Processar. Cada pgina no documento processada e terminada uma aps a outra. O programa pode realizar tarefas simultaneamente, por exemplo, pode iniciar a carregar e a reconhecer uma nova pgina conforme voc corrige a pgina anterior.

Interromper e reiniciar o processamento automtico


Interromper: Quando o processamento automtico estiver em andamento, o boto Iniciar transforma-se em Interromper. Clique nele para interromper o processamento automtico. Voc pode fazer isto se achar que algumas configuraes precisam ser alteradas. Reiniciar: Quando o processamento automtico for interrompido, o boto Iniciar restaurado. Clique nele para reiniciar o processamento. A caixa de dilogo Processamento automtico permite que voc especifique o que deseja fazer: x Concluir o processamento de pginas no reconhecidas e no corrigidas e em seguida exportar os resultados. x Exportar novamente um documento j salvo, talvez com alteraes, para um tipo diferente de arquivo, nome ou local ou com nvel de formatao diferente. x Acrescentar mais pginas da mesma origem ou uma origem diferente, com configuraes alteradas ou no. x Processar novamente todas as pginas para descartar todos os resultados de reconhecimento e reconhecer novamente todas as pginas no documento com configuraes diferentes. Voc pode especificar zoneamento automtico ou um arquivo de gabarito. Isso pode ser til caso uma configurao indesejada tenha causado resultados ruins em todas as pginas. Um exemplo uma escolha de idioma incorreto, o que resulta em quase todas as palavras marcadas como suspeitas durante a correo. Esta opo permite que voc realize novo reconhecimento sem ter que digitalizar, carregar ou refazer as zonas de todas as imagens novamente.

Processamento automtico

41

Processamento manual
O processamento manual lhe d controle mais preciso sobre a forma com que as suas pginas so tratadas. Voc pode processar o documento pgina a pgina com configuraes diferentes para cada pgina. O programa tambm pra entre cada etapa: obteno de imagens, realizao de reconhecimento, exportao. Isto permite, por exemplo, alterar o fundo da pgina e delimitar zonas manualmente em cada pgina. Voc pode iniciar cada etapa do processo clicando nos trs botes numerados na Caixa de ferramentas do OmniPage. 1. Clique em na barra de ferramentas Padro ou em Opes no menu Ferramentas para verificar ou fazer configuraes na caixa de dilogo Opes. Consulte Configuraes na pgina 33. 2. Selecione o valor desejado para o boto Obter pgina na lista suspensa. Voc define a origem de documentos, que pode ser de arquivos de imagem ou de um scanner. Ao digitalizar, selecione um modo de digitalizao e use os painis Scanner e Processo da caixa de dilogo Opes para selecionar as configuraes. Consulte Definio da origem das imagens de pgina na pgina 50. 3. Clique no boto Obter pgina. Isto faz aparecer a caixa de dilogo Carregar arquivo de imagem permitindo que voc nomeie arquivos de imagem ou inicie a digitalizao. Imagens em miniatura de cada pgina podem aparecer no Painel de imagem, juntamente com a imagem da pgina atual. Use os botes da barra de status para exibir ou ocultar qualquer uma delas. As pginas obtidas esto resumidas no Gerenciador de documentos. 4. As imagens de todas as pginas entram no programa com plano de fundo configurado para processar. Desde que voc no desenhe zona alguma nestas pginas, elas sero zoneadas automaticamente quando for solicitado o reconhecimento. 5. Voc pode delimitar e modificar zonas manualmente em uma ou mais imagens e atribuir propriedades de zona. Os botes da barra de status permitem que voc v para outras pginas. Assim que voc desenha uma zona em uma pgina, ela assume um plano de fundo do tipo ignorar. Voc pode especificar zoneamento automtico em partes de uma pgina ao desenhar zonas do tipo processar. Consulte Zonas e planos de fundo na pgina 54.

42

Processamento de documentos

Captulo 3

6. Selecione o valor para o boto Efetuar OCR. Voc descreve o layout das pginas de entrada. Este valor exerce influncia se o zoneamento automtico for executado em todas as pginas. Consulte Descrio do layout de documento na pgina 53. Voc tambm pode selecionar um gabarito para ter suas zonas colocadas na pgina atual. Consulte Uso de gabaritos de zonas na pgina 63. 7. Clique no boto Efetuar OCR para que a pgina atual seja reconhecida. Para reconhecer as pginas selecionadas, faa vrias selees com miniaturas no Gerenciador de documentos (Consulte Gerenciamento de documentos na pgina 28.) e, em seguida, clique no boto Efetuar OCR. Pginas reconhecidas aparecem no Editor de texto. 8. Se voc tiver solicitado correo, a caixa de dilogo Corretor de OCR exibe as palavras suspeitas das pginas reconhecidas, uma aps a outra. Voc pode corrigir e editar o texto reconhecido. Consulte Correo de resultados de OCR na pgina 67. 9. Continue a carregar pginas, realizar OCR, editar, corrigir e verificar conforme desejado. Voc pode alterar a ordem de leitura dos elementos da pgina no Editor de texto. Consulte Edio de texto e de imagem na pgina 75. 10. Selecione um valor para o boto Exportar resultados. Voc pode salvar o documento como um arquivo de Documento do OmniPage. Voc pode salvar pginas (atual, selecionadas ou todas) em um arquivo, copi-las para a rea de transferncia ou envi-las como anexos de e-mail. Clique no boto Exportar resultados. Consulte Gravao e exportao na pgina 81.

Processamento combinado
Processamento automtico oferece velocidade e eficincia. Processamento manual exige mais ateno mas proporciona um maior controle sobre os resultados. possvel aproveitar ambas as vantagens ao processar um nico documento. Iniciar automaticamente e terminar manualmente: Quando h um documento grande com somente algumas pginas precisando de ateno especial, voc no tem que processar manualmente todo o documento. Voc pode process-lo automaticamente e visualizar os resultados no Editor de texto. Voc pode determinar quais pginas esto em ordem e quais precisam de configuraes diferentes ou algum zoneamento manual. Depois de ajustar as

Processamento combinado

43

configuraes e/ou modificar as zonas, use o processamento manual para reconhecer novamente apenas aquelas pginas. 1. Prepare o documento e realize processamento automtico, como j descrito. 2. Se voc fechar ou terminar de corrigir, ser convidado a salvar o documento. Isto recomendado mesmo se o documento no estiver em sua forma final. 3. Selecione uma pgina que esteja precisando de um novo zoneamento ou modifique as zonas existentes no Painel de imagem. Voc tambm pode carregar um gabarito para fazer com que suas zonas substituam as existentes. Delimite novas zonas, conforme desejado. Consulte Zonas e planos de fundo na pgina 54. 4. Altere as outras configuraes conforme necessrio para a pgina atual. Consulte Configuraes na pgina 33. 5. Clique no boto Efetuar OCR para reconhecer novamente a pgina atual. Confirme que os resultados de reconhecimento anterior devem ser sobrescritos. Outra alternativa usar o processamento em tempo real para tratar de mudanas de zoneamento sem precisar reconhecer novamente toda a pgina. Consulte Edio em tempo real na pgina 77. 6. Para reconhecer novamente mais de uma pgina, selecione as pginas necessrias nas miniaturas ou no Gerenciador de documentos antes de clicar no boto Efetuar OCR. 7. Quando todas as pginas tiverem sido reconhecidas novamente com resultados aceitveis, salve o documento novamente. Iniciar e manualmente terminar automaticamente: 1. Prepare as configuraes e obtenha imagens para o documento clicando no boto Obter pgina. 2. Examine as pginas para ver se o brilho, orientao e contedo so adequados. Digitalize novamente ou gire imagens inadequadas. Reorganize as pginas conforme desejar. 3. Crie zonas manualmente para as pginas nas quais deseja processar apenas parte da imagem ou se desejar fornecer instrues de zoneamento precisas. Use planos de fundo ou zonas do tipo ignorar para excluir reas do processamento. Use planos de fundo ou zonas do tipo processar para especificar reas a serem zoneadas automaticamente. 4. Clique no boto Iniciar e ento escolha Concluir processamento de pginas existentes na caixa de dilogo Processamento automtico. 5. Depois de corrigir (caso solicitado), voc pode salvar ou exportar o documento.

44

Processamento de documentos

Captulo 3

Processamento com o Assistente de OCR


O Assistente de OCR pode ser usado para iniciar o processamento de um novo documento. Se voc selecion-lo com um documento aberto, ele ser fechado. O Assistente o conduz atravs de seis painis de configurao, guiando-o para fazer as configuraes em seu documento e, em seguida, iniciando o processamento automtico. A ajuda sensvel ao contexto est disponvel para todos os painis do Assistente. Clique no boto Assistente de OCR na Caixa de ferramentas do OmniPage para visualizar a primeira tela do assistente: 1. O primeiro painel permite que voc defina a origem de documentos: scanner ou arquivo de imagem. Consulte Definio da origem das imagens de pgina na pgina 50. Responda pergunta na primeira tela e, em seguida, clique em Avanar. 2. O segundo painel lhe pede para descrever o layout do documento de entrada, para auxiliar o zoneamento automtico. Consulte Descrio do layout de documento na pgina 53. 3. O terceiro painel permite que voc defina os idiomas de reconhecimento. Os idiomas com suporte de dicionrio possuem o cone de um livro aberto. As escolhas mais recentes encontram-se no topo da lista. 4. O quarto painel lhe pergunta se voc deseja corrigir o texto antes de export-lo. Se voc escolher Sim, tambm pode editar o texto antes de salvlo. Voc tambm decide se cria e usa os dados do IntelliTrain durante a correo. Consulte IntelliTrain na pgina 72. As referncias a IntelliTrain no se aplicam ao OmniPage SE. 5. O ltimo painel lhe pede para definir a escolha de exportao: salvar em arquivo ou copiar para rea de transferncia. Aps configurar sua escolha, clique em Concluir para fechar o Assistente e iniciar o processamento automtico. 6. Se voc tiver requisitado correo e o texto contiver palavras suspeitas, a caixa de dilogo Corretor de OCR aparecer. Quando a correo estiver concluda ou fechada, a caixa de dilogo Copiar para rea de transferncia ou Copiar como permite que voc especifique as configuraes de exportao de arquivo, incluindo o intervalo de pginas e o nvel de formatao. 7. O documento continua no OmniPage SE. Voc pode editar os resultados de reconhecimento e salv-los novamente com outros formatos. Voc pode alterar manualmente as zonas ou alterar outras configuraes e, em seguida,

Processamento com o Assistente de OCR

45

usar processamento manual para reconhecer novamente pginas nicas do documento. Voc pode adicionar pginas com ou sem processamento manual.

Os painis do Assistente apresentam configuraes na forma como foram definidas pela ltima vez no programa. Alm disso, o OmniPage SE lembrar das configuraes que voc fizer nos painis do Assistente de OCR e as aplicar em um processamento automtico ou manual futuro, at que voc as altere. Portanto, se voc tiver mais documentos para os quais suas configuraes do Assistente de OCR forem adequadas, basta clicar em Iniciar na Caixa de ferramentas do OmniPage. As configuraes aplicveis no oferecidas pelo Assistente de OCR utilizam os ltimos valores definidos no programa. Isto diz respeito principalmente a configuraes do scanner, a um dicionrio de usurio ou a um arquivo de treinamento. Os gabaritos de zonas no podem ser usados com o Assistente de OCR. Se um arquivo de gabaritos foi definido, quando o Assistente de OCR comear, ele ser descarregado e Automtico ser definido como descrio de entrada. Voc no pode exportar um documento reconhecido como um anexo de correio. Use o processamento automtico ou manual para isso.

Processamento a partir de outros aplicativos


Voc pode usar o recurso Direct OCRTM para chamar os servios de reconhecimento do OmniPage SE enquanto trabalha em seu processador de texto normal ou em outro aplicativo. Primeiramente, voc precisa estabelecer a conexo direta com o aplicativo. Em seguida, dois itens em seu menu Arquivo abrem a porta para os recursos de OCR.

Como configurar o Direct OCR


1. Inicie o aplicativo que voc deseja conectar ao OmniPage SE. Inicie o OmniPage SE, abra a caixa de dilogo Opes no painel Direct OCR e selecione Ativar o Direct OCR. 2. Selecione as opes de processamento para correo e zoneamento. Estas funcionaro para futuros trabalhos do Direct OCR at serem modificadas novamente; elas no so aplicadas quando o OmniPage SE for usado sozinho.

46

Processamento de documentos

Captulo 3

3. O painel No registrados exibe os aplicativos registrados anteriormente ou em execuo. Selecione nos desejados e clique em Adicionar. Voc pode procurar por um aplicativo no listado.

Como usar o Direct OCR


1. Abra o aplicativo registrado e trabalhe em um documento. Para obter resultados de reconhecimento de pginas digitalizadas, coloque-as corretamente no scanner. 2. Use o item Definies para obter texto... do menu Arquivo do aplicativo de destino para especificar as configuraes a serem usadas durante o reconhecimento. Todas as configuraes no oferecidas obtm seus valores com base nos ltimos valores usados no OmniPage SE. As configuraes alteradas para o Direct OCR tambm so alteradas no OmniPage SE. 3. Use o item Obter texto do menu Arquivo para obter imagens do scanner ou do arquivo. 4. Se voc tiver selecionado Delimitar zonas automaticamente no painel Direct OCR da caixa de dilogo Opes ou sob Definies para obter texto..., o reconhecimento comea imediatamente. 5. Se Delimitar zonas automaticamente no estiver selecionado, cada imagem da pgina ser apresentada, permitindo que voc delimite as zonas manualmente. Clique no boto Efetuar OCR para continuar com o reconhecimento. 6. Se a correo tiver sido especificada, ela ser feita aps o reconhecimento. Em seguida, o texto reconhecido colocado na posio do cursor em seu aplicativo, com o nvel de formatao especificado por Definies para obter texto... .
Se o OmniPage SE estiver sendo executado quando o Direct OCR for chamado de um aplicativo de destino, uma segunda instncia de OmniPage SE acionada. Consulte os tpicos sobre o Direct OCR na Ajuda on-line para obter mais informaes. Eles incluem um tpico Perguntas e respostas sobre o Direct OCR. O arquivo Leiame e o site da ScanSoft podem trazer informaes mais recentes relacionadas a aplicativos de destino especficos.

Processamento a partir de outros aplicativos

47

Como usar o OmniPage SE com o PaperPort


O PaperPort um software de gerenciamento de papis da ScanSoft. Ele permite que voc associe pginas a aplicativos adequados. As pginas podem conter figuras, texto ou ambos. Se o PaperPort existir em um computador com o OmniPage SE, os seus servios de OCR ficam disponveis e amplificam o poder do PaperPort. Voc pode escolher um programa de OCR clicando com o boto direito em um vnculo de aplicativos de texto do PaperPort, selecionando Preferncias e, em seguida, selecionando OmniPage SE 2.0 como o pacote de OCR. As configuraes de OCR podem ser especificadas, assim como ocorre no Direct OCR.
:

Aqui, o OmniPage SE foi selecionado como o pacote de OCR para MS Word 2000. Voc pode arrastar imagens de pgina da rea de trabalho do PaperPort para o vnculo do MS Word no PaperPort. Enquanto o texto estiver sendo reconhecido, somente um monitor de progresso ser exibido. A janela de zoneamento manual ou o recurso de correo do OmniPage SE aparecer se solicitado. Os resultados de reconhecimento so colocados em um novo documento no nomeado no aplicativo de destino.

48

Processamento de documentos

Captulo 3

Processamento de documentos com Programar OCR


O OmniPage SE no oferece suporte para o recurso Programar OCR. O texto a seguir aplica-se somente ao OmniPage Pro. Voc pode programar os trabalhos de OCR para que sejam realizados automaticamente a qualquer momento dentro dos prximos oito dias. Cada tarefa trata um documento. As pginas do documento podem vir de um scanner com ADF ou de arquivos de imagem. Voc no tem que estar presente diante de seu computador no momento da tarefa nem o OmniPage SE tem que estar sendo executado. No importa se o computador desligado aps a tarefa ser configurada, contanto que ele esteja funcionando na hora do incio da tarefa. Se voc estiver digitalizando pginas, o scanner precisa estar funcionando na hora do incio da tarefa, com as pginas carregadas no ADF. Veja como configurar um trabalho: 1. Clique em Programar OCR no menu Processar ou no menu Iniciar do Windows: selecione Programas ScanSoft OmniPage Pro 12.0 Programar OCR.

2. A caixa de dilogo Programar OCR aparece. Clique em Novo... para iniciar o Assistente de nova tarefa. Ele o conduz por seis painis, semelhantes aos do Assistente de OCR. 3. No primeiro painel, voc define a origem da imagem: scanner com ADF ou arquivo. 4. Os prximos dois painis so semelhantes aos do Assistente de OCR, mas voc tambm pode especificar um dicionrio de usurio ou profissional e um arquivo de treinamento. Se o IntelliTrain executado ou no, depende da configurao do OmniPage Pro na hora da tarefa. 5. Os seguintes painis permitem que voc especifique o nome, o tipo, o local do arquivo de exportao, uma opo de separao de arquivo e um nvel de formatao. 6. Os dois ltimos painis permitem definir a hora de incio e (quando aplicvel) fim da tarefa e manter ou excluir arquivos de entrada depois do processamento. Clique em Concluir para fechar o Assistente.
A caixa de dilogo Programar OCR lista todas as tarefas, com status Esperando, Em execuo, Erro ou Concludo. Use Modificar tarefa... para alterar as configuraes para uma tarefa em espera. Voc pode visualizar, modificar e reutilizar as tarefas concludas para processar novas tarefas que precisem de configuraes semelhantes. Voc pode excluir as tarefas concludas quando no forem mais necessrias.

Processamento de documentos com Programar OCR

49

Definio da origem das imagens de pgina


H duas origens de imagens possveis: de arquivos de imagem e de um scanner. Existem dois tipos principais de scanners: plano ou de alimentao de folhas. Um scanner pode ter um alimentador de documentos automtico (ADF) incorporado, o que torna mais fcil digitalizar documentos de vrias pginas. As imagens de documentos digitalizados podem ser inseridas diretamente no OmniPage SE ou podem ser salvas com o prprio software do scanner em um arquivo de imagem, que o OmniPage SE pode abrir posteriormente.

Entrada de arquivos de imagem


Voc pode criar arquivos de imagem a partir de seu prprio scanner ou receblos via e-mail ou fax. O OmniPage SE pode abrir uma ampla gama de tipos de arquivos de imagem. Consulte Tipos de arquivo para abrir e salvar imagens na pgina 98. Selecione Carregar arquivo de imagem na lista suspensa Obter pgina. Os arquivos so especificados na caixa de dilogo Carregar arquivo de imagem. Isto aparece quando voc inicia o processamento automtico. No processamento manual, clique no boto Obter pgina ou use o menu Processar. A parte inferior da caixa de dilogo fornece configuraes avanadas e pode ser exibida ou ficar oculta. Aqui, ela exibida.
Esta a pasta atual. Use Shift+ cliques ou Ctrl+cliques para colocar mais de um arquivo na caixa de texto do Nome de arquivo. Especifique os tipos de arquivo que voc deseja listados. Selecione essa opo para ver uma miniatura do arquivo selecionado. No disponvel quando so selecionados vrios arquivos.

Clique em Avanado para abrir o painel inferior e Bsico para fech-lo. Use isto para adicionar arquivos de pastas diferentes e para controlar precisamente a ordem dos arquivos.

Isto pode ser usado para arquivos DCX, MAX e TIFF de vrias pginas.

Use estas setas para alterar a ordem dos arquivos.

50

Processamento de documentos

Captulo 3

Normalmente, o boto Adicionar coloca cada arquivo na parte final da lista de arquivos. Para colocar um arquivo em um local diferente, destaque um arquivo na lista. O novo arquivo ser adicionado imediatamente abaixo do mais baixo arquivo em destaque.

Entrada do scanner
Voc precisa ter um scanner compatvel em funcionamento instalado corretamente com o OmniPage SE. Consulte Configurao do scanner com OmniPage SE na pgina 14. Voc tem uma opo de modos de digitalizao. Ao fazer sua opo, h duas consideraes principais:
x x

Que tipo de sada voc deseja no documento de exportao? Que modo fornecer melhor preciso de OCR?

Digitalizao em preto e branco Selecione isto para digitalizar em preto e branco. Isto no adequado se voc deseja cores no documento de sada, nem se voc quer que as imagens se paream com as fotografias 'preto e branco': elas precisam de digitalizao em tons de cinza. Para obter melhor preciso de OCR, use isto para textos ntidos em preto sobre fundo branco ou claro. As imagens em preto e branco podem ser digitalizadas e tratadas mais rapidamente do que outras e ocupam menos espao em disco. Digitalizar em tons de cinza Selecione isto para usar digitalizao em tons de cinza. Escolha isto para manter as fotografias em preto e branco no documento de sada. Para obter melhor preciso de OCR, use isto para as pginas com contraste variado ou baixo (sem muita diferena entre claro e escuro) e com texto em fundos sombreados ou coloridos. Digitalizar em cores Selecione isto para digitalizar em cores. Isso funcionar apenas com scanners coloridos. Escolha isto se voc deseja imagens grficas, textos ou fundos coloridos no documento de sada. Em termos de preciso de OCR, ela no oferece mais benefcios do que a digitalizao em tons de cinza (para uma determinada resoluo), mas precisar de muito mais tempo, recursos de memria e espao em disco. Brilho e contraste Boas configuraes de brilho e contraste so importantes na preciso de OCR. Configure isso no painel Scanner da caixa de dilogo Opes ou na interface de seu scanner. O diagrama ilustra uma configurao tima de brilho. Aps carregar uma imagem, verifique sua aparncia. Se os caracteres estiverem espessos e se tocando, clareie o brilho. Se os caracteres estiverem finos e quebrados, escurea-o. Em seguida, digitalize novamente a pgina.

Definio da origem das imagens de pgina

51

Inadequada

Tolervel

Boa Melhor Boa Tolervel Inadequada

Digitalizao com um ADF


A melhor forma de digitalizar documentos de vrias pginas usar um alimentador automtico de documentos (ADF). Basta carregar as pginas no ADF na ordem correta. Coloque pginas em branco se voc quiser salvar o documento em vrios arquivos de sada usando a opo Criar um novo arquivo a cada pgina em branco. Consulte Gravao dos resultados de reconhecimento na pgina 83. Se voc tiver um documento um pouco maior do que a capacidade do ADF, selecione Solicitar mais pginas automaticamente no painel Processar da caixa de dilogo Opes. Em seguida, uma caixa de dilogo deixa que voc adicione mais lotes de pginas e sinaliza quando todas as pginas so digitalizadas. Voc pode digitalizar documentos frente e verso com um ADF. Um scanner duplex gerenciar isto automaticamente. Para scanners no duplex, selecione Digitalizar pginas com frente e verso no painel Scanner da caixa de dilogo Opes. Em seguida, voc pode digitalizar o documento em alguns passos, com as pginas pares agrupadas e as mpares tambm agrupadas. O OmniPage SE mesclar as pginas para voc.

52

Processamento de documentos

Captulo 3

Digitalizao sem um ADF


Voc pode digitalizar documentos de vrias pginas de forma eficaz com um scanner plano, mesmo sem um ADF. Selecione Digitalizar pginas automaticamente no painel Scanner da caixa de dilogo Opes e defina um valor de pausa em segundos. O scanner far as passagens de digitalizao automaticamente, pausando entre cada digitalizao o nmero definido de segundos, dando-lhe tempo para colocar a prxima pgina. Uma caixa de dilogo permite terminar a pausa logo ou solicitar uma pausa maior e especificar quando a ltima pgina digitalizada. O OmniPage Pro 12 permite digitalizar duas pginas de um livro por vez. O programa divide as imagens recebidas em duas pginas e as desinclina de forma independente. Esse recurso no est disponvel no OmniPage SE.

Descrio do layout de documento


Antes de iniciar o reconhecimento, voc solicitado a descrever o layout das pginas de entrada, para auxiliar o processo de zoneamento automtico. Quando voc usa o Assistente de OCR, o zoneamento automtico funciona sempre. Quando voc usa o processamento automtico, o zoneamento automtico sempre executado, a menos que voc especifique um gabarito que no contenha uma zona ou plano de fundo do tipo processar. Quando voc faz processamento manual, o zoneamento automtico algumas vezes executado. Consulte o tpico Quando o zoneamento automtico executado? da Ajuda online. Aqui esto as suas opes de descrio de entrada: Automtico Escolha isto para permitir que seu programa tome todas as decises de zoneamento automtico. Ele decide se o texto est em colunas ou no, se um item um texto ou uma imagem grfica a ser reconhecida e se devem ser colocadas tabelas ou no. Escolha Automtico se o seu documento contm pginas com layouts diferentes ou desconhecidos. Escolha-o para uma pgina com vrias colunas e uma tabela e para pginas com mais de uma tabela. Coluna nica, sem tabela Escolha esta configurao se as suas pginas contm s uma coluna de texto e no contm tabela. As cartas comerciais ou pginas de um livro normalmente so assim. Escolha-a tambm para uma pgina com palavras ou nmeros arrumados em colunas se voc no quiser que eles sejam arrumados em uma tabela, dispostos sem colunas ou tratados como colunas separadas. As imagens grficas podem ser detectadas.

Descrio do layout de documento

53

Vrias colunas, sem tabela Escolha esta opo se algumas de suas pginas contiverem texto em colunas e voc quiser que percam as colunas ou que as colunas continuem separadas, semelhante ao layout original. Para manter as colunas com quadros no documento de sada, selecione True Page no momento da exportao. A exportao de pgina ligada do OmniPage Pro 12 mantm as colunas sem quadros. Se forem encontrados dados tabulares, provavelmente sero tratados como texto ligado. As imagens grficas podem ser detectadas. Coluna nica, com tabela Escolha esta configurao se a sua pgina contm s uma coluna de texto e uma tabela. O zoneamento automtico no procurar por colunas mas tentar encontrar uma tabela e a colocar em uma grade no Editor de texto. Posteriormente, voc pode especificar se deseja exportar em uma grade ou como colunas de texto separadas por tabulao. As imagens grficas podem ser detectadas. Planilha Escolha isto se toda a sua pgina consiste em uma tabela que voc deseja exportar para um programa de planilha ou tratar como uma tabela. Nem texto ligado nem zonas grficas sero detectadas. Personalizado Escolha isto para controle mximo sobre zoneamento automtico. Voc pode impedir ou incentivar a deteco de colunas, imagens grficas e tabelas. Faa as suas configuraes no painel Layout personalizado da caixa de dilogo Opes. Gabarito Escolha um arquivo de gabarito de zonas se voc deseja que seu valor de plano de fundo, zonas e propriedades sejam aplicados a todas as pginas obtidas a partir de agora. As zonas de gabarito tambm so aplicadas pgina atual, substituindo todas as zonas existentes. Elas tambm sero aplicadas a pginas pr-existentes sem zonas quando elas forem reconhecidas novamente. Consulte Uso de gabaritos de zonas na pgina 63. Se o zoneamento automtico forneceu resultados no esperados de reconhecimento, use processamento manual para fazer novo zoneamento em pginas individuais e reconhec-las novamente.

Zonas e planos de fundo


As zonas definem reas na pgina a serem processadas ou ignoradas. As zonas so retangulares ou irregulares, com os lados formados por linhas verticais ou horizontais. As imagens na pgina de um documento tm um valor de plano de fundo: processar ou ignorar (este ltimo mais comum). Os valores de plano de

54

Processamento de documentos

Captulo 3

fundo podem ser mudados com as ferramentas mostradas. Zonas podem ser desenhadas em planos de fundo de pgina com as seguintes ferramentas:
Planos de fundo Zonas

Processar Processar

Ignorar Imagens Ignorar Texto Tabela grficas

reas do tipo processar (em zonas ou planos de fundo do tipo processar) so zoneadas automaticamente quando so enviadas para reconhecimento. reas do tipo ignorar (em zonas ou planos de fundo do tipo ignorar) so descartadas pelo processamento. Nenhum texto reconhecido e nenhuma imagem transferida.

Zoneamento automtico
O zoneamento automtico permite que o programa detecte blocos de texto, ttulos, figuras e outros elementos em uma pgina e desenhe zonas em torno deles. Ele atribui tipos de zonas e propriedades quelas zonas. O zoneamento automtico executado em pginas inteiras quando voc usa o processamento automtico, a menos que voc tenha carregado um gabarito. Ele executado quando voc usa o Assistente de OCR. Voc pode tambm especificar o zoneamento automtico ao usar o processamento manual, da seguinte maneira: Zoneamento automtico de uma pgina inteira Obter uma pgina: Ela aparece com um plano de fundo do tipo processar. No desenhe nenhuma zona nela e verifique na lista suspensa Descrio de layout que nenhum gabarito de zona foi carregado. Clique no boto Executar OCR. Voc pode selecionar vrias pginas sem zonas para que elas sejam zoneadas automaticamente e reconhecidas juntas. Zoneamento automtico de parte de uma pgina Obter uma pgina: Ela aparece com um plano de fundo do tipo processar. Desenhar uma zona. O plano de fundo muda para ignorar. Desenhe zonas de texto, tabela ou imagens grficas para circundar reas que voc quer que sejam zoneadas manualmente. Desenhe zonas do tipo processar para circundar reas que voc deseja que sejam zoneadas automaticamente, Depois do reconhecimento, as zonas do tipo processar sero substitudas por uma ou mais zonas de texto, tabelas ou imagens grficas. Zoneamento automtico do plano de fundo de uma pgina Obter uma pgina: Ela aparece com um plano de fundo do tipo processar. Desenhar uma zona. O plano de fundo muda para ignorar. Desenhe zonas de

Zonas e planos de fundo

55

texto, tabela ou imagens grficas para circundar reas que voc quer que sejam zoneadas manualmente. Clique na ferramenta Plano de fundo processar (mostrado) para definir um plano de fundo do tipo processar. Desenhe zonas do tipo ignorar em partes da pgina que voc no precisa. Depois do reconhecimento a pgina voltar com um plano de fundo do tipo ignorar e novas zonas em torno de todos os elementos encontrados no plano de fundo.

Zoneamento manual
Primeiro apresentamos dois exemplos de zonas e planos de fundo. Em seguida detalharemos os tipos de zona. Por fim, explicaremos como desenhar e trabalhar com zonas. Nestes exemplos, os nmeros referem-se tabela na pgina seguinte.

Desenhar zonas em um plano de fundo do tipo ignorar:


Antes do reconhecimento: Depois do reconhecimento: Plano de fundo permanece como ignorar.

A zona 4 retorna como um conjunto de zonas, neste caso para tratar trs colunas de texto e uma foto.

Desenhar zonas em um plano de fundo do tipo processar:


Antes do reconhecimento: Depois do reconhecimento: O plano de fundo alterado para ignorar.

A zona 6 absorvida no plano de fundo. Todas as zonas no lado esquerdo da pgina foram criadas automaticamente.

56

Processamento de documentos

Captulo 3

N 1 2 3 4 5 6 7

Tipo Zona de texto Zona de tabelas Zona grfica Zona do tipo processar Planos de fundo do tipo processar Ignorar zona Planos de fundo do tipo ignorar

O que acontece: OCR executado e gera texto. O OCR executado, o texto colocado em uma grade de tabela. A imagem embutida na pgina reconhecida. O zoneamento automtico cria uma ou mais zonas, decide seus tipos e processa seus contedos.

Nada

Zonas desenhadas automaticamente e zonas de gabarito tm molduras slidas:

Zonas desenhadas manualmente ou modificadas tm molduras pontilhadas:

Zonas no tm uma ordem de leitura. A reorganizao de elementos reconhecidos pode ser feita no Editor de texto. Consulte Edio de texto e de imagem na pgina 75. O zoneamento em tempo real descrito em Captulo 4. Consulte Edio em tempo real na pgina 77.

Tipos de zona e propriedades


Cada zona tem um tipo de zona. As zonas contendo texto tambm podem ter uma configurao de contedo de zona: alfanumrica ou numrica. O tipo de zona e o contedo da zona juntos constituem as propriedades da zona. Clique com o boto direito na zona para obter um menu de atalho que permita que voc altere as propriedades da zona. Selecione vrias zonas com Shift+click para alterar as suas propriedades com uma ao. A barra de ferramentas Imagem fornece cinco ferramentas para desenhar zonas, uma para cada tipo. O tipo da zona indicado por um cone em seu canto superior esquerdo e pelo cone e pela cor da moldura da zona. Aqui esto as ferramentas e as cores: Zona do tipo processar (cor de oliva) Use isso para desenhar uma zona do tipo processar, para definir a rea de uma pgina onde o zoneamento automtico ser realizado. Depois do

Zonas e planos de fundo

57

reconhecimento, esta zona ser substituda por uma ou mais zonas com tipos de zona determinados automaticamente. Normalmente, voc desenha zonas do tipo processar em um plano de fundo do tipo ignorar. Desenhe uma zona do tipo processar para circundar colunas de texto para que elas sejam tratadas automaticamente. Elas perdero a estrutura de colunas na visualizao NF e RFP do Editor de texto, mas sero mantidas em colunas na visualizao True Page. Zona do tipo ignorar (cinza) Use isto para desenhar uma zona do tipo ignorar, para definir uma rea de pgina que voc no quer que seja transferida para o Editor de texto. O zoneamento automtico no colocar zonas aqui. Para excluir uma dada rea da pgina em muitas pginas (por exemplo um ttulo ou a numerao da pgina), coloque uma zona do tipo ignorar em um gabarito. Normalmente voc desenha zonas do tipo ignorar em um plano de fundo do tipo processar. Zona de texto (marrom) Use isso para desenhar uma zona de texto. Desenhe esta zona sobre um bloco nico de texto. O contedo da zona ser tratado como texto ligado, sem encontrar colunas. Se voc deseja que colunas de texto sejam tratadas automaticamente, circunde-as em uma zona do tipo processar. Zona de tabelas (azul) Use isto para que o contedo da zona seja tratado como uma tabela. As grades de tabela podem ser detectadas automaticamente ou colocadas manualmente como descritas na prxima seo. As zonas de tabelas precisam ser retangulares. O Editor de texto exibe a tabela em uma grade editvel. Para muitos tipos de arquivo de sada, voc pode escolher se deseja exportar as tabelas em grades ou em colunas separadas por tabulaes. Zona grfica (verde) Use isto para incorporar uma figura, diagrama, desenho, assinatura ou qualquer coisa que voc quer transferir para o Editor de texto como uma imagem incorporada e no como texto reconhecido. As imagens incorporadas podem ser exportadas com o documento para os aplicativos de destino que suportam imagens grficas.

Zonas de texto e tabela tm uma configurao do contedo da zona. O contedo alfanumrico valida todos os caracteres necessrios para a sua opo de idioma. Os resultados de reconhecimento de uma zona numrica contero somente nmeros e pontuao relativa a nmero. Nenhuma letra ser colocada. Use o menu de atalho da zona para alterar esta configurao. Clique com o boto direito do mouse fora de uma zona para obter um menu de atalho adaptado para a imagem inteira. Isto permite que voc amplie, reduza ou gire a imagem. Quando uma imagem gira, todas as zonas nela so excludas.

58

Processamento de documentos

Captulo 3

Trabalho com zonas


A barra de ferramentas Imagem fornece ferramentas de edio de zonas. Uma sempre selecionada. Quando voc no quiser mais o servio de uma ferramenta, clique em uma ferramenta diferente. Algumas ferramentas nesta barra de ferramentas so agrupadas. Apenas a ltima ferramenta selecionada do grupo visvel. Para selecionar uma ferramenta visvel, clique nela. Para selecionar uma ferramenta oculta, mantenha o boto do mouse pressionado no tringulo no canto inferior direito da ferramenta visvel at que as demais ferramentas apaream, ento clique na ferramenta desejada. Desenhar uma zona nica Selecione a ferramenta de desenhar zonas do tipo desejado, em seguida clique e arraste o cursor. Nestes exemplos, isso mostrado por uma seta indo de A a B. Tambm possvel arrastar do canto superior esquerdo para o canto inferior direito. Apenas zonas retangulares podem ser desenhadas; zonas (exceto zonas de tabela) podem se tornar irregulares depois de desenhadas. Para redimensionar uma zona, selecione-a com um clique, mova o cursor para uma das laterais ou cantos, apanhe uma ala e mova-a para o local desejado. Para mover uma zona, selecione-a com a ferramenta de seleo de zona e mova-a conforme desejar. Voc no pode mover uma zona de modo que ela venha a sobrepor outra zona. Criar uma zona irregular por adio Desenhe uma zona que parcialmente se sobreponha a outra do mesmo tipo:
zona existente zona resultante

nova zona

Zonas e planos de fundo

59

Junte duas zonas do mesmo tipo Desenhe uma zona que parcialmente se sobreponha duas zonas do mesmo tipo.

zonas existentes

nova zona

zona resultante

Criar uma zona irregular por subtrao Desenhe uma zona sobreposta do mesmo tipo do plano de fundo (neste exemplo, um plano de fundo do tipo ignorar).
zona existente em um plano de fundo do tipo ignorar

nova zona do tipo ignorar

zona resultante

Dividir uma zona Desenhe uma zona divisora do mesmo tipo do plano de fundo (neste exemplo, um plano de fundo do tipo processar).
zona de texto existente em um plano de fundo do tipo processar

nova zona do tipo processar

zonas resultantes

60

Processamento de documentos

Captulo 3

Os seguintes formatos de zona so proibidos:


Recuada ao longo da parte inferior Recuada ao longo da parte superior Com um furo no meio

Para expandir uma zona mais rapidamente do que usando as alas de redimensionamento, desenhe uma zona do mesmo tipo para delimit-la completamente. A zona menor substituda pela maior. Para substituir um conjunto de zonas de qualquer tipo por uma nica zona, desenhe uma zona maior do tipo desejado para delimit-las completamente. Todas as zonas menores so substitudas pela maior. Quando voc desenha uma nova zona que se sobrepe parcialmente a uma zona existente de um tipo diferente, na verdade ela no a sobrepe; a nova zona substitui a parte sobreposta da zona existente. Os diagramas no tpico Desenhar zonas manualmente da Ajuda on-line esclarecem esses dois tpicos.

Grades de tabela na imagem


Aps o processamento automtico, voc poder ver zonas de tabelas colocadas em uma pgina. Elas so denotadas com um cone de zona de tabela no canto esquerdo superior da zona. Para mudar uma zona retangular de ou para uma zona de tabela, use o seu menu de atalho. Voc pode tambm desenhar zonas de tabela mas elas precisam permanecer retangulares. Voc delimita ou move divisores de tabela para determinar se as linhas de grade aparecero quando a tabela for colocada no Editor de texto. Voc pode desenhar ou redimensionar uma zona de tabela (desde que ela permanea retangular) para descartar colunas ou linhas desnecessrias das extremidades de uma tabela. As cinco ferramentas agrupadas de tratamento de tabela na barra de ferramentas de imagem podem ser usadas se a pgina atual contiver uma zona do tipo tabela. Se a ferramenta que voc precisa no est visvel, clique no tringulo no canto inferior direito da ferramenta visvel para exibir todas as ferramentas e em seguida clique na ferramenta desejada. Use as ferramentas de tabela e seus cursores da seguinte maneira: Inserir divisores de linha Clique na ferramenta e, em seguida, clique no local na zona de tabela onde voc

Grades de tabela na imagem

61

deseja colocar um divisor de linha. Evite colocar um divisor de modo que ele corte um texto ao meio. Inserir divisores de coluna Clique na ferramenta e, em seguida, clique no local na zona de tabela onde voc deseja colocar um divisor de coluna. Mover divisores Clique na ferramenta e mova o cursor para o divisor de linha ou coluna a ser movido. Ele exibe uma seta de duas pontas. Arraste o divisor conforme necessrio. Voc no pode arrast-lo alm de suas vizinhanas. Evite colocar divisores de modo que eles cortem texto ao meio. Remover divisores Clique na ferramenta e, em seguida, clique em um nico divisor de linha ou coluna que voc deseja excluir. Faa isso se um divisor estiver localizado incorretamente ou se voc quiser alterar a aparncia da tabela no documento final. Por exemplo, voc pode colocar duas colunas de dados em uma nica coluna excluindo o divisor entre as colunas. Inserir/Remover todos os divisores Clique nesta ferramenta e clique em seu cone do cursor dentro de uma zona de tabela sem divisores. Os divisores sero detectados automaticamente e inseridos. Clique nele em um tabela com divisores para fazer com todos desapaream. Pressione a tecla CTRL enquanto aciona o mouse se desejar inserir, mover ou excluir um divisor apenas na clula atual. Voc pode especificar a formatao de linha para molduras e grades de tabela a partir de um menu de atalho Depois do reconhecimento voc ter mais escolhas para editar molduras e sombreamento no Editor de texto.

62

Processamento de documentos

Captulo 3

Uso de gabaritos de zonas


Um gabarito pode conter um valor de plano de fundo e um conjunto de zonas e suas propriedades, armazenados em um arquivo. Um arquivo de gabarito de zona pode ser carregado para que as zonas de gabarito sejam usadas durante o reconhecimento. Carregue um arquivo de gabarito na lista suspensa Descrio de layout ou no menu Ferramentas. Quando voc carrega um gabarito, seu plano de fundo e suas zonas so inseridos: x na pgina atual, substituindo quaisquer zonas existentes x em todas as pginas obtidas futuramente x em pginas pr-existentes enviadas para um novo reconhecimento sem quaisquer zonas. Com processamento manual as zonas de gabarito nos dois primeiros casos podem ser visualizadas e modificadas antes do reconhecimento. Com processamento automtico as zonas de gabarito podem ser visualizadas e modificadas apenas depois do reconhecimento. Este comportamento continua at que o gabarito seja descarregado. Gabaritos aceitam zonas e planos de fundo do tipo ignorar e processar. Portanto, eles podem ser teis para definir quais partes das pginas devem ser processadas com zoneamento automtico e quais partes devem ser ignoradas. Zonas ou planos de fundo do tipo processar em um gabarito podem ser substitudos durante o reconhecimento por um conjunto de zonas menores; tipos especficos de zona sero atribudos a essas zonas. Como salvar um gabarito de zona Selecione um valor de plano de fundo e prepare zonas em uma pgina. Verifique suas localizaes e propriedades. Clique em Gabarito de zona ... no menu Ferramentas. Na caixa de dilogo, selecione [zonas na pgina] e clique em Salvar, em seguida atribua um nome e clique em OK. Como modificar um gabarito de zona Carregue um gabarito e obtenha uma imagem adequada com processamento manual. As zonas do gabarito aparecem. Modifique as zonas e/ou propriedades conforme desejado. Abra a caixa de dilogo Arquivo de gabarito de zona. O gabarito atual selecionado. Clique em Salvar e em Fechar.

Uso de gabaritos de zonas

63

Como descarregar um gabarito Selecione uma configurao sem gabarito na lista suspensa Descrio de layout. As zonas de gabarito no so removidas das pginas existentes ou atuais, mas as zonas de gabarito no sero mais usadas para processamento futuro. Voc tambm pode abrir a caixa de dilogo Arquivos de gabarito de zona, selecionar [nenhum] e clicar no boto Definir como atual. Neste caso, a configurao de descrio do layout volta para Automtico. Como substituir um gabarito por outro Selecione um gabarito diferente na lista suspensa Descrio de layout ou abra a caixa de dilogo Arquivos de gabarito de zona, selecione o gabarito desejado e clique no boto Definir como atual. Zonas do novo gabarito so aplicadas pgina atual, substituindo quaisquer zonas j existentes. Elas tambm so aplicadas conforme explicado acima. Como excluir um arquivo de gabarito Abra a caixa de dilogo Arquivos de gabarito de zona. Selecione o gabarito e clique no boto Delete. As zonas j colocadas por este gabarito no so removidas.

Gabaritos esto disponveis em Direct OCR, mas no no Assistente de OCR.

64

Processamento de documentos

Captulo 4

Correo e edio
Os resultados de reconhecimento so colocados no Editor de texto. Eles podem ser textos reconhecidos, tabelas e imagens grficas incorporadas. Este editor do tipo WYSIWYG (What You See Is What You Get, o que se v o que ser impresso) oferece os recursos a seguir, que sero detalhados neste captulo:
x x x x x x x x

Exibio e visualizaes do editor Correo de resultados de OCR Verificao de texto Dicionrios do usurio Treinamento Edio de texto e de imagem Edio em tempo real Leitura de texto em voz alta

OmniPage SE Manual do usurio

65

Exibio e visualizaes do editor


O Editor de texto exibe os textos reconhecidos e pode marcar as palavras consideradas suspeitas durante o reconhecimento com um sublinhado ondulado.
x

Verde Palavras ausentes do dicionrio: Elas foram reconhecidas na base da confiana mas no foram encontradas em nenhum dicionrio ativo: padro, de usurio ou profissional. Azul Palavras com caracteres suspeitos: Elas contm caracteres no reconhecidos ou so palavras aprovadas pelo dicionrio contendo caracteres reconhecidos com menor confiana. Vermelho Palavras suspeitas: Provavelmente so palavras ausentes do dicionrio com um ou mais caracteres suspeitos, mas podem tambm ser suspeitas por outros motivos.

Voc pode configurar se as palavras ausentes de dicionrio sero marcadas ou no no painel Corrigir da caixa de dilogo Opes. Todos os marcadores podem ser mostrados ou ocultados conforme selecionado no painel Editor de texto da caixa de dilogo Opes. Voc tambm pode mostrar ou ocultar caracteres no imprimveis e indicadores de cabealho e rodap. O painel no Editor de texto tambm permite que voc defina uma unidade de gerenciamento do programa e uma configurao de mudana de linha para uso em todas as visualizaes do editor de texto exceto a visualizao Sem formatao. O OmniPage SE pode exibir pginas com trs nveis de formatao. Voc pode alternar livremente entre eles usando os trs botes no canto inferior esquerdo do Editor de texto ou do menu Visualizar. As imagens grficas e as tabelas podem aparecer em todas as visualizaes. Aqui esto as diferenas principais entre as visualizaes: Visualizao Sem formatao Exibe texto simples sem colunas alinhado esquerda com uma nica fonte e um tamanho de fonte, com as mesmas quebras de linha do documento original. A maior parte dos botes de formatao e caixas de dilogo esto desativadas. As rguas no so exibidas. Voc pode achar isto conveniente para verificar e editar o texto. Visualizao Preservar fontes e pargrafos Exibe texto sem colunas com estilo de pargrafo e de fonte. A rgua horizontal exibida. Voc pode achar esta visualizao conveniente para verificar, editar e modificar o texto com seu estilo. Visualizao True Page A visualizao True Page tenta conservar o mximo possvel da formatao do documento original. O estilo de caracteres e do pargrafo mantido. Todos os

66

Correo e edio

Captulo 4

elementos de pgina, incluindo colunas, so colocados em caixas e quadros. A ordem de leitura pode ser exibida por setas. Veja pgina 75. O nvel de formatao para exportao escolhido separadamente no momento da exportao.

Correo de resultados de OCR


Aps uma pgina ser reconhecida, os resultados de reconhecimento aparecem no Editor de texto. A correo inicia automaticamente se isto foi solicitado no painel Correo da caixa de dilogo Opes ou no Assistente de OCR. Voc pode iniciar a correo manualmente a qualquer momento. Trabalhe da seguinte maneira: 1. Clique na ferramenta Corrigir OCR na barra de ferramentas Padro ou escolha Corrigir OCR... no menu Ferramentas. 2. A correo comea do incio do documento, mas pula o texto j corrigido. Se um erro suspeito for detectado, a caixa de dilogo Corretor de OCR colore a palavra suspeita em seu contexto e exibe uma figura de como ela se parecia originalmente na imagem.
Isto informa porque a palavra est marcada. Painel de edio: A palavra marcada exibida na cor de seu marcador: vermelho, azul ou verde.

A imagem da palavra suspeita fica em destaque.

Esta janela mostra a parte correspondente da imagem original. Clique dentro dela para ampliar ou reduzir a exibio.

Arraste um canto ou a parte inferior da caixa de dilogo para redimension-la.

3. Se a palavra reconhecida estiver correta, clique em Ignorar ou Ignorar todas para ir para a prxima palavra suspeita. Clique em Acrescentar para adicionar ao dicionrio atual do usurio e ir para a prxima palavra suspeita.

Correo de resultados de OCR

67

4. Se a palavra reconhecida no estiver correta, modifique-a no painel de Edio ou selecione uma sugesto do dicionrio. Clique em Substituir ou Substituir todas para implementar a alterao e ir para a prxima palavra suspeita. Clique em Acrescentar para adicionar a palavra alterada ao dicionrio atual do usurio e ir para a prxima palavra suspeita. 5. Os marcadores de cores so removidos das palavras no Editor de texto conforme elas so corrigidas. Voc pode alternar para o Editor de texto durante a correo para fazer correes l. Clique no boto Continuar para reiniciar a correo. Clique em Fechar para interromper a correo antes que o fim do documento seja alcanado.

Uma pgina marcada com o cone de corrigido em sua miniatura e no Gerenciador de documentos se a correo tiver chegado ao final da pgina. Se os marcadores estavam ocultos no Editor de texto quando a correo foi iniciada ou a opo Localizar prxima suspeita for selecionada, os marcadores passam a ser exibidos e permanecem visveis depois da correo. Se a opo Marcar palavras ausentes do dicionrio estiver desativada no painel Correo da caixa de dilogo Opes, a correo s ser interrompida em palavras marcadas em vermelho ou azul, e no em palavras ausentes do dicionrio. Isto til ao verificar pginas com muitas palavras ausentes do dicionrio, como em catlogos de produtos que contm cdigos e bibliografias que contm muitos nomes prprios. Use a opo Verificar novamente pgina atual no menu Ferramentas para executar uma nova verificao ortogrfica em uma pgina que j foi corrigida. Faa isso para verificar palavras digitadas ou coladas no Editor de texto depois que a correo foi feita. Isso funciona mesmo que a opo Marcar palavras ausentes do dicionrio esteja desativada no painel Correo.

Verificao de texto
Aps o reconhecimento de OCR, voc pode comparar todas as partes do texto reconhecido com a parte correspondente da imagem original para verificar se o texto foi reconhecido corretamente. Trabalhe da seguinte maneira:

68

Correo e edio

Captulo 4

Para fazer isso:


Ativar o verificador Desativar o verificador Ativar/desativar verificador temporariamente Exibir verificador at prxima tecla ser pressionada Ampliar a exibio Reduzir a exibio Tornar o verificador dinmico ou acoplado/flutuante Contexto dinmico (3 valores possveis)

Use isso:
F9 ou ferramenta verificador Esc ou F9 ou ferramenta verificador F8: pressione e mantenha pressionado Clique duas vezes na palavra Alt + Num + ou clique no verificador Alt + Num ou clique no verificador Alt + Num / Alt + Num *

A ferramenta verificador est na barra de ferramentas Formatao. O verificador tambm pode ser controlado pelo menu Ferramentas. Passe o cursor sobre um verificador para obter a barra de ferramentas verificador. Use-a da seguinte forma:
ferramenta verificador (ativar/desativar)

Arraste entre flutuante e acoplado

para flutuar ou acoplar (retorna ao ltimo estado) Barra de ferramentas do Verificador: ampliar/reduzir zoom para dinmico Qual a quantidade de contexto para o verificador dinmico? uma palavra trs palavras (atual + vizinhas) linha inteira da imagem

Editor de texto

Verificao de texto

69

Voc deve corrigir e verificar os textos antes de fazer edies de grande escala. Se voc cortar e colar grandes blocos de texto, as associaes entre o texto e a imagem podem ser corrompidas. O recurso Texto para fala do OmniPage Pro 12 pode ler em voz alta o texto reconhecido, como outra forma de verificao de texto. Voc pode ouvir o texto letra a letra, palavra a palavra, linha a linha, frase a frase ou em pginas inteiras. Consulte a seo Leitura de texto em voz alta na pgina 78. Este recurso est disponvel no OmniPage SE.

Dicionrios do usurio
O programa possui dicionrios internos para muitos idiomas. Estes ajudam no reconhecimento e podem oferecer sugestes durante a correo. Eles podem ser complementados por dicionrios do usurio. Voc pode salvar quantos dicionrios de usurio quiser, mas somente um pode ser carregado por vez. Os dicionrios do usurio do Microsoft Word tambm esto disponveis; um dicionrio chamado Personalizado o dicionrio padro do usurio para Microsoft Word. Incio de um dicionrio de usurio Clique em Acrescentar na caixa de dilogo Corretor de OCR sem dicionrio de usurio carregado ou abra a caixa de dilogo Arquivos de dicionrio do usurio no menu Ferramentas e clique em Novo. Ser pedido para que voc d um nome ao dicionrio imediatamente. Carregamento ou descarregamento de um dicionrio de usurio Faa isso no painel OCR da caixa de dilogo Opes ou na caixa de dilogo Arquivos de dicionrio do usurio. Selecione um arquivo de dicionrio para carreg-lo ou [nenhum] para descarregar um dicionrio do usurio. Edio ou excluso de um dicionrio de usurio Adicione de palavras carregando um dicionrio de usurio e, em seguida, clicando em Acrescentar na caixa de dilogo Corretor de OCR. Voc pode acrescentar e excluir palavras clicando em Editar na caixa de dilogo Arquivos de dicionrio do usurio. O boto Excluir permite que voc exclua o dicionrio de usurio selecionado.
Ao editar um dicionrio de usurio, voc pode importar uma lista de palavras de um arquivo de texto simples para adicionar palavras ao dicionrio rapidamente. Cada palavra precisa estar em uma linha separada sem pontuao no incio ou fim da palavra.

70

Correo e edio

Captulo 4

No OmniPage Pro 12, dicionrios especializados esto disponveis, em alguns idiomas, para determinadas profisses (no momento, advogados e mdicos). Eles no esto disponveis no OmniPage SE.
O programa identifica o idioma dos textos reconhecidos e exibe-o na barra de status. Esta marcao de idioma exportada junto com o documento. Use Definir idioma... no menu Ferramentas para alterar a marcao de idioma do texto selecionado. Isto no altera o(s) idioma(s) de reconhecimento.

Treinamento
O OmniPage SE no oferece suporte para o treinamento, IntelliTrain nem para arquivos de treinamento. Eles se encontram disponveis no OmniPage Pro 12. Os dados de treinamento contidos em arquivos OPD sero ignorados quando abertos no OmniPage SE Treinamento o processo de alterar as solues de OCR atribudas aos formatos de caracter na imagem. Isto til para documentos degradados uniformemente ou quando um tipo de fonte incomum usado em todo um documento. O treinamento ser menos til em textos com distores aleatrias. Veja um exemplo, baseado na letra g, que pode ser impressa de formas diferentes:

Os dois primeiros exemplos no precisam de treinamento porque as duas formas da letra g so normais e o programa pode trat-las. O terceiro exemplo poderia se beneficiar do treinamento porque a forma de g incomum e todas as instncias de g no texto provavelmente se parecem com ela. O quarto exemplo no bom para treinamento porque o primeiro g impresso de forma fraca e improvvel que esta forma aparea no documento novamente. Voc pode usar o treinamento para melhorar o reconhecimento de smbolos especiais como @, e ou para reconhecer letras acentuadas suportadas com maior confiabilidade. A finalidade do treinamento no ensinar o programa a ler caracteres de idiomas ou alfabetos no suportados. O OmniPage Pro 12 oferece dois tipos de treinamento: treinamento manual e treinamento automtico (IntelliTrain). Os dados provenientes de ambos os tipos de treinamento so combinados e esto disponveis para serem salvos em um arquivo de treinamento.

Treinamento

71

Quando voc sai de uma pgina na qual os dados de treinamento foram gerados, voc ser perguntado como aplic-los s outras pginas existentes no documento.

Treinamento manual
Para executar o treinamento manual, coloque o ponto de insero em frente do caracter que deseja treinar ou selecione um grupo de caracteres (at uma palavra) e escolha Treinar caracter ... no menu Ferramentas ou menu de atalho. Voc ver uma imagem ampliada do(s) caracter(es) a ser(em) treinado(s), juntamente com a atual soluo de OCR. Mude-a para a soluo desejada e clique em OK. O programa pega esse treinamento e examina o resto da pgina. Se ele encontrar palavras candidatas para alterar, elas sero listadas na caixa de dilogo Verificar treinamento. Palavras incorretas devem ser treinadas novamente antes de a lista ser aprovada. Para obter uma orientao sobre como usar as caixas de dilogo Treinar caracter e Verificar treinamento, consulte as ajudas sensveis a contexto ou o tpico Treinamento manual da Ajuda on-line e outros tpicos relacionados.

IntelliTrain
O IntelliTrain uma forma automatizada de treinamento. Ele obtm informaes das alteraes que voc faz durante a correo. Quando voc faz uma alterao, ele lembra da forma de caracteres envolvida e da sua alterao de correo. Ele procura por outras formas de caracteres semelhantes no documento, especialmente em palavras suspeitas. Ele avalia se aplica a correo do usurio ou no. Voc pode ativar ou desativar o IntelliTrain no painel OCR da caixa de dilogo Opes. O seguinte exemplo mostra como o IntelliTrain funciona, usando a imagem original. O nosso exemplo envolve as letras c e e. Com algumas configuraes de digitalizao e fontes, a linha horizontal na letra e pode se tornar muito fina, levando a erros de OCR que o IntelliTrain podem consertar.

72

Correo e edio

Captulo 4

O OmniPage Pro l isto como qualqucr. Voc o alterou durante a correo para qualquer.

O IntelliTrain se lembra desta forma e desta regra:

Isto no um "c". Isto um "e".

O IntelliTrain muda:

cstc para este dcspcsas para despesas scja para seja


etc.

O IntelliTrain lembra-se dos dados de treinamento que coletou e os adiciona a qualquer treinamento manual que voc tenha feito. Este treinamento pode ser salvo em um arquivo de treinamento para uso futuro com documentos semelhantes.

Arquivos de treinamento
Se voc quiser ser avisado para salvar dados de treinamento no salvos ao fechar o documento, selecione a opo no painel Correo na caixa de dilogo Opes. Os dados de treinamento no salvos so armazenados em um documento do OmniPage. Se voc no salvar o documento como um OPD, o treinamento no salvo descartado quando o documento fechado. A gravao do treinamento em um arquivo, o carregamento, a edio e o descarregamento de arquivos de treinamento so feitos na caixa de dilogo Arquivos de treinamento. Abra-a no painel Correo da caixa de dilogo Opes ou no menu Ferramentas.

Treinamento

73

Selecione isto, clique em Salvar e digite um nome para salvar um arquivo de treinamento. Selecione isto para descarregar um arquivo de treinamento.

Clique nisto para editar o arquivo de treinamento selecionado na caixa de dilogo Editar treinamento. Use isto tambm para salvar um novo treinamento em um arquivo de treinamento carregado. Isto listado como: <Nome de arquivo> [modificado]

O treinamento descarregado pode ser editado na caixa de dilogo Editar treinamento, um asterisco exibido na barra de ttulos no lugar de um nome de arquivo de treinamento. Ele continua no salvo quando voc fecha a caixa de dilogo Editar treinamento. Salve-o na caixa de dilogo Arquivos de treinamento. Um arquivo de treinamento tambm pode ser editado; o seu nome aparece na barra de ttulo. Se ele tiver dados de treinamento no salvos adicionados a ele, um asterisco aparecer aps seu nome. Ambos os treinamentos modificados e no salvos so salvos quando voc fecha a caixa de dilogo. A caixa de dilogo Editar treinamento exibe quadros contendo uma forma de caractere e uma soluo de OCR associada forma. Clique em um quadro para selecion-lo. Em seguida, voc pode exclu-lo com a tecla Delete ou alterar a atribuio. Use as teclas de seta para mover para o prximo quadro ou para o anterior.
Voc est editando o seu treinamento no salvo.

Este quadro est acinzentado. Ele foi excludo. Para recuper-lo, selecione-o novamente e pressione a tecla Delete. Os caracteres marcados como excludos so realmente excludos quando voc fecha a caixa de dilogo.

Clique duas vezes em um quadro ou pressione Enter para mudar sua soluo de OCR. Digite a nova soluo na caixa de texto que aparece e pressione Enter. As atribuies alteradas aparecem em vermelho.

Este quadro est selecionado. A parte superior mostra a forma da imagem. A parte inferior mostra a soluo de OCR atribuda.

74

Correo e edio

Captulo 4

Edio de texto e de imagem


O OmniPage SE oferece um Editor de texto WYSIWYG, que fornece muitos recursos de edio. Eles funcionam de forma muito semelhante aos dos principais processadores de texto do mercado. Edio de atributos de caracteres Em todas as visualizaes, exceto na visualizao Sem formatao, voc pode alterar o tipo de fonte, o tamanho e os atributos (negrito, itlico, sublinhado) para o texto selecionado. Use a caixa de ferramentas Formatao na caixa de dilogo Fonte no menu Formatar. Esta ltima tambm oferece opes de caracteres subscritos, sobrescritos e texto ou fundo colorido. Na visualizao Sem formatao, use a barra de ferramentas Formatao para especificar um tipo de fonte e tamanho a ser aplicado a todo o documento. Isto no usado para exportao e nem transferido para outras visualizaes; as configuraes anteriores so restauradas. Abra a caixa de dilogo Correspondncia de fontes no painel OCR na caixa de dilogo Opes antes do OCR para especificar as fontes a serem usadas para entrada de texto no Editor de texto. Edio de atributos de pargrafos Em todas as visualizaes, exceto na visualizao Sem formatao, voc pode alterar o alinhamento dos pargrafos selecionados e aplicar marcadores a pargrafos. Use a caixa de ferramentas Formatao ou a caixa de dilogo Pargrafo no menu Formatar. Esta ltima permite que voc modifique recuos, espaamento de linha e espaamento entre pargrafos. A rgua horizontal do Editor de texto permite que voc defina as posies de recuo e tabulao com facilidade. As configuraes avanadas de tabulao so feitas na caixa de dilogo Tabulaes no menu Formatar. Estilos de pargrafos Os estilos de pargrafos so detectados automaticamente durante o reconhecimento. Uma lista de estilos criada e apresentada em uma caixa de seleo esquerda da caixa de ferramentas Formatao. Use-a para atribuir um estilo aos pargrafos selecionados. Use a caixa de dilogo Estilo no menu Formatar para renomear ou modificar um estilo e para definir um novo estilo. Quando voc salva um documento em um arquivo, pode escolher se deseja exportar os estilos de pargrafo com o documento ou no. Isto vlido somente se o aplicativo de destino for compatvel com estilos de pargrafos. Imagens grficas Voc pode editar o contedo de uma imagem grfica selecionada se tiver um editor de imagens no computador. Clique em Editar imagem no menu Ferramentas. Isto ativar o editor de imagem associado aos arquivos BMP no sistema Windows e carregar uma imagem grfica. Edite a imagem grfica e, em seguida, feche o editor para que ela seja reincorporada ao Editor de texto. No

Edio de texto e de imagem

75

altere o tamanho, a resoluo ou o tipo da imagem grfica, porque isto impedir a sua reincorporao. Tabelas As tabelas so exibidas no Editor de texto em grades. Mova o cursor para uma rea da tabela. Ele muda de aparncia, permitindo que voc mova as linhas de grade. Voc tambm pode usar as rguas do Editor de texto para modificar uma tabela. Modifique a colocao de texto em clulas de tabela com os botes de alinhamento na barra de ferramentas Formatao e os controles de tabulao na rgua. Ao salvar o documento em alguns tipos de arquivo, voc pode escolher se quer tabelas exportadas em grades ou como colunas separadas por tabulao ou espaos. Hyperlinks Endereos de correio eletrnico e de pginas da Web podem ser detectados e inseridos como links no texto reconhecido. Escolha Hyperlink ... no menu Formatar para editar um link existente ou criar um novo. Um novo link pode apontar para uma pgina da Web ou um arquivo. Use um menu de atalho para excluir um link. Editar no modo True Page Os elementos da pgina esto contidos em caixas de texto, caixas de tabela e caixas de imagem. Normalmente eles correspondem a zonas de texto, tabela e imagens grficas na imagem. Clique dentro de um elemento para ver a moldura da caixa; elas possuem a mesma cor da zona correspondente. O tpico True Page da Ajuda on-line fornece detalhes sobre as operaes resumidas aqui. Quadros tm molduras cinza e delimitam uma ou mais caixas. Eles so inseridos quando uma moldura visvel detectada em uma imagem. Formate moldura de quadros e tabelas e sombreamento com um menu de atalho ou escolhendo Tabela ... no menu Formatar. O sombreamento de uma caixa de texto pode ser especificado em seu menu de atalho. Para ativar um menu de atalho, clique com o boto direito dentro de um elemento afastado de uma palavra marcada. reas com vrias colunas tm molduras cor-de-rosa e delimitam uma ou mais caixas. Elas so detectadas automaticamente e exibem qual texto ser tratado como colunas quando exportado. Use menus de atalho para desagrupar reas com vrias colunas e quadros, permitindo que seus elementos sejam modificados. Voc tambm pode agrupar elementos em quadros ou reas com vrias colunas. A ordem de leitura pode ser exibida e alterada. Clique na ferramenta Exibir ordem de leitura na barra de ferramentas Formatao para que ordem seja exibida por setas. Clique novamente para remover as setas. Clique na ferramenta Alterar ordem de leitura para obter um conjunto de botes de reorganizao ao invs da barra de ferramentas Formatao. A ajuda sensvel ao contexto explica seu uso, assim como o tpico Ordem de leitura da Ajuda on-line. Uma ordem alterada aplicada em visualizaes NF e RFP. Ela modifica o modo como o cursor se move pela pgina quando ela exportada como True Page.

76

Correo e edio

Captulo 4

Edio em tempo real


Permite que voc modifique uma pgina reconhecida por meio de novo zoneamento, sem a necessidade de processar a pgina inteira novamente. Quando a edio em tempo real estiver ativada, alteraes de zona (excluso, desenho, redimensionamento, mudana de tipo) provocam imediatamente mudanas na pgina reconhecida. De modo oposto, quando voc modifica elementos na visualizao True Page no Editor de texto, isto muda as zonas naquela pgina. O zoneamento em tempo real tambm pode ser usado com pginas no reconhecidas. Duas ferramentas vinculadas na barra de ferramentas Imagem controlam o zoneamento em tempo real. Uma dessas ferramentas est ativa sempre que no h reconhecimento em andamento. Clique nisto para ativar a edio em tempo real. O sinal vermelho indica que no existem alteraes de zoneamento armazenadas. Clique nisto para desativar a edio em tempo real. Suas alteraes de zoneamento so armazenadas; a ferramenta On-the-fly exibe um sinal verde para indicar que existem alteraes armazenadas. Para ativar essas alteraes, siga um dos procedimentos abaixo: Clique na ferramenta On-the-fly com o sinal verde. As alteraes de zoneamento causaro mudanas no Editor de texto. Clique no boto Executar OCR para que a pgina inteira seja reconhecida novamente, incluindo suas alteraes de zona. Para obter detalhes sobre como as alteraes so tratadas no zoneamento em tempo real e seus efeitos nas visualizaes do Editor de texto, consulte o tpico Processamento em tempo real da Ajuda on-line.

Edio em tempo real

77

Leitura de texto em voz alta


O recurso Texto para fala no foi includo no OmniPage SE. Ele est disponvel no OmniPage Pro 12. Este recurso de fala designado aos que possuem deficincia visual, mas tambm pode ser til para qualquer pessoa durante a verificao de texto. A fala controlada por movimentos do ponto de insero no Editor de texto, que podem ser controlados pelo mouse ou pelo teclado.
Para ouvir texto:
Um caractere por vez, para frente ou para trs Palavra atual Uma palavra para a direita Uma palavra para a esquerda Uma nica linha Prxima linha Linha anterior Frase atual Do ponto de insero ao fim da frase Do ponto inicial da frase ao ponto de insero Pgina atual Do incio da pgina atual ao ponto de insero Do ponto de insero ao fim da pgina atual Pgina anterior, prxima ou qualquer pgina Caracteres digitados

Use estas teclas:


Seta para direita ou para esquerda. Caracteres de pontuao, nmeros ou letras so falados. Ctrl + 1 do teclado numrico Ctrl + seta para direita Ctrl + seta para esquerda Coloque o ponto de insero na linha Seta para baixo Seta para cima Ctrl + 2 do teclado numrico Ctrl + 6 do teclado numrico Ctrl + 4 do teclado numrico Ctrl + 3 do teclado numrico Ctrl + Home Ctrl + End Ctrl + PgUp, PgDown ou botes de navegao Cada caractere digitado pronunciado, um a um, incluindo pontuao.

O recurso de converso de texto em fala ativado ou desativado com o item Modo de fala do menu Ferramentas ou com a tecla F5. Um segundo item de menu Configuraes de fala... permite que voc selecione uma voz (por exemplo, de homem ou mulher, para um certo idioma), velocidade de leitura e o volume. As trs teclas de fala bsicas so agrupadas no teclado numrico.

78

Correo e edio

Captulo 4

1
Falar a palavra atual

2
Falar a frase atual

3
Falar a pgina atual

Voc tambm tem os seguintes controles do teclado:


Para fazer isso:
Pausar/Continuar Definir a velocidade mais alta Definir a velocidade mais baixa Restaurar velocidade

Use isso:
Ctrl + 5 do teclado numrico Ctrl + sinal de mais do teclado numrico (+) Ctrl + sinal de menos do teclado numrico () Ctrl + sinal de asterisco do teclado numrico (*)

Existem planos para oferecer programas de fala para os seguintes idiomas: Ingls, francs, alemo, italiano, portugus e espanhol. Consulte o arquivo Leiame para obter as ltimas informaes. Somente um sistema de fala ser instalado com o OmniPage Pro, dependendo da escolha de idioma no incio da instalao. Se voc especificar um idioma sem sistema de fala disponvel, ser instalado o ingls. Se voc tiver sistemas de fala compatveis com SAPI para outros idiomas em seu computador, eles sero detectados e disponibilizados. As vozes deles sero oferecidas na caixa de dilogo Configuraes de fala. Uma vez que voc tiver associado uma voz a um idioma, o OmniPage Pro se lembrar disso e alternar as vozes de acordo com o idioma de reconhecimento de seu documento.

Leitura de texto em voz alta

79

80

Correo e edio

Captulo 5

Gravao e exportao
Uma vez que voc tenha adquirido pelo menos uma imagem para um documento, voc pode export-la para um arquivo. Uma vez que voc tenha reconhecido pelo menos uma pgina, voc pode exportar os resultados do reconhecimento uma pgina nica, pginas selecionadas ou o documento inteiro para um aplicativo de destino salvando em arquivo, copiando para a rea de transferncia ou enviando para uma aplicao de correio eletrnico. Sempre possvel salvar como um Documento do OmniPage. Este captulo apresenta os seguintes tpicos:
x x

x x

Gravao de imagens originais Gravao dos resultados de reconhecimento Salvar um documento enquanto voc trabalha Selecionar um nvel de formatao Selecionar opes avanadas de salvamento Salvar como PDF Copiar pginas para a rea de transferncia Enviar pginas via correio

Um documento continua no OmniPage SE aps a exportao. Isto permite que voc salve, copie ou envie suas pginas repetidamente, por exemplo com nveis diferentes de formatao, usando tipos de arquivos, nomes ou locais diferentes. Voc tambm pode adicionar ou reconhecer novamente pginas ou modificar o texto reconhecido. Com processamento automtico e usando o Assistente de OCR, voc especifica o primeiro destino de gravao antes do processamento iniciar. Quando a ltima

OmniPage SE Manual do usurio

81

pgina disponvel reconhecida (ou corrigida, se isto foi solicitado), surge uma caixa de dilogo de exportao. Voc pode especificar a exportao a qualquer momento que o programa no estiver ocupado. Se voc pedir para exportar um documento com pginas no reconhecidas, ser perguntado se elas devem ser reconhecidas antes. Se voc responder No, somente os resultados das pginas reconhecidas sero exportados. Se as zonas tiverem sido modificadas em pginas reconhecidas, voc ser convidado a reconhecer novamente as pginas antes de exportar.

Gravao de imagens originais


Voc pode salvar as imagens originais em disco em uma ampla variedade de tipos de arquivos. Consulte Tipos de arquivo para abrir e salvar imagens na pgina 98. 1. Escolha Salvar imagem... no menu Arquivo. Na caixa de dilogo que aparece, selecione um local de pasta e um tipo de arquivo para suas imagens. Digite um nome de arquivo. 2. Selecione para salvar apenas a imagem da zona atual, a imagem da pgina atual, imagens da pgina selecionada ou todas as imagens no documento. Nos dois ltimos casos, voc pode ter todas as imagens em um nico arquivo de imagem de vrias pginas, contanto que defina o tipo de arquivo TIFF, MAX ou DCX. Caso contrrio, cada imagem colocada em um arquivo separado. O OmniPage SE adiciona sufixos numricos ao nome de arquivo que voc fornece, para gerar nomes de arquivos exclusivos. 3. Clique em OK para salvar as imagens como especificado. As zonas e o texto reconhecido no so salvos com o arquivo. Se possvel, o arquivo salvo como exibido: isto , em preto e branco, tons de cinza ou em cores. As imagens em preto e branco so salvas com as suas resolues originais. As imagens coloridas e em tons de cinza so reduzidas a aproximadamente 150 dpi.
Para ver o tamanho da imagem e a resoluo original de uma imagem, passe o cursor sobre sua miniatura no painel de Imagem. En OmniPage Pro voc pode salvar seu documento em cinco variantes do formato PDF. Duas delas salvam as imagens originais, as outras salvam os resultados do reconhecimento. Consulte as seguintes sees. Salvar como PDF no est disponvel no OmniPage SE

82

Gravao e exportao

Captulo 5

Gravao dos resultados de reconhecimento


Voc pode salvar as pginas reconhecidas em disco em uma ampla variedade de tipos de arquivos. Consulte Tipos de arquivo para salvar resultados de reconhecimento na pgina 99. 1. Escolha Salvar como... no menu Arquivo ou clique no boto Exportar resultados na barra de ferramentas do OmniPage com Salvar como arquivo selecionado na lista suspensa. 2. A caixa de dilogo Salvar como aparece, como mostrado em sua forma expandida.

Selecione isto para abrir automaticamente o arquivo salvo em seu aplicativo de destino. Escolhas possveis: Todas as pginas Pgina atual Pginas selecionadas Selecione pginas com as miniaturas ou no Gerenciador de documentos.

Clique em Avanado para abrir o painel inferior e Bsico para fech-lo. Clique nisto para visualizar e alterar as opes de sada para o atual tipo de arquivo. Escolhas possveis: Criar um arquivo para todas as pginas Criar um arquivo por pgina Criar um novo arquivo a cada pgina em branco. Criar um novo arquivo para cada arquivo de imagem.

3. Selecione um local de pasta e um tipo de arquivo para o seu documento. O tipo de arquivo OPD especial o ltimo na lista de tipo de arquivos. Em seguida selecione um nvel de formatao para o documento. Consulte Selecionar um nvel de formatao na pgina 85. 4. Digite um nome de arquivo. Clique no boto Avanado se desejar especificar um intervalo de pginas, uma opo de separao de arquivo ou outras opes de salvamento. Selecione-as como desejado. Consulte Selecionar opes avanadas de salvamento na pgina 86.

Gravao dos resultados de reconhecimento

83

5. Clique em OK. O documento salvo em disco como especificado. Se Salvar e iniciar estiver selecionado, o arquivo exportado aparecer em seu aplicativo de destino; isto , o aplicativo associado com o tipo de arquivo selecionado no sistema Windows ou nas opes avanadas de salvamento para o conversor do tipo de arquivo.
Imagens grficas, grades de tabela e outras propriedades so salvas no documento apenas se o tipo de arquivo selecionado suport-las e se elas forem especificadas para reteno nas configuraes avanadas (Opes do conversor) para o atual tipo de arquivo. Se mais de um arquivo de exportao for criado, o OmniPage SE associar sufixos numricos ao seu nome de arquivo para criar nomes exclusivos de arquivo. Se voc selecionar Criar um novo arquivo a cada pgina em branco com entrada de arquivos de imagem, voc pode inserir arquivos de imagem vazios no documento. Consulte Entrada de arquivos de imagem na pgina 50. Se voc selecionar Criar um novo arquivo para cada arquivo de imagem, no necessrio um nome de arquivo. Cada arquivo de sada obter seu nome do arquivo de entrada que o gerou, mudando apenas a extenso.

Salvar um documento enquanto voc trabalha


Clique na ferramentas Salvar na barra de ferramentas Padro ou escolha Salvar no menu Arquivo para salvar as alteraes no documento atual conforme voc trabalha. Se voc fizer isto com um documento sem ttulo, a caixa Salvar como aparece. No caso de um documento com ttulo, o comando Salvar salva-o com o nome e tipo de arquivo de sua ltima gravao, como exibido na barra de ttulos. Isto s exibido se o documento inteiro foi salvo. Se o documento foi salvo pela ltima vez como um documento OmniPage, o comando de gravao atualiza este documento: as imagens novas ou alteradas, zoneamento alterado, resultados de reconhecimento e treinamento so todos salvos. Se o documento foi salvo pela ltima vez como um outro tipo qualquer de arquivo, somente as alteraes nos resultados de reconhecimento so salvas. Se voc quiser trabalhar com o seu documento novamente no OmniPage SE em uma sesso posterior, salve-o como um documento do OmniPage. Este um tipo de arquivo de sada especial. Ele salva as imagens originais com os resultados de reconhecimento, configuraes e treinamento. Consulte Documentos do OmniPage na pgina 31. As referncias a treinamento no se aplicam ao OmniPage SE.

84

Gravao e exportao

Captulo 5

A caixa de dilogo Salvar como lista os tipos de arquivo disponveis em sua lista suspensa Salvar como tipo. O documento do OmniPage o ltimo formato na lista. Se voc salvar o documento primeiramente como um documento do OmniPage (por exemplo como memo.opd), modific-lo posteriormente e salv-lo como arquivo de texto (por exemplo como memo.txt) e, em seguida, modific-lo novamente e clicar em Salvar, as alteraes recentes so salvas no arquivo memo.txt, no no OPD. Ao fechar o documento ou sair do programa, voc ser avisado para salvar o documento se ele no tiver sido salvo como um documento do OmniPage ou se houver alteraes desde a ltima gravao de OPD.

Selecionar um nvel de formatao


O nvel de formatao para exportao definido no momento da exportao, na caixa de dilogo Salvar como, na caixa de dilogo Copiar para rea de transferncia ou na caixa de dilogo Enviar como correio. Trs desses nveis correspondem s visualizaes de formatao do mesmo nome no Editor de texto. Entretanto, o nvel a ser aplicado na hora de salvar independente da visualizao de formatao exibida no Editor de texto. Ao exportar para arquivo ou correio, primeiro especifique um tipo de arquivo. Isso determina quais nveis de formatao esto disponveis. Uma tabela no Captulo 6 resume estas informaes. Consulte Tipos de arquivo para salvar resultados de reconhecimento na pgina 99. Os nveis de formatao so: Sem formatao (NF) Exporta texto simples sem colunas e alinhado esquerda em uma nica fonte e nico tamanho de fonte. Ao exportar para os tipos de arquivo Texto ou Unicode, as imagens grficas e tabelas no so suportadas. Voc pode exportar texto simples para quase todos os tipos de arquivo e aplicativos de destino; nestes casos as imagens grficas, tabelas e marcadores podem ser mantidos. Visualizao Preservar fontes e pargrafos (RFP) Exporta texto sem colunas com estilo de fonte e pargrafo, juntamente com imagens grficas e tabelas. Isto est disponvel para quase todos os tipos de arquivo. Visualizao de Pgina ligada (FP) Mantm o layout original das pginas, incluindo colunas. Isto feito sempre que possvel com as configuraes de coluna e recuo, no com quadros ou caixas de texto. O texto fluir de uma coluna para outra, o que no acontece quando so usadas caixas de texto. O OmniPage SE no oferece o recurso de sada de pgina ligada. Esse recurso est disponvel somente no OmniPage Pro.

Gravao dos resultados de reconhecimento

85

True Page (TP) Mantm o layout original das pginas, incluindo colunas. Isto feito com texto, imagens, caixas de tabelas e quadros. Isto oferecido apenas para aplicativos de destino capazes de tratar esses elementos. Planilha Exporta resultados de reconhecimento em formato tabular, adequado para uso em aplicativos de planilha. A quebra de colunas das exportaes NF e RFP executada da esquerda para a direita e de cima para baixo:
Pgina original Resultado sem colunas

Antes de exportar, verifique nas visualizaes NF e RFP se a ordem dos elementos sem colunas est correta. Caso contrrio, alterne para a visualizao True Page e clique na ferramenta Exibir ordem de leitura para que a ordem seja exibida por setas. Use a ferramenta Alterar ordem de leitura para especificar uma ordem diferente. reas com vrias colunas mostram quais colunas esto vinculadas. Se esta vinculao no for adequada, desagrupe a rea e mude a ordem dos elementos dentro dela.

Selecionar opes avanadas de salvamento


Clique no boto Opes do conversor na parte avanada da caixa de dilogo Salvar como para ter um controle preciso sobre a exportao. Isso faz surgir uma caixa de dilogo com o nome do tipo atual de arquivo. Ela apresenta uma srie de opes adaptadas para este tipo de arquivo. Primeiro, confirme ou altere o nvel de formatao, pois ele influencia quais outras opes sero apresentadas. Selecione as opes como desejar. A Ajuda on-line fornece detalhes sobre como faz-lo. Clique em Aplicar para que as configuraes alteradas sejam aplicadas apenas ao atual salvamento.

Clique em Valores padro para que todas as configuraes voltem aos valores padro para o atual tipo de arquivo.

86

Gravao e exportao

Captulo 5

Clique em Salvar para que as configuraes alteradas sejam aplicadas ao salvamento atual e tambm armazenadas como configuraes que sero aplicadas no futuro sempre que este tipo de arquivo for selecionado novamente para salvamento.

O programa atualmente associado ao tipo de arquivo escolhido para o recurso Salvar e iniciar exibido na parte inferior da caixa de dilogo. Clique no boto dos trs pontos para especificar um programa diferente. Para criar seu prprio conversor personalizado, prepare suas configuraes, clique em Novo conversor, fornea um nome e ento clique em OK. Outra alternativa primeiro nomear o conversor, alterar as configuraes e depois clicar em Salvar. Conversores personalizados so teis para tarefas repetitivas, como a publicao de uma revista semanal. Desta forma todas as pginas reconhecidas podem ser exportadas com sua formatao adaptada para o uso pretendido. Voc tambm pode criar um conjunto de conversores personalizados para um determinado tipo de arquivo definindo as opes de salvamento para cada nvel de formatao de sada, por exemplo: RTF Sem formatao, RTF Manter fontes e pargrafos e RTF True Page. Voc pode mudar as opes do conversor sem salvar nada em arquivo. Inicie a caixa de dilogo Conversores de exportao no menu Ferramentas. Selecione o conversor desejado e clique no boto Opes. Neste caso, o boto Aplicar no est disponvel.

Gravao dos resultados de reconhecimento

87

Salvar como PDF


Isso no se aplica ao OmniPage SE. No OmniPage Pro 12 voc tem cinco opes ao salvar para arquivos PDF (Portable Document Format). PDF (Normal): As pginas so exportadas conforme aparecem no Editor de texto na visualizao True Page. O arquivo PDF pode ser visualizado e pesquisado em um visualizador de PDF e editado em um editor de PDF. PDF Editado: Use este formato se voc fez mudanas significativas de edio nos resultados do reconhecimento. Voc v trs opes de nvel de formatao, incluindo True Page. O arquivo PDF pode ser visualizado, pesquisado e editado. PDF com imagens em texto: O arquivo PDF somente visualizvel e no pode ser modificado em um editor de PDF. As imagens originais so exportadas, mas h um arquivo de texto vinculado atrs de cada imagem, assim o texto pode ser procurado. Uma palavra encontrada fica em destaque na imagem. PDF com substitutos de imagem: Como no caso de PDF (Normal), mas as palavras contendo caracteres rejeitados e suspeitos possuem sobreposies de imagem, assim estas palavras incertas so exibidas como no documento original. O arquivo PDF pode ser visualizado, pesquisado e editado. PDF, somente imagem: As imagens originais so exportadas. O arquivo PDF s pode ser visualizado e no pode ser modificado em um editor de PDF e o texto no pode ser procurado.

Copiar pginas para a rea de transferncia


Voc pode copiar os resultados do reconhecimento da pgina atual, de pginas selecionadas ou de todas as pginas do documento para a rea de transferencia. A cpia acompanhada por um monitor de progresso. Em seguida, voc pode colar o contedo da rea da transferncia em outro aplicativo. A formatao de texto, como negrito e itlico, mantida quando voc cola em um aplicativo compatvel com informaes de RTF 6.0/95. Caso contrrio, somente texto simples ou texto Unicode sero colados. As imagens grficas so mantidas se o aplicativo oferecer suporte para insero de imagens.

88

Gravao e exportao

Captulo 5

w Para copiar pginas para a rea de transferncia:

Com o processamento automtico, selecione Copiar para rea de transferncia como o comando na lista suspensa Exportar resultados na barra de ferramentas do OmniPage ou no Assistente de OCR. A caixa de dilogo Copiar para rea de transferncia aparece logo que a ltima pgina disponvel tiver sido reconhecida ou corrigida. Com processamento manual, selecione Copiar para rea de transferncia na lista suspensa Exportar resultados e, em seguida, clique em seu boto. Surge imediatamente a caixa de dilogo Copiar para rea de transferncia. Especifique um intervalo de pginas e um nvel de formatao a serem usados e ento clique em OK para iniciar a cpia.
Voc pode executar uma operao de copiar e colar para a pgina atual usando o recurso arrastar e soltar. Pressione e mantenha pressionadas as teclas Ctrl+Tab enquanto clica na pgina atual no painel de Imagem e arrasta o cursor para um aplicativo de destino com um documento aberto. O contedo da pgina ser colado na posio do cursor. O OCR ser executado caso necessrio.

Enviar pginas via correio


Voc pode enviar resultados de reconhecimento como um ou mais arquivos anexados a uma mensagem de correio se tiver instalado um aplicativo compatvel com MAPI, como o Microsoft Outlook.

w Para enviar um documento por correio eletrnico:

Com o processamento automtico, selecione Enviar como correio como configurao na lista suspensa Exportar resultados na barra de ferramentas do OmniPage. A caixa de dilogo Enviar correio aparece assim que a ltima pgina disponvel no documento for reconhecida ou corrigida. Com processamento manual, selecione Enviar como correio na lista suspensa Exportar resultados e, em seguida, clique em seu boto. A caixa de dilogo Enviar como correio aparece imediatamente.

A qualquer momento que o programa no estiver ocupado, escolha Enviar como correio no menu Arquivo para chamar a caixa de dilogo Enviar como correio.

Enviar pginas via correio

89

1. Esta caixa de dilogo permite que voc especifique um tipo de arquivo, um intervalo de pgina, um nvel de formatao e opes de anexo: um anexo para todas as pginas, um anexo por pgina, anexo novo a cada pgina em branco ou um anexo para cada arquivo de entrada. Defina todas as opes e clique em OK. 2. Faa o login no seu aplicativo de correio se voc for solicitado a faz-lo. 3. O aplicativo de correio aparece com os anexos em uma nova mensagem vazia. Os anexos assumem o nome usado na ltima gravao do documento em OmniPage SE ou Sem ttulo de OmniPage. A extenso de arquivo adequada adicionada e sufixos numricos so usados para vrios anexos. 4. Coloque o destinatrio na mensagem de correio, adicione o texto da mensagem como desejado e clique no boto Enviar.
O programa pode detectar endereos de email enquanto reconhece pginas e transmite-as para o Editor de texto. Se voc clicar em um endereo, seu aplicativo de correio aparece com uma nova mensagem vazia contendo apenas o endereo de email.

90

Gravao e exportao

Captulo 6

Informaes tcnicas
Este captulo fornece informaes sobre soluo de problemas e outras informaes tcnicas sobre o uso do OmniPage SE. Leia o arquivo Leiame online e outros tpicos de ajuda ou visite as pginas da ScanSoft na Web. Sua seo sobre scanner contm informaes detalhadas e regularmente atualizadas sobre configurao e suporte de scanner. O arquivo Leiame contm informaes de ltima hora relativas ao OmniPage SE. O acesso ao arquivo Leiame e s pginas da ScanSoft na Web fornecido no menu Ajuda. Este captulo contm as seguintes informaes:
x

Soluo de problemas Solues para tentar primeiro Teste do OmniPage SE Aumentar recursos de memria Aumentar espao em disco O texto no reconhecido corretamente Problemas com reconhecimento de fax Problemas de desempenho ou de sistema durante o OCR Suporte a ODMA Recursos avanados em Programar OCR Tipos de arquivo compatveis Tipos de arquivo para abrir e salvar imagens Tipos de arquivo para salvar resultados de reconhecimento Desinstalao do software

x x x

OmniPage SE Manual do usurio

91

Soluo de problemas
Apesar do OmniPage SE ser projetado para ser fcil de usar, algumas vezes ocorrem problemas. Muitas das mensagens de erro contm descries autoexplicativas sobre o que fazer verificar conexes, fechar outros aplicativos para liberar memria etc. Algumas vezes, isto tudo que a soluo de problemas lhe ajuda a fazer. Consulte a documentao do Windows para obter informaes sobre como otimizar o desempenho do seu sistema e de seu aplicativo.

Solues para tentar primeiro


Experimente estas solues se voc estiver tendo problemas ao iniciar ou ao usar o OmniPage SE:
x x x

Certifique-se de que seu sistema atenda a todos os requisitos listados. Consulte Requisitos do sistema na pgina 12. Certifique-se de que o scanner est conectado e que todas as conexes de cabo esto seguras. Visite a seo de suporte do site da ScanSoft na Web em www.scansoft.com. Ela contm notas tcnicas sobre questes relatadas freqentemente sobre uso do OmniPage. As nossas pginas na Web tambm podem oferecer assistncia sobre o processo de instalao e soluo de problemas. Desligue o computador e o scanner, ligue o scanner novamente e, em seguida, reinicie o computador. Certifique-se de que os aplicativos esto funcionando adequadamente. Use o software que veio com o scanner para verificar se o scanner funciona adequadamente antes de us-lo com o OmniPage SE. Certifique-se de que voc possui os drivers corretos para o scanner, impressora e placa de vdeo. Visite a pgina da Scansoft na Web atravs do menu Ajuda e consulte sua seo sobre scanner para obter mais informaes. Execute ScanDisk para Windows 98 ou ME ou Check Disk para Windows NT, 2000 e XP para verificar se h erros no disco rgido. Consulte a ajuda on-line do Windows para obter mais informaes. Desfragmente o seu disco rgido. Consulte a ajuda on-line do Windows para obter mais informaes. Desinstale e reinstale o OmniPage SE, como descrito na ltima seo, Desinstalao do software na pgina 100.

x x

x x

92

Informaes tcnicas

Captulo 6

Teste do OmniPage SE
Reiniciar o Windows 98, Me, 2000 ou XP no modo seguro ou o Windows NT no modo VGA permite que voc teste o OmniPage SE em um sistema simplificado. Isto recomendado quando voc no consegue resolver problemas de queda do sistema ou se o OmniPage SE tem a execuo interrompida. Consulte a ajuda on-line do Windows para obter mais informaes.
O scanner no funcionar com o OmniPage SE no modo seguro ou em modo VGA, portanto, no teste problemas de scanner nesta configurao. w

Para testar o OmniPage SE no modo seguro (Windows 98, 2000, Me ou XP): 1. Reinicie o computador no modo de segurana pressionando F8 imediatamente depois de ver a mensagem Iniciando Windows. 2. Inicie o OmniPage SE e tente efetuar OCR em uma imagem. Use um arquivo conhecido de imagem, por exemplo, um dos arquivos de amostra de imagem fornecidos. Se o OmniPage SE no iniciar ou executar adequadamente no modo seguro, pode haver um problema com a instalao. Desinstale e reinstale o OmniPage SE (consulte o final deste captulo) e, em seguida, execute-o no modo seguro do Windows. Se o OmniPage SE funcionar no modo seguro, um driver de dispositivo no seu sistema pode estar interferindo na operao do OmniPage SE. Solucione o problema reiniciando o Windows no modo de confirmao passo a passo. Consulte a ajuda on-line do Windows para obter mais informaes.

Para testar o OmniPage SE no modo VGA (Windows NT): 1. Reinicie o computador. 2. Selecione a estao de trabalho do Windows NT, verso 4.00 [modo VGA] e pressione Enter. 3. Pressione Ctrl+Alt+Del e selecione o Gerenciador de tarefas. 4. Na caixa de dilogo Gerenciador de tarefas, selecione todos os aplicativos em segundo plano e clique em Finalizar tarefa. Consulte a ajuda on-line do Windows para obter mais informaes. 5. Inicie o OmniPage SE e tente efetuar OCR em uma imagem. Use um arquivo de imagem conhecido, como um dos arquivos de amostra fornecidos.

Soluo de problemas

93

Voc tambm pode executar o OmniPage SE a partir de uma linha de comando em seu prprio modo seguro. Escolha IniciarExecutar, procure pelo arquivo OmniPage.exe e adicione a opo de linha de comando /safe. Isto inicia o programa, mas ignora as configuraes armazenadas anteriormente e no tenta recuperar um documento que tenha sofrido um trmino anormal.

Aumentar recursos de memria


O OmniPage SE pode funcionar mal sob as condies de pouca memria. Isto pode ser indicado por vrias mensagens de erro ou se o OmniPage SE funciona lentamente e acessa o disco rgido freqentemente. Experimente estas solues para condies de pouca memria:
x x x x x x

Reinicie o computador. Feche os outros aplicativos abertos para liberar memria. Feche os aplicativos do OmniPage desnecessrios. Desfragmente o disco rgido para liberar blocos contguos de espao em disco. Consulte a ajuda on-line do Windows para obter instrues. Aumente a quantidade de espao em disco rgido disponvel. Aumente a memria fsica do computador (RAM). Mais memria otimiza o desempenho de OCR. Consulte Requisitos do sistema na pgina 12.

Aumentar espao em disco


Podem ocorrer problemas se o seu sistema ficar com pouco ou nenhum espao em disco. Experimente estas solues para problemas de pouco espao em disco:
x x x x x x x

Esvazie a lixeira do Windows. Feche todos os aplicativos abertos e exclua os arquivos *.tmp da pasta Temp. Normalmente, esta pasta est localizada na pasta Windows. Execute o ScanDisk ou o Check Disk Faa backup de arquivos desnecessrios em discos flexveis ou outra mdia e exclua-os do disco rgido. Remova os aplicativos do Windows que voc no usa. Desfragmente o seu disco rgido. Limpe a cache do seu navegador de Web e limite o seu tamanho.

94

Informaes tcnicas

Captulo 6

O texto no reconhecido corretamente


Tente estas solues se uma parte do documento original no for convertida para texto adequadamente durante o OCR. x Olhe na imagem da pgina original e assegure-se de que todas as reas de texto esto associadas a zonas de texto. Se uma rea no estiver dentro de uma zona, ela geralmente ignorada durante OCR. Consulte a seo sobre como criar e modificar as zonas, Trabalho com zonas na pgina 59. x Certifique-se de que as zonas de texto so identificadas corretamente. Identifique novamente os tipos de zona e o contedo, se necessrio, e efetue OCR no documento novamente. Consulte Tipos de zona e propriedades na pgina 57. x Certifique-se de que voc no carregou um gabarito inadequado por engano. Se as bordas de zona cortarem o texto, o reconhecimento prejudicado. x Ajuste os controles deslizantes de brilho e contraste no painel Scanner da caixa de dilogo Opes. Talvez voc precise experimentar combinaes de configuraes diferentes para chegar aos resultados desejados. x Verifique a resoluo na imagem original. Passe o cursor sobre uma miniatura de pgina para obter uma janela popup. Se a resoluo estiver significativamente acima ou abaixo de 300 dpi, provavelmente o reconhecimento ser afetado. x Certifique-se de que os idiomas corretos do documento esto selecionados no painel OCR na caixa de dilogo Opes. Somente os idiomas includos no documento devem ser selecionados. x Ative o IntelliTrain e faa algumas correes. Provavelmente, isto ajudar com as fontes com estilo ou com documentos degradados uniformemente. Se o IntelliTrain estava funcionando, experimente desativ-lo em alguns tipos de documentos degradados, ele pode no ajudar. As referncias a treinamento no se aplicam ao OmniPage SE. x Execute treinamento manual ou edite o treinamento existente para remover treinamentos mal sucedidos. x Se voc usa True Page como a visualizao do Editor de texto ou para exportao, o texto reconhecido disposto em caixas de texto ou quadros. Pode haver texto oculto se houver uma caixa de texto muito pequena. Para visualizar o texto, coloque o cursor na caixa de texto e use as teclas de seta no seu teclado para rolar para a parte superior, inferior, esquerda ou direita do quadro. x Verifique se h poeira, sujeira ou arranhes no vidro, nos espelhos e nas lentes de seu scanner. Limpe-os se necessrio.

Soluo de problemas

95

O OmniPage SE reconhece apenas caracteres impressos por mquinas, como impresso a laser ou texto escrito por mquina de escrever. Ele pode lidar com caracteres matriciais, apesar de que a preciso pode ser inferior em textos de qualidade baixa. Ele no pode ler texto escrito a mo. Entretanto, pode reter assinaturas e outros textos escritos mo como uma imagem grfica.

Problemas com reconhecimento de fax


Tente estas solues para melhorar a preciso de OCR sobre imagens de fax: x Pea aos remetentes para usarem documentos originais e limpos se possvel. x Pea aos remetentes para selecionarem o modo Melhor ou Otimizado quando enviarem um fax. Isto produz uma resoluo de 200 x 200 dpi. x Pea aos remetentes para transmitirem arquivos diretamente para seu computador via fax-modem se vocs dois o tiverem. Voc pode salvar as imagens de fax como arquivos de imagem e, em seguida, carreg-los no OmniPage SE. Consulte Entrada de arquivos de imagem na pgina 50.

Problemas de desempenho ou de sistema durante o OCR


Tente estas solues se uma falha no sistema ocorrer durante o OCR ou se o processamento demorar muito tempo: x Resolva os problemas de falta de memria e espao em disco. Consulte Teste do OmniPage SE na pgina 93. x Minimize todos os aplicativos ou clique em Alt+Tab para verificar se h mensagens de erro do Windows. x Verifique a qualidade da imagem. Consulte a documentao do scanner sobre as formas para melhorar a qualidade das imagens digitalizadas. x Divida pginas complexas (com muito texto e imagens grficas ou com formatao elaborada) em tarefas menores. Delimite as zonas manualmente ou modifique as zonas criadas automaticamente para efetuar OCR em uma rea de pgina por vez. Veja Trabalho com zonas na pgina 59. x Reinicie o Windows 98, Me, 2000 ou XP no modo seguro ou Windows NT no modo VGA e teste o OmniPage SE efetuando OCR nos arquivos de amostra includos. Se voc estiver realizando vrias tarefas no mesmo momento, como reconhecimento e impresso, o OCR pode demorar mais.

96

Informaes tcnicas

Captulo 6

Suporte a ODMA
Isso no se aplica ao OmniPage SE. Se sua rede local inclui um Sistema de Gerenciamento de Documentos (DMS) que suporta clientes ODMA, o OmniPage Pro poder trabalhar com ele. No OmniPage Pro surgir ento um painel ODMA na caixa de dilogo Opes permitindo que voc especifique tipos de arquivos permitidos e outras configuraes. Uma interface ODMA substituir as caixas de dilogo Carregar arquivo de imagem e Abrir documento do OmniPage (OPD). Isso permite carregar arquivos de imagem e OPDs, um por vez, do sistema de arquivos de rede ou de seu computador local. A caixa de dilogo Salvar como fornecer um boto Salvar para DMS para salvar documentos reconhecidos neste sistema. Para obter detalhes, consulte a Ajuda on-line.

Recursos avanados em Programar OCR


Isso no se aplica ao OmniPage SE. Programar OCR permite que voc especifique arquivos de entrada para uma tarefa. Algumas edies do OmniPage Pro permitem que voc especifique que todos os arquivos de um certo tipo em uma ou mais pginas sejam processados. Essas edies tambm oferecem tarefas de pasta observada. A primeira tela do Assistente de nova tarefa tem dois botes: Arquivos e pastas. Ela tambm exibe uma opo Observar pastas para verificar arquivos de entrada. Selecione esta opo e especifique uma ou mais pastas. Todos os arquivos do(s) tipo(s) especificado(s) que entrarem na(s) pasta(s) sero processados na chegada. No quinto painel do Assistente voc pode especificar tanto uma hora inicial quanto uma hora final para a tarefa de observao. Voc pode optar por no especificar uma hora final quando configurar a tarefa. Neste caso, use o boto Modificar do Programar OCR para especificar uma hora final posteriormente. Tambm possvel interromper e retomar tarefas. O boto Visualizar permite que voc veja um registro, arquivo por arquivo, de todo o processamento concludo dentro de uma tarefa selecionada. Quando uma tarefa est sendo executada, uma janela de registro da tarefa fica disponvel, exibindo o progresso, arquivo por arquivo, e relatando quaisquer problemas de processamento. O quarto painel do Assistente de nova tarefa permite que voc especifique um tipo de arquivo e escolha opes de separao de arquivo. Se voc escolher Um novo arquivo de sada para cada arquivo de entrada, voc precisa especificar apenas uma pasta, os arquivos de sada mantm os nomes dos arquivos de entrada com as extenses modificadas. Se voc escolher uma opo que requeira vrios arquivos de sada, voc deve especificar um nome de arquivo e o programa adiciona sufixos numricos para gerar nomes de arquivos nicos. Se voc especificar a entrada de um conjunto de pastas, possvel especificar uma pasta de sada diferente para cada pasta de entrada.

Suporte a ODMA

97

Tipos de arquivo compatveis


O programa compatvel com uma ampla gama de tipos de arquivo para imagem e texto.

Tipos de arquivo para abrir e salvar imagens


Tipo de arquivo BMP, Bitmap DCX GIF JPEG MAX PCX PDF PNG TIFF compactado com G3 TIFF compactado com G4 TIFF compactado com LZW TIFF FX TIFF PackBits TIFF no compactado Extenso bmp dcx gif jpg max pcx pdf png tif tif tif xif tif tif Vrias pginas No Sim n/a No Sim No n/a No Sim Sim n/a Sim Sim Sim Abrir / Salvar Abrir e Salvar Abrir e Salvar n/a Abrir e Salvar Abrir e Salvar Abrir e Salvar n/a (consulte a nota) Abrir e Salvar Abrir e Salvar Abrir e Salvar n/a Abrir Abrir e Salvar Abrir e Salvar P&B, tons de cinza, cores Todos Todos n/a Tons de cinza, cores Todos Todos n/a Todos P&B P&B n/a Todos Todos Todos

Os arquivos de imagem de entrada podem ter resolues de at 600 dpi, mas recomenda-se 300 dpi (horizontalmente e verticalmente) para fornecer tima preciso de OCR. O programa armazena imagens em preto e branco em sua resoluo original, mas as imagens em cores e em tons de cinza normalmente no so salvas com mais de 150 dpi. Isto significa que estes no so bons candidatos para futuros processamentos OCR. Passe o cursor sobre uma miniatura da imagem para obter uma janela instantnea mostrando o tamanho e a resoluo da imagem original.
Se voc tenta salvar uma imagem em preto e branco no formato JPEG, o programa oferecer converso para tons de cinza. Com TIFF G3 e G4, ele oferecer converso para preto e branco. No OmniPage Pro 12, h cinco opes para salvar em formato PDF. Duas delas, Apenas imagem e Imagem em texto, exportam imagens originais. Isto feito na caixa de dilogo Salvar como. Esse recurso no est disponvel no OmniPage SE. Alm disso, o OmniPage SE no pode gerenciar arquivos GIF e TIFF LZW. Consulte Salvar como PDF na pgina 88.

98

Informaes tcnicas

Captulo 6

Tipos de arquivo para salvar resultados de reconhecimento


Esta tabela mostra quais nveis de formatao esto disponveis para cada tipo de arquivo.
Extenso opf xls xls mif txt txt htm htm rtf rtf doc doc xls pdf pdf pdf pdf pdf rtf doc rtf wpd wpd wp5 xml txt csv txt opd
q q q q q q q q q q q q q q q q q q q q q q q q q

Tipo de arquivo

Sem formatao
q q q q q q q q q q q q q

RFP

Pgina ligada
(consulte

True Page

Planilha

Imagens grficas
qq

Tabelas

a nota 1)

eBook (consulte a nota 1) Excel 97, 2000 Excel 3.0 a 7.0 FrameMaker 5.5.3 Freelance Graphics Harvard Graphics HTML 4.0 (consulte a nota 1,2) HTML 3,2 (consulte a nota 2) Microsoft PowerPoint 97 Microsoft Publisher 98 Microsoft Word 6.0, 97, 2000, XP PageMaker 6.5.2 Quattro Pro para Windows 4.0, 8 PDF (Normal) (consulte a nota 1) PDF Editado (consulte a nota 1) PDF com imagens em texto (1) PDF com substitutos de imagem
(consulte a nota 1)

q q q q q q q q q q q q q q q q q q q q q q

q q q

qq

qq

qq q q

qq qq qq qq qq qq

q q qq qq qq qq q

qq qq q q q qq q qq qq qq qq q

q qq q q q qq qq qq qq qq qq

(q )
q

PDF, somente imagem (1) RTF Word 2000, 97, 95/6.0 (3) Ventura Publisher WordPad WordPerfect 8, 9, 10 WordPerfect 6.0, 6.1 WordPerfect 5,1, 0,5, 0,2 XML (consulte a nota 1) Texto e texto com quebras de linha
(consulte a nota 4)

(q )
q

(q )
q q

Texto Separado por vrgula (4) Texto Formatado (4) Documento do OmniPage (5)

(q )
q q

Salvo conforme exibido

Tipos de arquivo compatveis

99

Imagens grficas
q Tipo de arquivo suporta imagens grficas qq Tipo de arquivo suporta imagens grficas, com opo de exportao para manter ou descartar imagens grficas. Tabelas q Tipo de arquivo suporta tabelas em grades, no h opes de tratamento de tabela no momento da exportao qq Tipo de arquivo suporta tabelas, escolha entre usar grades ou colunas separadas por tabulao q Tipo de arquivo no suporta grades de tabela, escolha converter para colunas separadas por tabulao ou espao

1 2 3

O OmniPage SE no oferece o recurso de sada de pgina ligada e de esses tipos de arquivo. Ao salvar em HTML, todas as imagens grficas so salvas em arquivos de imagem separados usando o formato JPEG. Os resultados de reconhecimento so enviados para a rea de transferncia no formato RTF 95/6.0 e sero colados neste formato se possvel e como texto Unicode ou texto ASCII se no for possvel. Todos os formatos de texto esto disponveis como Texto ou Unicode. O texto Unicode pode tratar a maior gama de caracteres com acento. OmniPage SE pode abrir documentos criados pelo OmniPage SE ou pelo OmniPage Pro 12. Ele tambm pode abrir arquivos OPD criados pelo OmniPage Pro 10, 11 e sua Edio Especial. Esses arquivos entram no programa como documentos sem nome. Para manter um OPD no formato antigo e tambm salvlo como um novo OPD, escolha um nome diferente para evitar escrever sobre o arquivo antigo.

4 5

Desinstalao do software
Algumas vezes a desinstalao e reinstalao do OmniPage SE resolver o problema. Voc tambm deve desinstalar o OmniPage SE antes de instalar o OmniPage Pro 12 ou qualquer software OmniPage de avaliao. O programa de desinstalao do OmniPage SE no remover nenhum dos seguintes arquivos criados pelo usurio: Gabaritos de zona (*.zon) Arquivos de treinamento (*.otd) (Isso no se aplica ao OmniPage SE.) Dicionrios do usurio (*.ud) Documentos do OmniPage (*.opd) Para desinstalar do Windows NT, 2000 ou XP, voc precisa ter efetuado login em seu computador com privilgios de administrador.

100

Informaes tcnicas

Captulo 6

Para reinstalar ou desinstalar o OmniPage SE:


x x x x x x

Feche o OmniPage SE. Clique em Iniciar na barra de tarefas do Windows e escolha Painel de controle e Adicionar/Rremover programas. Selecione OmniPage SE e clique em Alterar. Clique em Avanar na caixa de dilogo que aparece. Selecione Remover todos ou Reparar todas e, em seguida, Avanar. Siga as instrues at que o processo tenha terminado.

Desinstalao do software

101

102

Informaes tcnicas

N D I C E

R E M I S S I V O

A barra de menus, 25 Abertura de arquivos de imagem, 50, 98 Acrescentar a zonas, 60 pginas a um documento, 41 palavras a um dicionrio de usurio, 68 treinamento a arquivos de treinamento, 74 ADF, 33, 50, 52 Agrupar elementos, 76 Ajuda on-line, 9 Sensvel ao contexto, 9, 25, 33 Ajuda sensvel ao contexto, 9, 25, 33 Alimentador automtico de documentos (ADF), 33, 50, 52 Alternar entre o processamento manual e automtico, 27, 43 Ambiente, 24 Ambiente do OmniPage, 24 Ampliao de exibies, 24, 68 Anexos a mensagens de correio, 89 rea de transferncia, 41, 88 reas com vrias colunas, 26, 76 Armazenar alteraes de zoneamento, 77 Arquivo de sada PDF, 98 Arquivos como destino de exportao, 82 como origem da imagem, 50 mantido na desinstalao, 100 opes de separao, 83, 90 tipos, 83 tipos compatveis, 98 tipos para exportao, 85, 99 Arquivos de imagem abrir, 98 amostras, 93 entrada, 22, 50 ordem de leitura, 50 tipos, 98 Arquivos de imagem de amostra, 36, 93 Arquivos de imagem de vrias pginas, 50, 82, 98 Arquivos de imagem TIFF, 98 Arquivos OPD definio, 31 propsito de, 32

salvar em, 32 Assistente para configurao do scanner, 14 para processamento, 45 para Programar OCR, 49, 97 Assistente de nova tarefa, 49, 97 Atributos de caracteres, 75 Atualizao para o OmniPage Pro, 19 Audio de textos lidos em voz alta, 78 Aumentar espao em disco, 94 Aumentar recursos de memria, 94 Aviso para salvar dados de treinamento, 31

B
Barra de ferramentas de acoplamento e flutuao, 25, 68 Barra de ferramentas de flutuao, 25 Barra de ferramentas de formatao, 24, 25 Barra de ferramentas de imagem, 24, 25 Barra de ferramentas padro, 24, 25 Barras de ferramentas de acoplamento, 25 Boto Efetuar OCR, 40, 43 Boto Exportar resultados, 41, 43, 83 Boto Obter pgina, 40, 42 Brilho, 33, 51, 95

C
Caixa de dilogo Carregar arquivo de imagem, 50 Caixa de dilogo Corretor, 67 Caixa de dilogo Enviar correio, 89 Caixa de dilogo Opes, 33 Caixa de ferramentas do OmniPage, 24, 27, 40 Caixas, 26, 76 Caixas para texto reconhecido, 95 Caracteres no reconhecidos, 66 suspeitos, 66 Caracteres no imprimveis, 66 Carregar arquivos de treinamento, 74 Arquivos OPD, 31 gabaritos de zona, 54, 63 um dicionrio de usurio, 70 Colorido digitalizar, 51 imagens, 82

marcadores, 68 Coluna Nota no Gerenciador de documentos, 30 Coluna nica pginas, 53, 57 pginas com tabelas, 54 Colunas em tabelas, 62 no Gerenciador de documentos, 30 Comparao das palavras reconhecidas com as originais, 68 Concluir um documento, 41 Configurao do Direct OCR, 47 Configurao do scanner, 14 Configuraes efeito das configuraes, 34 na caixa de dilogo Opes, 33 no Assistente de OCR, 46 Obter texto, 47 para o Direct OCR, 47 tipos de zona, 61 Conselho sobre problemas, 92 Contedo dos documentos do OmniPage, 84 Contraste, 33, 51, 95 Controle sobre o processamento, 42 Converso de imagens, 98 Conversores de exportao, 86 Copiar pginas para a rea de transferncia, 45, 88 Correo em futuras sesses, 31 opes, 34, 67 Correo de resultados de OCR, 67 Correo remota, 31 Correio, 41, 89 Criao de dados de treinamento, 74

D
Dados de treinamento no salvos, 31 Desagrupar elementos, 76 Descarregamento de um dicionrio de usurio, 70 Descarregar arquivos de treinamento, 74 Descarregar gabaritos de zona, 63 Descrio do layout, 40, 45, 53 Descrio do layout de documento, 40, 53 Desenhar zonas no Direct OCR, 47 Desinstalao do software, 100 Dicionrios, 45, 68

OmniPage SE Manual do usurio

103

Dicionrios do usurio, 67, 70 acrescentar palavras, 67 carregar, 70 descarregar, 70 edio, 70 iniciando, 70 Dicionrios jurdicos, 68 Dicionrios mdicos, 68 Dicionrios profissionais, 68 Digitalizao Assistente, 14 brilho, 33, 51 colorido, 51 contraste, 33 entrada de, 51 figuras, 51 livros, 33 preto e branco, 51 tons de cinza, 51 Digitalizao de livros, 33 Digitalizao de pgina dupla, 33 Direct OCR, 46 Painel Opes, 33 Diviso de zonas, 57 Documentos com frente e verso, 53 com layout variado, 53 concluir, 41 copiar para a rea de transferncia, 45, 88 descrio do layout, 53 exportar, 23, 40, 43, 81 fechar, 31 gerenciamento, 28 gravao, 32, 81 local para novas pginas, 33 no concludo, 31 no OmniPage SE, 23 salvar enquanto trabalha, 84 Documentos do OmniPage contedo do, 84 definio, 31 propsito de arquivos OPD, 32 salvar como, 32, 84 Documentos frente e verso, 52 Documentos inacabados, 31 Drivers TWAIN para scanners, 14

tempo real, 77 texto reconhecido, 75 Editor de texto, 24, 26, 34, 66 Efeito das configuraes, 34 Entrada de arquivo de imagem, 50 de arquivos PDF, 50, 98 do scanner, 51 Entrada de arquivo PDF, 50, 98 Entrada de pasta para Programar OCR, 97 Enviar pginas via correio, 89 Espao em disco, 12, 94 Etapas bsicas de processamento, 23 Excluir arquivos de treinamento, 74 dicionrios de usurio, 70 gabaritos de zona, 63 pginas, 28, 30 Exemplos de treinamento, 71 Exportao repetida, 81, 84 Exportao True Page, 86 Exportar imagens grficas, 83, 100 Pgina ligada, 85 para a rea de transferncia, 88 para aplicativos de destino, 23, 42, 82 para correio, 89 para o arquivo, 83, 99 para PDF, 88, 99 repetido, 81, 84 tipos de arquivo e nveis de formatao, 99 True Page, 86

colorido, 82 converso, 98 edio, 76 gravao, 82, 98 obteno, 23, 42 planos de fundo, 54 preto e branco, 82 qualidade, 51 resoluo, 29, 82, 95, 98 substitutos em PDF, 88 tamanho, 29 tons de cinza, 82 Imagens grficas edio, 76 em arquivos HTML, 100 na exportao, 83, 99 Impresso documentos, 31 pginas reconhecidas, 31 Indicadores de cabealho/rodap, 66 Informaes tcnicas, 91 Iniciando o programa, 14 Iniciar aplicativo de destino, 84 Incio de um dicionrio de usurio, 70 Insero de divisores de tabela, 62 Instalao do OmniPage SE, 13 scanners, 14 IntelliTrain, 34, 49, 72, 95 Interromper o processamento automtico, 41 Itens de menu Obter texto, 47

F
Fechar documentos, 31 Finalidade do treinamento, 71

E
Edio e zoneamento em tempo real, 77 Edio no modo True Page, 76 Editar arquivos de treinamento, 74 atributos de caracteres, 75 atributos de pargrafo, 75 dicionrios de usurio, 70 imagens grficas, 76 no modo True Page, 76 Sada de PDF, 88 tabelas, 61, 76

Gerao de divisores de tabela, 62 Gerenciador de documentos, 24, 28, 29 personalizar colunas no, 30 Gerenciador de tarefas, 93 Gerenciamento de documentos, 28 Gravao de imagem original, 82, 98 Gravao de texto, 83 Guia de incio rpido, 36

H I

Layout de deteco automtica, 53 Layout personalizado, 34, 54 Layout, deteco automtica, 53 Leitura ordem dos arquivos de imagem, 50 texto em voz alta, 78 Linhas em tabelas, 62 Links para pginas da Web, 76 Lista suspensa Obter pginas, 42 Resultados da exportao, 43 Lista suspensa Obter pginas, 42 Local para novas pginas, 33 Localizar palavras ausentes do dicionrio, 67 palavras suspeitas, 67

Hyperlinks, 76 Idioma de interface, 33 Idiomas para interface de usurio, 33 para reconhecimento, 33, 45, 95 Imagens

Manter estilos de pargrafos, 83 Marcadores, 66, 68 Melhoria da preciso, 51, 72, 95 Menus de atalho, 58 Miniaturas, 24, 26, 28 Modificar gabaritos de zona, 63 Modo seguro, 93 Modo VGA, 93

104

ndice remissivo

Mover divisores de tabela, 62 entre pginas, 28 MS Outlook, 89 Mudana de linha, 34 Mudar ordem de leitura, 76 parte de uma pgina, 77 tipos de zona, 58

Opes de processamento, 33 Opes de salvamento, 86 Opes para correo, 34, 67 Ordem de leitura, 76 Ordem dos elementos da pgina, 76 Otimizar o brilho, 33, 51

N
No completar o processamento automtico, 41 Nveis de formatao, 49, 66, 99 Nveis de formatao e tipos de arquivo, 99 Novo arquivo em pgina vazia, 50 Novos recursos, 17

O guia do teclado para audio de textos, 78 Obteno de Ajuda on-line, 9 Obteno de imagens, 23, 42 OCR Assistente, 39, 45, 46 configuraes, 33 configuraes do Direct OCR, 46 definio, 22 desempenho fraco durante, 96 Direct OCR, 33, 46 processamento automtico, 27, 40 processamento manual, 27, 42 Programar OCR, 49 realizar OCR, 23 resultados das correo, 67 tarefas em Programar OCR, 49 verificao dos resultados de OCR, 68 Ocultar ou mostrar marcadores, 66 OmniPage Pro atualizando para, 19 novos recursos do, 17 OmniPage SE desinstalao, 100 documentos no, 23 iniciando, 14 Instalao do, 13 recursos, 19 recursos do OmniPage SE comparados com os do OmniPage Pro, 8, 10, 19 registrando, 17 reinstalao, 100 testes, 93 verses anteriores, 13 On-line Ajuda HTML, 9 registro, 17 Opes avanadas de salvamento, 86

Pgina ligada, 85 Pginas arquivos de imagem de vrias pginas, 50, 82, 98 Boto Obter pgina, 40, 42 coluna nica, 53, 57 copiar para a rea de transferncia, 45, 88 corrigidas, 28 enviar como correio, 89 excluir, 28, 30 localizao no documento, 33 modificadas, 28 mover entre, 28 navegao, 24, 78 novo arquivo em pgina vazia, 50 obtidas, 28 pginas com coluna nica e com tabelas, 53 pginas de planilha, 53 pendentes, 28 reconhecer tudo novamente, 41 reconhecidas, 28 reorganizao, 28 salvas, 28 selecionar vrias, 28, 29 status, 28 vrias colunas, 53 zoneada, 28 Pginas com vrias colunas, 54 Pginas corrigidas, 28 Pginas de planilha, 54 Pginas modificadas, 28 Pginas obtidas, 28 Pginas pendentes, 28, 77 Pginas reconhecidas, 28 Pginas salvas, 28 Painel de imagem, 24, 26 Palavras ausentes do dicionrio, 66 Palavras marcadas no Editor de texto, 66 Palavras suspeitas, 66 PaperPort, 48 Pargrafo editar atributos, 75 estilos, 75, 83 manter estilos de pargrafos, 84 Parar o processamento automtico, 41 Pastas observadas, 97 Personalizar barras de ferramentas, 25 Colunas do Gerenciador de documentos, 30

conversores de exportao, 86 Planos de fundo do tipo ignorar, 54 Planos de fundo do tipo processar, 54 Planos de fundo para zoneamento, 26, 54 Posicionamento da nova pgina no documento, 33 Preciso Influncia do brilho, 51 influncia do modo de digitalizao, 51 influncia do treinamento, 71 melhoria, 51, 71, 95 Preto e branco digitalizar, 51 imagens, 82 Problemas com reconhecimento de fax, 96 Problemas de desempenho durante o OCR, 96 Problemas de desempenho ou de sistema durante o OCR, 96 Processamento alternar entre o processamento manual e automtico, 27, 43 automtico, 27, 40 com o Assistente de OCR, 45 combinado, 27, 43 de outros aplicativos, 46 documentos em futuras sesses, 31 etapas bsicas do, 23 etapas, viso geral, 23, 38 interromper o processamento automtico, 41 manual, 27, 42 parar o processamento automtico, 41 passo a passo, 42 processamento automtico incompleto, 41 reiniciar o processamento automtico, 41 Processamento automtico, 27, 40 Processamento combinado, 27, 43 Processamento manual, 27, 42 Processamento passo a passo, 23, 42 Processamento preterido, 31 Procura de sada de PDF, 88 Programar OCR, 49 entrada de pastas, 97 pastas observadas, 97 Propsito de arquivos OPD, 32 Propriedades de zonas, 57

Q R

Quadros, 26, 76, 86, 95 Qualidade de imagens, 51 Reconhecer pginas novamente, 43 Reconhecimento acelerar, 96

OmniPage SE Manual do usurio

105

executar, 42 idiomas, 33, 45, 95 preciso, 51, 71, 95 problemas com reconhecimento de fax, 96 salvar resultados, 83 Reconhecimento de fax, 96 Reconhecimento lento, 96 Reconhecimento ptico de caracteres, 22 Recurso de converso de texto em fala, 13, 78 Recursos, novos, 17 Redimensionamento de zonas, 59 Registro aplicativos para Direct OCR, 47 OmniPage SE, 17 Reiniciar o processamento automtico, 41 Reinstalao do OmniPage SE, 100 Remoo de divisores de tabela, 62 Reordenar pginas, 28 Requisitos de memria, 12, 94 Requisitos do sistema, 12 Requisitos mnimos do sistema, 12 Resoluo, 29, 82, 95, 98 Reteno de layout, 67 Retirar imagens grficas da exportao, 83

T
Tabelas colunas em, 62 edio, 76 editar divisores, 61 em pginas com coluna nica, 54 gerar divisores, 62 inserir divisores, 62 linhas em, 61 mover divisores, 62 remover divisores, 61 tratamento de tabela no Editor de texto, 76 zonas, 58, 61 Tarefas em Programar OCR, 49 Testes do OmniPage SE, 93 Texto em itlico, 75 Texto em negrito, 75 Texto sublinhado, 75 Textos impressos por impressora matricial, 96 Tipos de arquivo compatveis, 98 Tipos de zonas, 57 Tons de cinza digitalizar, 51 imagens, 82 Trabalho com zonas, 59 Treinamento, 71 arquivos de treinamento, 74 automtico, 72 aviso para salvar dados, 31 carregar arquivos de treinamento, 74 criao de dados de treinamento, 74 dados de treinamento no salvos, 31 descarregar arquivos de treinamento, 74 editar arquivos de treinamento, 74 IntelliTrain, 72 manual, 72 salvar arquivos de treinamento, 74 Treinamento automtico, 72 Treinamento manual, 72 Treinar novamente, 72 True Page, 26

das etapas de processamento, 23 do documento, 28 do processamento, 38 Viso geral do processamento, 36 Visualizao Preservar fontes e pargrafos, 66, 85 Visualizao Sem formatao, 66, 85 Visualizao True Page, 67 Visualizaes Manter fontes e pargrafos, 66 Sem formatao, 66 True Page, 67 Visualizaes do Editor de texto, 26, 66

S
Salvar arquivos de treinamento, 74 como documento OmniPage, 32, 84 dicionrios de usurio, 70 documentos, 81 documentos enquanto trabalha, 84 gabaritos de zona, 63 imagens originais, 82, 98 no formato OPD, 32, 83 opes, 86 para o arquivo, 45, 82 resultados do reconhecimento, 83 Salvar e iniciar, 84 texto, 83 Scanners, 51, 95 configurao, 14 drivers, 14 duplex, 52 Scanners duplex, 52 Seleo de vrias pginas, 29 Selecionar vrias pginas, 29 Soluo de problemas, 91, 92 Solues para desempenho baixo, 92 Substituir gabaritos de zona, 63 Subtrao de zonas, 57 Sugestes durante a correo, 68 Suporte a DMS, 97 Suporte a ODMA, 97

Unio de zonas, 60 Unidade de medida, 34 URLs, 76 Uso do Direct OCR, 47

Verificao de texto, 68 Verificao dos resultados de OCR, 68 Verificador dinmico, 68 Viso geral

Zona alfanumrica, 57 Zona de texto, 58 Zona grfica, 58 Zona numrica, 57 Zonas, 26 adicionar a, 60 alfanumrica, 57 definir tipos, 62 descarregar gabaritos, 64 desenhar no Direct OCR, 47 dividir, 58 excluir gabaritos, 63 gabaritos, 54, 63, 95 ignorar, 58 imagens grficas, 58 irregulares, 59 manual, 54, 95, 96 modificar gabaritos, 63 mudar tipos, 58 na pgina, 28 numrica, 57 processar, 58 propriedades, 57 redimensionar, 59 retangulares, 59 salvar gabaritos, 63 substituir gabaritos, 63 subtrair de, 58 tabela, 58, 61 texto, 58 tipos, 26, 57, 95 trabalhar com, 59 unir, 60 Zonas de gabarito, 54, 63, 95 Zonas do tipo ignorar, 58 Zonas do tipo processar, 58 Zonas irregulares, 59 Zonas retangulares, 59 Zoneamento automtico, 26, 34, 40, 53, 58 Zoneamento em tempo real, 77 Zoneamento manual, 42, 54

106

ndice remissivo

Você também pode gostar