Escolar Documentos
Profissional Documentos
Cultura Documentos
LEGALES
Copyright 2002 ScanSoft, Inc. Reservados todos los derechos. El software descrito en esta publicacin se otorga bajo licencia y slo se puede usar o copiar segn los trminos establecidos en dicha licencia. AV I S O
IMPORTANTE
ScanSoft, Inc. proporciona esta publicacin "tal cual" sin garantas de ninguna ndole, ya sean expresas o implcitas, incluyendo, pero sin limitacin alguna, las garantas implcitas de comerciabilidad o idoneidad para fines particulares. Algunos estados o jurisdicciones no permiten la renuncia a garantas expresas o implcitas en ciertas transacciones, por lo tanto, esta afirmacin puede no aplicarse a su caso particular. ScanSoft se reserva el derecho de actualizar esta publicacin y de hacer cambios de vez en cuando en el contenido actual sin verse obligada a notificar a ninguna persona de dichas actualizaciones o cambios. MARCAS
COMERCIALES Y CRDITOS
ScanSoft, OmniPage, OmniPage SE, OmniPage Pro, PaperPort, Pagis, True Page y Direct OCR son marcas registradas o comerciales de ScanSoft, Inc., en los Estados Unidos y otros pases. Todos los dems nombres de empresas o productos aqu mencionados pueden ser marcas comerciales de sus respectivos titulares.
ScanSoft, Inc.
9 Centennial Drive Peabody, MA 01960 E.U.
Ref. N 58-281201-04A
O N T E N I D O
BIENVENIDO
Uso de esta gua Obtener ayuda en lnea Ayuda en lnea HTML Ayuda contextual Notas tcnicas Glosario OmniPage SE
7
8 9 9 9 10 10 10
INSTALACIN Y CONFIGURACIN
Requisitos del sistema Instalacin de OmniPage SE Configuracin del escner con OmniPage SE Cmo iniciar el programa Registro del software Nuevas caractersticas de OmniPage Pro 12 OmniPage SE y OmniPage Pro 12
11
12 13 14 16 17 17 19
INTRODUCCIN
Qu es el reconocimiento ptico de caracteres? Funciones de OCR de OmniPage SE Documentos en OmniPage SE Pasos bsicos de procesamiento El escritorio de OmniPage Barra de mens
21
22 22 23 23 24 25
iii
Las barras de herramientas El Panel de imgenes El Editor de texto Caja de herramientas de OmniPage Administracin de documentos Miniaturas Administrador de documentos Personalizar columnas del Administrador de documentos Eliminar pginas de un documento Imprimir un documento Cerrar un documento Documentos de OmniPage Cmo guardar un archivo en formato OPD Parmetros
25 26 26 27 28 28 29 30 30 31 31 31 32 33
PROCESAMIENTO DE DOCUMENTOS
Gua de inicio rpido Carga y reconocimiento de archivos de imgenes de ejemplo Exploracin y reconocimiento de una sola pgina Generalidades del procesamiento Procesamiento automtico Procesamiento manual Procesamiento combinado Procesamiento con el Asistente de OCR Procesamiento a partir de otras aplicaciones Cmo configurar Direct OCR
35
36 36 36 38 40 42 43 45 46 47
iv
Contenido
Cmo usar Direct OCR Cmo usar OmniPage SE con PaperPort Procesamiento con Programar OCR Definicin del origen de imgenes de las pginas Entrada desde archivos de imagen Entrada desde escner Exploracin con un alimentador automtico de documentos Exploracin sin un alimentador automtico de documentos Descripcin del diseo del documento Zonas y fondos Separacin automtica de zonas Separacin manual de zonas Tipos y propiedades de zonas Trabajo con zonas Cuadrculas de tablas en la imagen Uso de plantillas de zonas
47 48 49 50 50 51 53 53 54 55 56 56 58 59 62 64
VERIFICACIN Y EDICIN
Pantalla y vistas del editor Verificacin de los resultados de OCR Verificar texto Diccionarios del usuario Capacitacin Capacitacin manual IntelliTrain Archivos de capacitacin Edicin de texto e imgenes Edicin inmediata Lectura de texto en voz alta
67
68 69 70 72 73 74 74 75 77 79 80
GUARDAR Y EXPORTAR
Guardar imgenes originales Guardar los resultados del reconocimiento Guardar un documento mientras trabaja Seleccionar un nivel de archivo Seleccionar opciones avanzadas de guardar Guardar en PDF Copiar pginas al Portapapeles Enviar pginas por correo
83
84 85 86 87 88 90 90 91
INFORMACIN TCNICA
Resolucin de problemas Soluciones iniciales Probar OmniPage SE Aumentar los recursos de memoria Aumentar el espacio de disco El texto no se reconoce correctamente Problemas con el reconocimiento de fax Problemas de sistema o rendimiento durante el OCR Compatibilidad con ODMA Caractersticas avanzadas en Programar OCR Tipos de archivo compatibles Tipos de archivos para abrir y guardar imgenes
93
94 94 95 96 97 97 98 99 99 100 101 101
Tipos de archivos para guardar los resultados del reconocimiento 102 Desinstalacin del software 103
vi
Contenido
Bienvenido
Bienvenido a OmniPage SE y gracias por preferir nuestro software. La siguiente documentacin se proporciona a modo de ayuda para comenzar y como resumen del programa. Esta Gua del usuario Esta gua es una introduccin al uso de OmniPage SE (Special Edition). Incluye las instrucciones de instalacin y configuracin, una descripcin de los comandos y reas de trabajo del programa, instrucciones especficas de tareas, mtodos para personalizar y controlar el procesamiento e informacin tcnica. La gua viene en formato PDF, lo que le permite utilizar saltos de hipervnculos en referencias cruzadas y otras herramientas de navegacin en su visor de PDF. Ayuda en lnea La ayuda en lnea de OmniPage SE contiene informacin acerca de las caractersticas, parmetros y procedimientos. La ayuda en lnea viene en formato HTML, y ha sido diseada para acceder a la informacin de manera rpida y sencilla. La completa ayuda contextual brinda la asistencia suficiente para permitirle seguir trabajando sin perder tiempo. Consulte Obtener ayuda en lnea en la pgina 9. Archivo Lame El archivo Lame contiene la informacin ms reciente acerca del software. Lalo antes de usar OmniPage SE. Para abrir este archivo HTML, seleccinelo en el Instalador de OmniPage SE o, bien, ms adelante en el men Ayuda. Exploracin y otra informacin En el sitio web www.scansoft.com de ScanSoft encontrar la informacin ms reciente acerca del programa. La Gua de escneres contiene la informacin ms actualizada acerca de los escneres compatibles y temas relacionados; ScanSoft prueba los 25 modelos de escner de uso ms frecuente. Tambin es posible acceder al sitio web de ScanSoft desde el Instalador de OmniPage SE o, bien, ms adelante en el men Ayuda.
Non-serif
Bienvenido
Ayuda contextual
Es posible ver una ventana emergente con informacin concisa y puntual sobre un elemento de men, botn de la barra de herramientas, rea de la pantalla o cuadro de dilogo particulares de OmniPage SE, de las siguientes maneras: Haga clic en la herramienta de Ayuda en la barra de herramientas Estndar para invocar el icono de ayuda. Haga clic en cualquier elemento del escritorio fuera del cuadro de dilogo o mensaje de advertencia. Pulse Mays + F1 para invocar el mismo icono de ayuda. Utilice Mays + F1 para obtener la ayuda contextual de los elementos de men rpido. Haga clic en el signo de interrogacin situado en la esquina superior derecha de un cuadro de dilogo y luego haga clic en un elemento de dicho cuadro de dilogo para ver una ventana emergente. Algunos cuadros de dilogo o mensajes de advertencia tienen su propio botn o texto de ayuda. Haga clic en el botn o texto para obtener informacin acerca del cuadro de dilogo o de mensaje. Haga clic en cualquier lugar para que desaparezca la ventana emergente de ayuda contextual.
Notas tcnicas
En el sitio web www.scansoft.com de ScanSoft encontrar notas tcnicas sobre temas comnmente mencionados al usar OmniPage. Las pginas web tambin pueden ofrecer asistencia acerca del proceso de instalacin y resolucin de problemas.
Glosario
Esta gua no contiene un glosario. La ayuda en lnea tiene un completo glosario, con su propio ndice alfabtico y una tabla de contenido. Consltelo si desea averiguar el significado de algn trmino utilizado en esta gua o en el programa.
OmniPage SE
Esta es la versin Special Edition del mundialmente conocido programa OmniPage Pro. Esta versin, desarrollada para ser distribuida con fabricantes de escneres seleccionados, cuenta con un conjunto reducido de las funciones incluidas en el producto OmniPage Pro 12. Esta Gua as como la Ayuda en lnea describen las funciones del producto completo, y un icono SE seala en el documento las diferencias entre las dos versiones.
Si le resultan ventajosas las funciones adicionales de la versin profesional, utilice las facilidades en lnea para actualizar su versin Special Edition 2.0 a OmniPage Pro 12. Consulte OmniPage SE y OmniPage Pro 12 en la pgina 19.
10
Bienvenido
Captulo 1
Instalacin y configuracin
Este captulo contiene informacin acerca de la instalacin e inicio de OmniPage SE. Se presentan los siguientes temas:
x x x x x x x
Requisitos del sistema Instalacin de OmniPage SE Configuracin del escner con OmniPage SE Cmo iniciar el programa Registro del software Nuevas caractersticas de OmniPage Pro 12 OmniPage SE y OmniPage Pro 12
11
Un ordenador con procesador Pentium o superior Microsoft Windows 98 (segunda edicin o superior), Windows Me, Windows NT 4.0 (por lo menos con Service Pack 6), Windows 2000 o Windows XP 64 MB de memoria (RAM), se recomiendan 128 MB 90 MB de espacio libre en el disco duro para los archivos de la aplicacin, ms 5 MB de espacio de trabajo durante la instalacin 5 MB para Microsoft Installer (MSI) si no estuviera instalado (MSI est presente como parte del sistema operativo en Windows Me, Windows 2000 y Windows XP) Monitor SVGA con 256 colores, pero de preferencia a color de 16 bits (se describe como color de alta densidad en Windows 2000 y como color mediano en XP) y una resolucin de 800 x 600 pxeles Dispositivo sealador compatible con Windows Unidad de CD-ROM para la instalacin Un escner compatible, el cual debe contar con su propio software controlador si usted tiene pensado explorar documentos. En la gua de escneres en el sitio web de ScanSoft (www.scansoft.com) encontrar una lista de todos los escneres compatibles.
El rendimiento y velocidad aumentarn si el procesador, memoria y espacio disponibles en su equipo son superiores a los requisitos mnimos.
x x x
x x x
12
Instalacin y configuracin
Captulo 1
Instalacin de OmniPage SE
El programa de instalacin de OmniPage SE le guiar a travs de la instalacin mediante instrucciones en cada pantalla. Antes de instalar OmniPage SE:
x x x
Cierre todas las dems aplicaciones, especialmente programas antivirus. Regstrese en su equipo con privilegios de administrador si ha de instalar el programa en Windows NT, 2000 o XP.
Si su sistema ya tiene instalada una versin anterior de un programa OCR de ScanSoft, el instalador le solicitar la autorizacin para desinstalar dicho producto primero.
1. Introduzca el CD-ROM de OmniPage SE en la unidad de CD-ROM. El programa de instalacin debiera iniciarse automticamente. De no ser as, busque la unidad de CD-ROM en el Explorador de Windows y haga doble clic en el programa Autorun.exe que aparece en el nivel superior del CDROM. 2. Elija el idioma a usar durante la instalacin. Este idioma se utilizar para el sistema texto a lenguaje y como el idioma de la interfaz del programa. El idioma de la interfaz del programa se utiliza para presentar los elementos de men, cuadros de dilogo, mensajes de advertencia, etc. Es posible cambiar el idioma de la interfaz posteriormente en OmniPage SE, pero su eleccin al momento de la instalacin determina qu sistema de texto a lenguaje se instalar en el programa. Consulte la segunda nota que aparece a continuacin. Las referencias a la funcin de lectura en voz alta no se aplican a OmniPage SE. 3. Siga las instrucciones en cada pantalla para instalar el software. Todos los archivos necesarios para la exploracin se copian automticamente durante la instalacin.
En algunas ocasiones la solucin puede consistir en desinstalar y luego volver a instalar OmniPage SE. Consulte Desinstalacin del software en la pgina 103. En OmniPage Pro 12, la funcin de lectura en voz alta est disponible para alemn, espaol, francs, ingls (britnico y estadounidense), italiano o portugus. No est disponible en OmniPage SE. Consulte Lectura de texto en voz alta en la pgina 80.
Instalacin de OmniPage SE
13
Elija InicioProgramasScanSoft OmniPage SE 2.0 Asistente del escner, o, bien, haga clic en el botn de configuracin en el panel Escner del cuadro de dilogo Opciones. O, en ltimo caso, elija un parmetro de exploracin en la lista desplegable Obtener pgina en la Caja de herramientas de OmniPage y haga clic en el botn Obtener pgina.
Se iniciar el Asistente de configuracin del escner. El primer panel aparece slo en la primera configuracin cuando se le invoca desde OmniPage SE. x Escoja Seleccionar escner o cmara digital y, luego, haga clic en Siguiente. Se mostrar una lista de todos los controladores de escner TWAIN detectados, y aparecer seleccionado el escner predeterminado del sistema. x Haga clic una vez para seleccionar el controlador del escner que desea utilizar. Haga clic en Otros controladores... si necesita explorar en busca de un controlador. Seleccione Configurar parmetros avanzados para que aparezca un panel adicional si desea que la propia interfaz de su escner quede oculta durante la exploracin o si desea modificar el mtodo de transferencia de imgenes. Haga clic en Siguiente. x Seleccione S para probar la configuracin de su escner y luego haga clic en Siguiente. El asistente probar la conexin desde el ordenador al escner. Una vez que haya finalizado, haga clic en Siguiente.
14
Instalacin y configuracin
Captulo 1
x x x x x x
x x x x
Inserte una pgina de prueba en el escner. El asistente est preparado para efectuar una exploracin bsica usando el software del fabricante del escner. Haga clic en Siguiente. Aparecer la interfaz del usuario propia del escner. Haga clic en el botn u opcin para explorar a fin de comenzar una exploracin de muestra. Si fuese necesario, haga clic en Imagen invertida o en Imagen faltante y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Seleccione el elemento que describa ms adecuadamente su escner y luego haga clic en Siguiente. Haga clic en Siguiente para seguir con el tamao de pgina. En la ventana aparecen los tamaos de pgina que el Asistente del escner considera compatibles con su escner. Para efectuar cambios en los tamaos de pgina, haga clic en Avanzadas, efecte los cambios y luego haga clic en Siguiente. Inserte una pgina con texto pero sin imgenes en su escner. Haga clic en Siguiente para comenzar a explorar en el modo blanco y negro. Si fuese necesario, haga clic en Imagen invertida o en Imagen faltante y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Si tiene un escner a color, inserte en l una fotografa en colores o una pgina con una imagen en colores. Haga clic en Siguiente para comenzar a explorar en el modo en colores. Si fuese necesario, haga clic en Imagen invertida o en Imagen faltante y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Si el escner no puede explorar en colores, omita este paso. Inserte en el escner una fotografa o pgina que contenga una imagen. Haga clic en Siguiente para comenzar una exploracin en escala de grises. Si fuese necesario, haga clic en Imagen invertida o en Imagen faltante y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Ha configurado satisfactoriamente su escner para que funcione con OmniPage SE. Haga clic en Terminar.
Para cambiar la configuracin del escner en otro momento o para configurar otro escner, vuelva a abrir el Asistente de configuracin del escner en el men Inicio de Windows o en el panel Escner del cuadro de dilogo Opciones. Para probar y reparar un escner que funcione inadecuadamente, abra el Asistente de configuracin del escner en el men Inicio y seleccione Probar escner o
15
cmara digital en el primer panel y, luego, efecte el procedimiento que se describi anteriormente.
Haga doble clic en el icono OmniPage SE en la carpeta de instalacin del programa o en el escritorio de Windows si lo coloc ah. Haga doble clic en el icono o nombre de archivo de un documento de OmniPage (OPD); el documento se carga en el programa. Consulte Documentos de OmniPage en la pgina 31.
Al abrirlo, aparece la pantalla de ttulo de OmniPage SE y luego su escritorio. Consulte El escritorio de OmniPage en la pgina 24. Ah encontrar una introduccin a las principales reas de trabajo del programa. Hay muchos modos de ejecutar el programa con una interfaz limitada:
x
Utilice el programa Programar OCR. Haga clic en Inicio en la barra de tareas de Windows y elija ProgramasScanSoft OmniPage Pro 12.0 Programar OCR. Consulte Procesamiento con Programar OCR en la pgina 49. Esta caracterstica no est disponible en OmniPage SE. Haga clic en Obtener texto en el men Archivo de una aplicacin registrada con la funcin Direct OCR. Consulte Cmo configurar Direct OCR en la pgina 47. Haga clic con el botn derecho del ratn en el nombre o icono de un archivo de imagen para obtener un men rpido. Seleccione un elemento de submen de Convertir a... a fin de definir un destino. Utilice OmniPage SE con otros productos de administracin de documentos de ScanSoft tales como PaperPort o Pagis a fin de agregar servicios de OCR. Consulte Cmo usar OmniPage SE con PaperPort en la pgina 48.
16
Instalacin y configuracin
Captulo 1
Notable aumento en la exactitud La mayor sinergia entre los motores de reconocimiento, el respaldo de diccionarios profesionales y la capacidad para entrenar el programa a reconocer los caracteres escogidos por el usuario mejoran considerablemente la exactitud. Interfaz agilizada Los procesamientos automtico y manual ahora se efectan directamente desde la Caja de herramientas de OmniPage sin barras de herramientas independientes. Consulte la pgina 27. Las miniaturas ahora se ven en el Panel de imgenes; escoja ver la pgina actual, miniaturas o ambas. Consulte la pgina 28. La anterior vista de detalles se transforma en el Administrador de documentos e incluye una columna de notas para comentarios y para buscar palabras clave. Nuevos conceptos de separacin de zonas La asignacin inmediata de zonas permite procesar cambios de zonas inmediatamente sin tener que volver a reconocer toda la pgina. Consulte la pgina 79. Los fondos de pginas se definen como de procesar (zonas automticas) o de ignorar, de modo que todas las
17
instrucciones de asignacin de zonas aparecen en la pgina y se pueden guardar como plantillas de zonas. Consulte la pgina 55. Se pueden dibujar zonas irregulares y las zonas se pueden dividir y unir de manera ms sencilla, sin necesidad de usar herramientas especiales. Consulte la pgina 59.
x
Revisin y verificacin mejoradas El cuadro de dilogo Verificacin muestra ahora los caracteres dudosos en un contexto ms amplio. Un verificador dinmico puede mantenerse activo mientras se revisa el texto, con la imagen y la ventana siguiendo la posicin de edicin. Consulte la pgina 69. Niveles de formato para ver y guardar Hay tres niveles de formato para la visualizacin del Editor de texto. Consulte la pgina 68. El nivel de formato de salida se escoge ahora al momento de exportar; las alternativas dependen del tipo de archivo especificado. La alternativa de exportacin Flujo de pginas es una versin mejorada de la antigua vista Mantener flujo de columnas. Mantiene el diseo de pgina sin cuadros ni marcos cada vez que es posible, de modo que el texto fluya entre las columnas. Consulte la pgina 87. Anlisis superior de pginas La transferencia del formato de tabla se ha perfeccionado, en particular la deteccin de tablas sin cuadrculas en las pginas originales. Las direcciones de Internet y de correo electrnico se pueden detectar y transferir al Editor de texto, y se pueden insertar hipervnculos. El orden de lectura ahora se puede ver y cambiar tras efectuar el reconocimiento en la vista True Page del Editor de texto. Consulte la pgina 77. Mejor manipulacin de archivos PDF OmniPage Pro 12 busca el texto de fondo en los archivos PDF que abre, para lograr una ptima exactitud en el reconocimiento. Un nuevo tipo de archivo PDF editado permite una buena retencin de formato en las pginas que se modificaron en el Editor de texto tras efectuarse el reconocimiento. Opciones avanzadas de guardar Se ofrece un mayor margen de opciones de guardar para cada tipo de archivo de salida. Se pueden crear tipos de archivos de salida definidos por el usuario con configuracin personalizada. Consulte la pgina 88. Si su edicin de OmniPage Pro 12 incluye los nuevos formatos de guardado XML y eBook, consulte la pgina 102.
18
Instalacin y configuracin
Captulo 1
19
20
Instalacin y configuracin
Captulo 2
Introduccin
Probablemente usted utiliza su ordenador para procesar correspondencia comercial, elaborar informes, manipular datos y llevar a cabo un nmero cada vez mayor de tareas. El desafo es que, a pesar de la revolucin digital, ciertas fuentes de informacin an circulan en papel o formato impreso, por lo que no se pueden procesar inmediatamente en un ordenador. Por ejemplo, si desea incorporar informacin acerca del artculo de una revista en un informe que est preparando, de algn modo tiene que incorporar el texto del artculo en su equipo. Ciertamente, la engorrosa redigitacin del artculo no es la solucin ms atractiva. Este captulo le presenta la solucin ideal: reconocimiento ptico de caracteres (OCR). Describe la forma en que OmniPage SE utiliza la tecnologa OCR para transformar texto de pginas exploradas o archivos de imgenes en texto que podr editar con sus aplicaciones informticas favoritas. Se presentan los siguientes temas:
x
x x x x
21
22
Introduccin
Captulo 2
Documentos en OmniPage SE
OmniPage SE puede trabajar con un solo documento a la vez. Cuando obtenga la primera imagen (del escner o a partir de un archivo) se generar un nuevo documento. Las imgenes subsiguientes se irn agregando al mismo documento, hasta que lo guarde y lo cierre. Un documento en OmniPage SE consta de una imagen por cada pgina del documento. Tras efectuar el OCR, el documento tambin contendr el texto reconocido, visualizado en el Editor de texto, posiblemente junto con los grficos y tablas. Consulte El escritorio de OmniPage en la pgina 24.
23
El escritorio de OmniPage
El escritorio de OmniPage tiene una barra de ttulo y una barra de mens en su parte superior, y una barra de estado en la parte inferior. Tiene tres reas de trabajo principales, separadas por divisores: el Administrador de documentos, el Panel de imgenes y el Editor de texto. Cada una de ellas tiene botones para cerrar, maximizar y restaurar en su parte superior derecha. El Panel de imgenes tiene una barra de herramientas Imagen y el Editor de texto tiene una barra de herramientas de formato.
Barra de herramientas Estndar Caja de herramientas de OmniPage Las miniaturas muestran una imagen de cada pgina en el documento. La pgina actual tiene el icono de un ojo. Esta pgina ya ha sido reconocida. Barra de herramientas Imagen Barra de herramientas de formato
Botones de navegacin de pginas Arrastre estos divisores para cambiar el tamao de las reas de trabajo. Panel de imgenes Sirve para mostrar la imagen de la pgina actual, junto con sus zonas. El Panel de imgenes puede mostrar la pgina actual, miniaturas o ambas. Los botones de la vista del Editor de texto ofrecen tres niveles de formato. Editor de texto Sirve para mostrar los resultados del reconocimiento para la pgina actual en la vista True Page.
Botones para mostrar u ocultar el Administrador de documentos, el Editor de texto y las miniaturas del Panel de imgenes y la visualizacin de la pgina actual. Esto tambin se puede hacer en el men Ver.
24
Introduccin
Captulo 2
El programa aparece con un documento de tres pginas. La pgina uno es la pgina actual, que se ha reconocido y verificado. La pgina dos se ha reconocido pero an no se ha verificado. La pgina tres se ha obtenido y separado manualmente por zonas, pero an no se ha reconocido. Los iconos situados en la parte inferior de las imgenes de miniatura muestran el estado de la pgina. Los botones de la barra de estado permiten mostrar u ocultar las reas de la pantalla principal y desplazarse a otras pginas del documento. Al hacer clic con el botn derecho del ratn en cualquier rea de la pantalla se obtiene un men rpido con los comandos ms tiles para dicha rea.
Barra de mens
Para obtener informacin concisa acerca de algn elemento de men, haga clic en el botn de ayuda contextual y luego en el elemento de men que desee. El texto emergente le explicar la funcin del elemento de men en cuestin. Haga clic en cualquier lugar para cerrar el cuadro emergente.
Ubicacin predeterminada
Objetivo
Efectuar funciones bsicas del programa. Consulte la pgina 31 y pgina 69. Imagen, separacin de zonas y operaciones de tablas. Consulte la pgina 55 y pgina 62. Formato de texto reconocido en el Editor de texto. Consulte la pgina 77. Controlar la ubicacin y aspecto del verificador. Consulte la pgina 70. Modificar el orden de los elementos en las pginas reconocidas. Consulte la pgina 77.
Imagen
Verticalmente a la izquierda de la imagen de la pgina actual Horizontal en la parte superior del Editor de texto
Formato
Ninguna
Verificador
Pose el cursor sobre la ventana del verificador para ver esta barra de herramientas desplazable. Haga clic en la herramienta para cambiar el orden de lectura. Esta barra de herramientas reemplaza a la barra de herramientas de formato.
Reordenar
El escritorio de OmniPage
25
El Panel de imgenes
Cuando esto muestra la imagen de la pgina actual, queda disponible la barra de herramientas Imagen. Todas las imgenes de pginas tienen un valor de fondo: procesar o ignorar. Las zonas se pueden dibujar manualmente en imgenes de pginas o, bien, se pueden colocar automticamente tras su reconocimiento. Hay cinco tipos de zonas: Procesar, ignorar, texto, tabla y grficos. A las reas que quedan dentro de las zonas de procesar y en un fondo de procesar situado fuera de otras zonas, se les dibujan sus zonas automticamente y el tipo de zona se determina durante el procesamiento. Consulte Zonas y fondos en la pgina 55. Si la imagen de la pgina actual est oculta, aparecen las miniaturas en filas para darle el mejor uso al espacio disponible.
El Editor de texto
Esto muestra los resultados del reconocimiento en cualquiera de los tres niveles de formato: x Vista Sin formato (NF) x Vista Mantener fuentes y prrafos x True Page True Page mantiene el diseo de pgina utilizando cuadros y marcos de texto, tabla e imagen. Puede mostrar reas de varias columnas, para exhibir bloques de texto que se puedan tratar como flujo de columnas al momento de exportar. True Page tambin es un nivel de formato de exportacin, junto con Flujo de pginas, que mantiene el diseo de la pgina sin cuadros ni marcos. Consulte Pantalla y vistas del editor en la pgina 68. OmniPage SE no permite la salida de flujo de pginas.
26
Introduccin
Captulo 2
Se inicia el Procesamiento automtico, el cual se puede detener y reiniciar con el botn Iniciar (1-2-3). Consulte Procesamiento automtico en la pgina 40. El Procesamiento manual le permite procesar documentos pgina por pgina y paso a paso. Comience cada paso con los tres botones principales: el botn Obtener pgina (1), el botn Realizar OCR (2) y el botn Exportar resultados (3). Consulte Procesamiento manual en la pgina 42. Se puede alternar entre el procesamiento automtico y manual en cualquier momento en que el programa no est ocupado en algn tipo de procesamiento. Eso significa que se puede alternar entre ambos modos mientras est trabajando en algn documento. Es posible procesar automticamente algunas pginas y, luego, agregar ms pginas con el procesamiento manual. Tras procesar un grupo de pginas en forma automtica, se pueden revisar los resultados y volver a procesar ciertas pginas manualmente. Este procedimiento se describe en el Captulo 3. Consulte Procesamiento combinado en la pgina 43. El Asistente de OCR est diseado para los usuarios nuevos. Consulte Procesamiento con el Asistente de OCR en la pgina 45. Si tiene un documento abierto cuando inicie el Asistente de OCR, el documento se cerrar despus de que se le solicite guardarlo. Cuando haya utilizado el Asistente de OCR para procesar y guardar un documento, permanece en el programa y se puede procesar posteriormente (agregar ms pginas, volver a reconocer pginas, etc.) con el procesamiento manual o automtico.
El escritorio de OmniPage
27
Administracin de documentos
La administracin de documentos se puede efectuar con miniaturas en el Panel de imgenes o mediante el Administrador de documentos, situado junto a la parte inferior del escritorio de OmniPage. Ambas resumen las pginas del documento y estn sincronizadas: Nuestras imgenes muestran las dos vistas con el mismo documento de siete pginas. Las pginas 1 y 2 estn seleccionadas y la pgina 4 es la pgina actual; es decir, la que aparece en el Panel de imgenes. El estado de la pgina aparece de la siguiente manera:
Pgina
1 2
Estado
Obtenido Reconocido Reconocido, verificado Modificado Modificado, verificado Pendiente Guardado
Icono
4 5 6 7
Miniaturas
stas presentan un conjunto de imgenes en miniatura numeradas, una para cada pgina del documento. Desplcese para ver las pginas segn sea necesario. La pgina actual tiene el icono de un ojo. Se pueden seleccionar varias pginas en el documento, las cuales tendrn un aspecto distintivo. Utilice miniaturas para las operaciones de la pgina, de la siguiente manera: Pasar a una pgina: Haga clic en el icono de la pgina deseada. Reordenar una pgina: Haga clic en la miniatura de la pgina que desee mover, luego arrstrela y colquela sobre el nmero de la pgina deseada. Las pginas se vuelven a numerar automticamente. Eliminar una pgina: Seleccione la miniatura de la pgina que desee suprimir y pulse la tecla Eliminar.
28
Introduccin
Captulo 2
Seleccionar varias pginas: Mantenga pulsada la tecla Mays y haga clic en dos miniaturas para seleccionar todas las pginas entre ellas (inclusive). Mantenga pulsada la tecla Ctrl cuando haga clic en las miniaturas para agregar pginas individualmente a la seleccin. Es posible mover o eliminar las pginas seleccionadas como grupo o, bien, enviarlas para su reconocimiento. Tambin puede exportar las pginas seleccionadas.
Obtenga informacin de una imagen de entrada posando el cursor sobre su miniatura (siempre y cuando estn habilitadas las Sugerencias). El texto emergente mostrar el tamao de la imagen en pxeles y en la unidad de medicin del programa. Tambin aparece la resolucin de la imagen.
Administrador de documentos
Proporciona una vista general del documento con una tabla. Cada fila representa una pgina. Las columnas presentan informacin estadstica o de estado para cada pgina y (cuando corresponde) los totales del documento. La imagen muestra columnas que ha especificado un usuario.
Coloque el cursor en el icono de estado de la pgina para ver una miniatura de la misma.
La pgina actual aparece con el icono de un ojo. Puede utilizar el Administrador de documentos para las operaciones de la pgina, tal como se indica a continuacin: Pasar a una pgina: Haga clic en el extremo izquierdo de la fila de la pgina o doble clic en cualquier lugar de su fila. Reordenar una pgina: Haga clic en la fila de la pgina que desee mover y arrstrela a la ubicacin deseada. Un indicador en la izquierda muestra dnde se insertar la pgina. Las pginas se vuelven a numerar automticamente. Eliminar una pgina: Seleccione la fila de la pgina que desee suprimir y pulse la tecla Eliminar. Seleccionar varias pginas: Mantenga pulsada la tecla Mays y haga clic en dos filas de pgina para seleccionar todas las pginas entre ellas (inclusive). Mantenga pulsada la tecla Ctrl cuando haga clic en las filas para agregar pginas individualmente a la seleccin. Es posible mover o eliminar las pginas
Administracin de documentos
29
seleccionadas como grupo o, bien, enviarlas para su reconocimiento. Tambin puede exportar las pginas seleccionadas. Cuando se seleccionen varias pginas, la pgina indicada como actual no cambiar. Todas las pginas seleccionadas quedan resaltadas.
Este elemento se resalta. Haga clic en la casilla de verificacin de un elemento para seleccionarlo. Los tamaos de las imgenes se expresan en pxeles.
Resalte un elemento y utilice estas flechas para cambiar el orden de las columnas.
Defina cules columnas deben aparecer, sus anchos y el orden. En el apartado Personalizar columnas del Administrador de documentos de la ayuda en lnea se clarifica lo que se presenta en cada columna. Es posible cambiar fcilmente el ancho de las columnas en el Administrador de documentos; para ello arrastre los separadores de columna en la barra de ttulo.
30
Introduccin
Captulo 2
Imprimir un documento
Es posible imprimir el documento con el elemento Imprimir en el men Archivo. Elija si desea imprimir imgenes o texto (es decir, los resultados del reconocimiento tal como aparecen en el Editor de texto). Puede imprimir todas las pginas o algunas de ellas. La herramienta Imprimir en la barra de herramientas estndar permite imprimir imgenes o texto, dependiendo de si est activo el Panel de imgenes o el Editor de texto.
Cerrar un documento
Seleccione Cerrar en el men Archivo para cerrar un documento. Se le solicitar que guarde el documento si no lo ha hecho o si lo ha modificado desde la ltima vez que lo guard. Consulte la siguiente seccin sobre cmo guardarlo como documento de OmniPage (*.opd). Tambin se le solicitar guardar los datos de capacitacin que no se hayan guardado si es que seleccion Interrogar antes de guardar datos de capacitacin al cerrar un documento en el panel Verificacin del cuadro de dilogo Opciones. La frase anterior no se aplica a OmniPage SE.
Documentos de OmniPage
El documento de OmniPage es el tipo de archivo original del programa y tiene la extensin .opd. Es uno de los tipos de archivo ofrecidos al guardar un documento como archivo. Guarde el documento como archivo tipo OPD si desea trabajar con l nuevamente en OmniPage SE durante una sesin futura. Luego puede procesar pginas sin terminar, agregar ms pginas y verificar o editar resultados reconocidos. Un documento de OmniPage contiene imgenes de las pginas originales (autoalineadas y preprocesadas) con las zonas que stas contengan. Tras el reconocimiento, el documento OPD tambin contendr los resultados del reconocimiento. Los caracteres reconocidos se almacenan junto con sus datos de coordenadas e ndices de certeza. Ello conserva los vnculos entre imagen y texto, de modo que la verificacin est disponible al volver a abrir el documento OPD en sesiones futuras. Al guardar un documento de OmniPage, tambin se almacenan los parmetros actuales (y la informacin de capacitacin no guardada). Al abrir un documento de OmniPage, se aplican sus parmetros, reemplazando los existentes en el programa.Los documentos OmniPage creados en OmniPage SE no incluyen datos de capacitacin y si se abran en OmniPage SE, no se tienen en cuentalos.
Documentos de OmniPage
31
No se puede terminar de trabajar con el documento en la sesin actual. Se debe pasar el documento a otros usuarios que tengan OmniPage SE u OmniPage Pro. Por ejemplo, se puede pasar un archivo OPD a un especialista para su verificacin. En la red de una oficina, se puede contar con un escner que genere imgenes para reconocimiento y realizar la verificacin en diversas estaciones de trabajo. Se desea archivar los documentos reconocidos cuyas imgenes originales continen siendo accesibles. Los textos reconocidos permiten buscar por palabras clave y otras tcnicas de recuperacin de documentos.
Los resultados del reconocimiento se deben guardar a partir de archivos OPD antes de instalar alguna actualizacin de OmniPage. Puede que estos archivos no sean compatibles con las versiones ms recientes de los formatos de archivo OPD o posiblemente slo se conserven las imgenes al actualizar los archivos. Cuando abra un documento OPD creado con OmniPage Pro 10, slo se cargarn las imgenes. Cuando abra un documento de OPD creado en OmniPage Pro 11 o su version Special Edition, se cargarn las imgenes y las pginas reconocidas, pero no se conservarn las zonas.
32
Introduccin
Captulo 2
Parmetros
El cuadro de dilogo Opciones es la ubicacin central para los parmetros de OmniPage SE. Se puede acceder a l desde la barra de herramientas Estndar o del men Herramientas. La ayuda contextual proporciona informacin sobre cada parmetro. En general, los paneles de parmetros son los siguientes: OCR Utilice esta opcin para especificar los idiomas del reconocimiento, un diccionario del usuario o profesional, un carcter de rechazo y la coincidencia de fuentes. Haga clic en la casilla de verificacin antes del idioma para seleccionarlo o anular su seleccin. La seleccin mltiple es posible; para ello escoja slo los idiomas que aparezcan en el documento que se ha de reconocer. Los elementos superiores son los idiomas seleccionados recientemente. Escriba las iniciales de cada idioma para saltar a l. OmniPage SE no ofrece diccionarios profesionales. Escner Utilice esta opcin para definir el tamao de pgina y la orientacin de exploracin. Tambin se pueden fijar ajustes de brillo y contraste, y definir opciones para explorar documentos de varias pginas, sin importar si se cuenta con un alimentador automtico de documentos (ADF). Es posible cambiar los parmetros de configuracin del escner, instalar un nuevo escner o, bien, cambiar el escner predeterminado. Consulte Entrada desde escner en la pgina 51. Este panel no est disponible si usted solicit ver la interfaz TWAIN original de su escner cuando configur dicho aparato. Consulte Configuracin del escner con OmniPage SE en la pgina 14. Direct OCR Esta caracterstica proporciona servicios de OCR directamente desde su procesador de texto favorito u otra aplicacin similar. Utilice este panel para registrar y eliminar el registro de las aplicaciones para Direct OCR, as como para habilitar o inhabilitar este servicio. Tambin se puede especificar la separacin de zonas automtica o manual y si se desea la verificacin. Consulte Cmo configurar Direct OCR en la pgina 47. Proceso Utilice esta opcin para definir dnde se colocarn las nuevas imgenes en el documento, para establecer que se le soliciten ms pginas al explorar, para especificar la exploracin de dos pginas para manipular libros, y otros parmetros. Aqu tambin se puede cambiar el idioma de la interfaz. OmniPage SE no admite la exploracin simultnea de dos pginas.
Parmetros
33
Verificacin Utilice esta opcin para definir si la verificacin debe comenzar automticamente tras el reconocimiento. Defina tambin si se debe ejecutar IntelliTrain, y utilcela para cargar o trabajar con un archivo de capacitacin. Consulte Verificacin de los resultados de OCR en la pgina 69. Las referencias a la capacitacin y IntelliTrain no son aplicables a OmniPage SE. Diseo personalizado Utilice esta opcin para describir en forma precisa el diseo de las pginas del documento de entrada. Esto permite el mximo control sobre el proceso de separacin automtica de zonas, indicndole que busque o ignore las columnas, grficos y tablas. Consulte Descripcin del diseo del documento en la pgina 54. Editor de texto Utilice esta opcin para mostrar u ocultar ciertas caractersticas en el Editor de texto, para definir la unidad de medicin que se va a utilizar y para activar o desactivar la acomodacin de texto. Consulte Edicin de texto e imgenes en la pgina 77.
En OmniPage Pro 12, si tiene acceso al Sistema de administracin de documentos desde su equipo y la edicin de OmniPage Pro 12 incluye la compatibilidad ODMA, es posible que tambin aparezca un panel ODMA. Consulte Compatibilidad con ODMA en la pgina 99.
Algunos parmetros surten efecto slo en el reconocimiento futuro. Se pueden citar como ejemplos los idiomas de reconocimiento, un archivo de capacitacin o el brillo del escner. Estos parmetros se deben ajustar correctamente antes de comenzar el procesamiento. Para aplicar los cambios en estos parmetros a pginas ya reconocidas, se deber volver a reconocerlas. Los dems parmetros surten efecto inmediatamente en todas las pginas existentes. Ello ocurre, por ejemplo, con parmetros del Editor de texto tales como la acomodacin de texto o las unidades de medicin.
34
Introduccin
Captulo 3
Procesamiento de documentos
En este captulo del tutorial se describen diferentes formas en que se puede procesar un documento y, adems, se proporciona informacin acerca de los aspectos fundamentales de estos tipos de procesamiento.
x x x x x x x x
Gua de inicio rpido Generalidades del procesamiento Procesamiento automtico Procesamiento manual Procesamiento combinado Procesamiento con el Asistente de OCR Procesamiento a partir de otras aplicaciones (Direct OCR, PaperPort) Procesamiento con Programar OCR
Los temas detallados son: x Definicin del origen de imgenes de las pginas x Descripcin del diseo del documento x Zonas y fondos Separacin automtica de zonas Separacin manual de zonas Tipos y propiedades de zonas Trabajo con zonas x Cuadrculas de tablas en la imagen x Uso de plantillas de zonas
35
36
Procesamiento de documentos
Captulo 3
Accin
1. 2. 3. 4. Configure el escner utilizando el Asistente del escner, si an no lo ha hecho.
Resultado
Configura OmniPage SE para que funcione con su escner.
Seleccione Inicio Programas ScanSoft OmniAbre OmniPage SE en su equipo. OmniPage SE 2.0 Page SE 2.0 Coloque el documento correctamente en el escner. En la lista desplegable Obtener pgina, seleccione una opcin de exploracin para el documento: blanco y negro, escala de grises o color. En la lista desplegable Descripcin del diseo, verifique que est seleccionada la opcin Automtico. Esta es la mejor opcin para procesar una gran variedad de documentos. Permite determinar la forma en que se vern las imgenes, texto de color y fondos en el documento exportado. La exploracin en colores necesita un escner en color. Configura el programa en cuanto a cmo debe colocar zonas en la pgina y decide sus propiedades en forma automtica.
5.
6.
En la lista desplegable Exportar resultados, veriEsto significa que podr nombrar el archivo de exporfique que est seleccionada la opcin Guardar tacin tras haber verificado el documento. como archivo. Haga clic en el botn Iniciar. OmniPage SE comenzar a explorar el documento. Aparecer una miniatura con un indicador de progreso. Aparecer el Verificador de OCR. El Verificador de OCR funciona como el corrector ortogrfico de un procesador de texto, pero adems contiene ciertas caractersticas especficas de OCR. Elimina las marcas de las palabras que usted verifique. Cada vista del Editor de texto define un nivel de formato. Esto le ayuda a determinar qu nivel escoger al momento de guardar.
7.
8.
Utilice el Verificador de OCR para modificar las palabras que el programa sospeche que no se reconocieron correctamente.
9.
Haga clic en el Editor de texto. Seleccione las vistas del Editor de texto una tras otra, para ver el aspecto que tendr la pgina en cada una de ellas. Haga clic en Continuar para reiniciar la verificacin. Cuando aparezca el mensaje La verificacin del reconocimiento est completa, haga clic en Aceptar. Escoja un nombre, tipo y ruta de archivo, as como el nivel de formato para guardar el documento reconocido. Haga clic en Aceptar. Revise el documento en el procesador de texto.
10.
Con esto termina el proceso del Verificador de OCR. Aparecer el cuadro de dilogo Guardar como. De forma predeterminada, est activada la opcin Guardar e iniciar, de modo que el documento se abrir automticamente en el procesador de texto asociado con el tipo de archivo que seleccione. Ha utilizado satisfactoriamente OmniPage SE para reconocer el documento y abrirlo en la aplicacin de destino
11.
12.
37
Si obtuvo resultados satisfactorios a partir de los archivos de imgenes de ejemplo, pero no con una pgina explorada, revise la instalacin y parmetros del escner: en especial el brillo y la resolucin de la imagen. Consulte Entrada desde escner en la pgina 51. Ah encontrar un modelo de brillo ptimo. Consulte tambin los temas de la ayuda en lnea sobre Configuracin del escner y Resolucin de problemas del escner.
A continuacin aparece un resumen de los mtodos de procesamiento que se pueden utilizar. En las siguientes pginas encontrar una gua detallada para cada uno de ellos. Automtico La manera ms rpida y sencilla de procesar documentos es dejar que OmniPage SE lo haga automticamente. Seleccione los parmetros en el cuadro de dilogo Opciones y en las listas desplegables de la Caja de herramientas de OmniPage y luego haga clic en Iniciar. El programa procesar cada pgina por todo el procedimiento de principio a fin, efectuando pasos en paralelo cada vez que sea posible. Generalmente separar de manera automtica las zonas de las pginas. Manual El procesamiento manual le brinda un control ms preciso sobre la forma de manipulacin de las pginas. Podr procesar el documento pgina por pgina con diferentes parmetros para cada una de ellas. El programa tambin se detiene entre paso y paso: obtencin de imgenes, reconocimiento, exportacin. Esto permite, por ejemplo, dibujar zonas manualmente o cambiar el idioma o idiomas de reconocimiento. Debe comenzar cada paso haciendo clic en los tres botones de la Caja de herramientas de OmniPage.
38
Procesamiento de documentos
Captulo 3
Combinada Podr procesar un documento automticamente y ver los resultados en el Editor de texto. Si la mayora de las pginas estn en orden, pero algunas no quedaron como se esperaba, podr pasar al procesamiento manual para ajustar los parmetros y efectuar nuevamente el reconocimiento slo de las pginas problemticas. Alternativamente, puede obtener imgenes con el procesamiento manual, dibujar zonas en algunas de ellas y, luego, enviar todas las pginas para el procesamiento automtico. Uso del Asistente de OCR El Asistente de OCR le guiar a travs de la seleccin de parmetros y comandos mediante una serie de preguntas. Luego iniciar el procesamiento automtico. sta es una buena manera de comenzar si an no tiene mucha experiencia en el uso de OmniPage SE.
En otras aplicaciones Podr usar la caracterstica Direct OCR para recurrir a los servicios de reconocimiento de OmniPage SE mientras trabaja en su procesador de texto usual u otra aplicacin similar. OmniPage SE se vincula automticamente con los programas de administracin de documentos PaperPort y Pagis de ScanSoft.
39
Posteriormente Podr programar trabajos de OCR para que se efecten posteriormente de manera automtica, incluso sin que sea necesaria su presencia ante el equipo. El Asistente para trabajo nuevo en Programar OCR permite especificar los parmetros y una hora de inicio. OmniPage SE no admite el uso de la funcin Programar OCR.
Procesamiento automtico
El procesamiento automtico constituye una manera eficiente de manipular documentos, especialmente aqullos de gran tamao. Primero seleccione todos los parmetros necesarios, luego podr usar el botn Iniciar de la Caja de herramientas de OmniPage para procesar un nuevo documento de principio a fin o, bien, reiniciar y terminar el procesamiento de un documento abierto.
Botn Iniciar Botn Obtener pgina Botn Realizar OCR Botn Exportar resultados
1. Seleccione en la lista desplegable el parmetro deseado de Obtener pgina. Podr definir el origen del documento, el cual puede provenir de archivos de imgenes o de un escner. Consulte Definicin del origen de imgenes de las pginas en la pgina 50. 2. Seleccione un parmetro de la lista desplegable Descripcin del diseo, tal como se indic anteriormente. Esto gua al programa para la separacin automtica de zonas de las pginas. Podr describir las pginas entrantes o
40
Procesamiento de documentos
Captulo 3
especificar un archivo de plantilla de zonas. Consulte Descripcin del diseo del documento en la pgina 54. 3. Seleccione un parmetro de la lista desplegable Exportar resultados. Usted puede guardar el archivo como un documento de OmniPage. Puede guardar pginas (actuales, seleccionadas o todas) en un archivo, copiarlas al Portapapeles o enviarlas como documentos adjuntos de correo. Consulte Guardar y exportar en la pgina 83. 4. Elija en la barra de herramientas Estndar u Opciones en el men Herramientas y compruebe que los parmetros sean adecuados para su documento. Es posible, por ejemplo, especificar los idiomas de reconocimiento y si desea verificar el documento. Consulte Parmetros en la pgina 33. 5. Haga clic en el botn Iniciar o seleccione Iniciar procesamiento automtico en el men Proceso. Cada pgina del documento se procesar y terminar una tras otra. El programa puede efectuar tareas individualmente; por ejemplo, puede iniciar la carga y reconocimiento de una nueva pgina a medida que vaya verificando la pgina anterior.
Procesamiento automtico
41
verificacin. Esta opcin permite efectuar nuevamente el reconocimiento sin tener que explorar, cargar ni efectuar nuevamente la separacin de zonas de todas las imgenes.
Procesamiento manual
El procesamiento manual le brinda un control ms preciso sobre la forma de manipular las pginas. Podr procesar el documento pgina por pgina con diferentes parmetros para cada una de ellas. El programa tambin se detiene entre paso y paso: obtencin de imgenes, reconocimiento, exportacin. Esto permite, por ejemplo, cambiar el fondo de la pgina y dibujar zonas manualmente en cada pgina. Debe comenzar cada paso del proceso haciendo clic en los tres botones numerados de la Caja de herramientas de OmniPage.
1. Haga clic en en la barra de herramientas Estndar o en Opciones en el men Herramientas para marcar o seleccionar los parmetros del cuadro de dilogo Opciones. Consulte Parmetros en la pgina 33. 2. Seleccione el valor deseado para el botn Obtener pgina de la lista desplegable. Podr definir el origen del documento, el cual puede provenir de archivos de imgenes o de un escner. Al explorar, seleccione el modo de exploracin y utilice los paneles Escner y Proceso del cuadro de dilogo Opciones para seleccionar los parmetros. Consulte Definicin del origen de imgenes de las pginas en la pgina 50. 3. Haga clic en el botn Obtener pgina. Esto invoca el cuadro de dilogo Cargar archivo de imagen, permitindole nombrar archivos de imgenes o, bien, inicia la exploracin. Las imgenes en miniatura de cada pgina pueden aparecer en el Panel de imgenes, junto con la imagen de la pgina actual. Utilice los botones de la barra de estado para mostrar u ocultar cualquiera de stas. Las pginas se resumen en el Administrador de documentos. 4. Todas las imgenes de pginas ingresan al programa con un fondo de procesar. Siempre y cuando no se dibujen zonas en estas pginas, se les efectuar la separacin automtica de zonas cuando se solicite el reconocimiento. 5. Puede dibujar manualmente y modificar zonas en una o ms imgenes y asignar propiedades. Los botones de la barra de estado permiten pasar a otras pginas. Cuando dibuje una zona en una pgina, sta adoptar un fondo de ignorar. Usted puede especificar la separacin automtica de zonas de una
42
Procesamiento de documentos
Captulo 3
pgina dibujando zonas de procesar. Consulte Zonas y fondos en la pgina 55. 6. Seleccione un valor para el botn Realizar OCR. Podr describir el diseo de las pginas entrantes. Este valor influye si la separacin automtica de zonas se efecta en un nmero determinado de pginas. Consulte Descripcin del diseo del documento en la pgina 54. Tambin se puede seleccionar una plantilla para colocar sus zonas en la pgina actual. Consulte Uso de plantillas de zonas en la pgina 64. 7. Haga clic en el botn Realizar OCR para reconocer la pgina actual. Para volver a reconocer las pginas seleccionadas, haga una seleccin mltiple en el Administrador de documentos (Consulte Administracin de documentos en la pgina 28.) Luego haga clic en el botn Realizar OCR. Las pginas reconocidas aparecen en el Editor de texto. 8. Si solicit verificacin, el cuadro de dilogo Verificador de OCR mostrar los caracteres dudosos uno tras otro en la pgina o pginas reconocidas. Podr verificar y editar el texto reconocido. Consulte Verificacin de los resultados de OCR en la pgina 69. 9. Contine cargando pginas, efectuando el OCR, editando, verificando y revisando segn lo desee. Puede cambiar el orden de lectura de los elementos de pgina en el Editor de texto. Consulte Edicin de texto e imgenes en la pgina 77. 10. Seleccione un valor para el botn Exportar resultados. Usted puede guardar el archivo como un documento de OmniPage. Puede guardar pginas (actuales, seleccionadas o todas) en un archivo, copiarlas al Portapapeles o enviarlas como documentos adjuntos de correo. Haga clic en el botn Exportar resultados. Consulte Guardar y exportar en la pgina 83.
Procesamiento combinado
El procesamiento automtico proporciona velocidad y eficacia. El procesamiento manual requiere ms atencin, pero otorga un mayor control sobre los resultados. Es posible aprovechar ambos beneficios al procesar un solo documento. Iniciar automticamente y terminar manualmente: Cuando tenga un documento de gran tamao que contenga slo algunas pginas a las que se deba prestar especial atencin, no es necesario procesar manualmente
Procesamiento combinado
43
todo el documento. Podr procesarlo automticamente y ver los resultados en el Editor de texto. Luego podr determinar qu pginas estn en orden y cules necesitan parmetros diferentes o separacin manual de zonas. Despus de ajustar los parmetros y/o modificar zonas, utilice el procesamiento automtico para volver a reconocer slo aquellas pginas. 1. Prepare el documento y efecte el procesamiento automtico, tal como ya se describi. 2. Si cierra o termina la verificacin, se le solicitar que guarde el documento. Esto es lo que se recomienda hacer, aun cuando no sea su forma final. 3. Seleccione una pgina que necesite una nueva separacin de zonas y elimine o modifique las zonas existentes en el Panel de imgenes. Tambin podr cargar una plantilla para dejar que sus zonas reemplacen las existentes. Dibuje nuevas zonas segn desee. Consulte Zonas y fondos en la pgina 55. 4. Cambie otros parmetros segn sea necesario para la pgina actual. Consulte Parmetros en la pgina 33. 5. Haga clic en el botn Realizar OCR para volver a reconocer la pgina actual. Confirme que se deben sobreescribir los resultados del reconocimiento anterior. Alternativamente, puede utilizar el procesamiento inmediato para manipular los cambios en la separacin de zonas sin volver a reconocer toda la pgina. Consulte Edicin inmediata en la pgina 79. 6. Para volver a efectuar el reconocimiento de ms de una pgina, seleccione las pginas necesarias en las miniaturas o en el Administrador de documentos antes de hacer clic en el botn Realizar OCR. 7. Cuando haya vuelto a reconocer todas las pginas con resultados aceptables, guarde el documento nuevamente. Iniciar manualmente y terminar automticamente: 1. Prepare los parmetros y obtenga las pginas del documento haciendo clic en el botn Obtener pgina. 2. Examine las pginas para asegurarse de que tengan el brillo, orientacin y contenido adecuados. Vuelva a explorar o gire las imgenes incorrectas. Reordene las pginas segn desee.
44
Procesamiento de documentos
Captulo 3
3. Efecte la separacin de zonas en pginas donde desee procesar slo parte de la pgina o si desea dar instrucciones precisas de separacin de zonas. Utilice fondos o zonas de ignorar para excluir reas del procesamiento. Utilice fondos o zonas de procesar para especificar las reas a las que se les efectuar la separacin automtica de zonas. 4. Haga clic en el botn Iniciar y luego escoja Finalizar procesamiento de pginas actuales en el cuadro de dilogo Procesamiento automtico. 5. Despus de la verificacin (si se le solicita), usted podr guardar o exportar el documento.
45
5. El ltimo panel le solicita que defina la alternativa de exportacin: guardar en un archivo o copiar al Portapapeles. Tras fijar la opcin, haga clic en Terminar para cerrar el asistente y comenzar el procesamiento automtico. 6. Si solicit la verificacin y el texto contiene caracteres dudosos, aparecer el cuadro de dilogo Verificador de OCR. Cuando haya finalizado o se haya cerrado la verificacin, el cuadro de dilogo Copiar al Portapapeles o Guardar como le permitirn especificar los parmetros de exportacin del archivo, incluyendo un rango de pginas y un nivel de formato. 7. El documento permanece en OmniPage SE. Podr editar los resultados del reconocimiento y volver a guardarlos en otros formatos. Podr cambiar las zonas manualmente o modificar otros parmetros y, luego, utilizar el procesamiento manual para volver a reconocer pginas independientes del documento. Y tambin podr agregar pginas mediante el procesamiento automtico o manual.
Los paneles del asistente presentan los parmetros tal como estaban la ltima vez que se modificaron en el programa. Adems, OmniPage SE recordar los parmetros que se configuren en los paneles del Asistente de OCR y los aplicar a los procesamientos futuros, ya sean automticos o manuales, hasta que los vuelva a cambiar. De modo que si tiene ms documentos para los cuales sean adecuados los parmetros del Asistente de OCR, basta con hacer clic en Iniciar en la Caja de herramientas de OmniPage. Los parmetros pertinentes que no ofrece el Asistente de OCR adoptan los valores que se fijaron la ltima vez en el programa. Esto concierne principalmente a los parmetros del escner, un diccionario del usuario o un archivo de capacitacin. No es posible usar plantillas de zonas con el Asistente de OCR. Si al iniciarse el Asistente de OCR se estableci un archivo de plantilla, ste se descargar y se fijar la opcin Automtico como descripcin de entrada. No es posible exportar un documento reconocido adjunto a un mensaje de correo electrnico. En ese caso, utilice el procesamiento automtico o manual.
46
Procesamiento de documentos
Captulo 3
47
Si se est ejecutando OmniPage SE al momento de invocar Direct OCR desde una aplicacin de destino, se iniciar una segunda instancia de OmniPage SE. En los temas de Direct OCR de la Ayuda en lnea encontrar mayor informacin. stos incluyen un tema denominado Preguntas y respuestas sobre OCR. En el archivo Lame y en el sitio Web de ScanSoft se puede encontrar informacin ms reciente sobre aplicaciones de destino especficas.
Aqu se ha seleccionado OmniPage SE como el paquete de OCR para MS Word 2000. Ahora puede arrastrar imgenes de pginas desde el escritorio de PaperPort al vnculo de MS Word en PaperPort. Mientras se reconoce el texto, slo aparecer un monitor indicando el progreso de dicho procedimiento. Si se solicita, aparecern la ventana de separacin manual de zonas de OmniPage SE o la funcin de verificacin. Los resultados de reconocimiento se colocan en un nuevo documento sin nombre en la aplicacin de destino.
48
Procesamiento de documentos
Captulo 3
49
El cuadro de dilogo Programar OCR enumera cada trabajo e indica si su estado es Esperando, Ejecucin, Pausa, Error o Completo. Utilice la opcin Modificar trabajo... para cambiar los parmetros de un trabajo en espera. Podr ver, modificar y volver a utilizar los trabajos terminados para procesar nuevos trabajos que necesiten parmetros similares. Tambin podr eliminar los trabajos finalizados cuando ya no los necesite.
50
Procesamiento de documentos
Captulo 3
sta es la carpeta actual. Haga clic mientras pulsa la tecla Mays o, bien, la tecla Ctrl a fin de colocar ms de un archivo en el cuadro de texto Nombre de archivo. Especifique el tipo o tipos de archivo que desea ver.
Seleccione esta opcin para ver una miniatura del archivo seleccionado. No disponible cuando se seleccionan mltiples archivos.
Esto se puede usar para archivos TIFF, DCX y MAX de varias pginas.
Haga clic en Avanzadas para abrir el panel inferior y en Bsicas para cerrarlo. Utilice esta opcin para agregar archivos de carpetas diferentes y controlar de manera precisa el orden de los archivos. Utilice estas flechas para cambiar el orden de los archivos.
Normalmente el botn Agregar coloca cada archivo en la parte inferior de la lista de archivos. Para colocar un archivo en alguna otra posicin, resalte el archivo en la lista. El nuevo archivo se agregar justo a continuacin del archivo resaltado que est ms abajo.
El tipo de salida que se desea para el documento de exportacin El modo que proporcionar la mayor exactitud de OCR
Explorar en blanco y negro Seleccione esta opcin para explorar en blanco y negro. Esta opcin no es la ms idnea si desea color en el documento de salida, ni tampoco si desea que las imgenes tengan un aspecto similar al de fotografas en blanco y negro: en ese caso se recomienda la exploracin en escala de grises. Para una mayor exactitud de OCR, utilice esta opcin para texto oscuro ntido o sobre un fondo blanco o
51
plido. Las imgenes en blanco y negro se pueden explorar y manipular ms rpidamente que las dems y ocupan menos espacio de disco. Explorar en escala de grises Seleccione esta opcin para usar la exploracin en escala de grises. Elija esta opcin para conservar fotografas blanco y negro en el documento de salida. Para una mayor exactitud de OCR, utilice esta opcin en pginas con contraste variable o bajo (donde no haya mucha diferencia entre tonos claros y oscuros) y con el texto sobre fondos de color o sombreados. Explorar en color Seleccione esta opcin para explorar en color. Esto funcionar slo con escneres a color. Elija esta opcin si desea obtener grficos, texto o fondos en color en el documento de salida. Para mayor exactitud de OCR, esta opcin no ofrece mayores beneficios que la escala de grises (para una resolucin determinada), pero exigir mucho ms tiempo, recursos de memoria y espacio de disco. Brillo y contraste Los parmetros correctos de brillo y contraste juegan un importante papel en la exactitud de OCR. Fije stos en el panel Escner del cuadro de dilogo Opciones o en la interfaz de su escner. El diagrama ilustra un ajuste ptimo de brillo. Tras cargar una imagen, revise su aspecto. Si los caracteres son gruesos y se superponen, aclare el brillo. Si los caracteres son finos y difusos, oscurezca el brillo. Luego vuelva a explorar la pgina.
Deficiente
52
Procesamiento de documentos
Captulo 3
53
54
Procesamiento de documentos
Captulo 3
Hoja de clculo Elija esta opcin si desea que toda la hoja quede convertida en una tabla que se exportar a un programa de hojas de clculo, o tratarla como una sola tabla. No se detectar flujo de texto ni zonas de grficos. Personalizado Elija esta opcin para tener el mximo control sobre la separacin automtica de zonas. Podr evitar o estimular la deteccin de columnas, grficos y tablas. Fije los parmetros en el panel Diseo personalizado del cuadro de dilogo Opciones. Plantilla Elija un archivo de plantilla de zonas si desea aplicar el valor de su fondo, sus zonas y propiedades a todas las pginas obtenidas de aqu en adelante. Las zonas de plantillas tambin se aplican a la pgina actual, reemplazando las zonas existentes. Tambin se aplicarn a las pginas preexistentes sin zonas cuando se vuelvan a reconocer. Consulte Uso de plantillas de zonas en la pgina 64. Si la separacin automtica de zonas produjo resultados de reconocimiento inesperados, utilice el procesamiento manual para volver a efectuar la separacin de zonas en pginas individuales y llevar a cabo nuevamente su reconocimiento.
Zonas y fondos
Las zonas definen las reas de la pgina que se han de procesar. Las zonas son rectangulares o irregulares, con lados verticales y horizontales. Las imgenes de pginas en un documento tienen un valor de fondo: procesar o ignorar (el ltimo es ms tpico). Los valores de fondo se pueden cambiar con las herramientas mostradas. Las zonas se pueden dibujar en los fondos de pgina con las herramientas mostradas:
Fondos Zonas Procesar Procesar Ignorar Ignorar Texto Tabla Grfico
A las reas de procesar (en las zonas o fondos de procesar) se les efecta la separacin automtica de zonas cuando se envan para el reconocimiento. Las reas de ignorar (en las zonas o fondos de ignorar) no se procesan. No se reconoce texto ni se transfieren imgenes.
Zonas y fondos
55
56
Procesamiento de documentos
Captulo 3
La zona 4 vuelve como un grupo de zonas, en este caso para manipular tres columnas de texto y una fotografa.
La zona 6 se absorbe en el fondo. Todas las zonas en la parte izquierda de la pgina se crearon automticamente.
No. 1 2 3 4 5 6 7
Tipo Zona de texto Zona de tabla Zona grfica Zona de procesar Fondo de procesar Zona de ignorar Fondo de ignorar
Resultado: El OCR se efecta y genera texto. El OCR se efecta y el texto se coloca en una cuadrcula de tabla. La imagen se incrusta en una pgina reconocida. La separacin automtica de zonas crea una o ms zonas, decide los tipos y procesa el contenido. Nada
Zonas y fondos
57
Las zonas no tienen un orden de lectura. El reordenamiento de los elementos reconocidos se pueden efectuar en el Editor de texto. Consulte Edicin de texto e imgenes en la pgina 77. La separacin inmediata de zonas se describe en el Captulo 4. Consulte Edicin inmediata en la pgina 79.
58
Procesamiento de documentos
Captulo 3
Zona de texto (marrn) Utilice esta opcin para dibujar una zona de texto. Dibjela sobre un solo bloque de texto. El contenido de la zona se tratar como flujo de texto, sin que se encuentren columnas. Si desea manipular las columnas de texto automticamente, encirrelas en una zona de procesar. Zona de tabla (azul) Utilice esta opcin para que el contenido de la zona sea tratado como una tabla. Es posible detectar automticamente las cuadrculas de la tabla o, bien, colocarlas en forma manual tal como se describe en la siguiente seccin. Las zonas de tablas deben ser rectangulares. El Editor de texto muestra la tabla en una cuadrcula editable. Para muchos tipos de archivos de salida, podr elegir si desea exportar tablas en cuadrculas o en columnas separadas por tabulaciones. Zona grfica (verde) Utilice esta opcin para encerrar una imagen, diagrama, dibujo, firma o cualquier otro elemento que desee transferir al Editor de texto como una imagen incrustada, y no como texto reconocido. Las imgenes incrustadas se pueden exportar con el documento a aplicaciones de destino que permitan el uso de grficos.
Las zonas de texto y de tabla tienen un parmetro de contenido de zona. El contenido alfanumrico valida todos los caracteres necesarios para el idioma elegido. Los resultados del reconocimiento de una zona numrica contendrn slo cifras y la puntuacin que les sea pertinente. No se colocarn letras. Utilice el men rpido de zona para cambiar este parmetro. Haga clic con el botn derecho del ratn fuera de una zona para obtener un men rpido diseado para toda la imagen. ste permite acercar, alejar o girar la imagen. Al girar una imagen, se eliminan todas las zonas que sta contiene.
Zonas y fondos
59
Dibujar una sola zona Seleccione la herramienta para dibujar zonas del tipo deseado y, luego, haga clic y arrastre el cursor. En estos ejemplos, esto lo muestra la flecha que va de A a B. Tambin es posible arrastrarla desde la esquina superior izquierda a la inferior derecha. Slo se dibujarn las zonas rectangulares; las zonas (excepto las de tabla) se pueden hacer irregulares despus de dibujarlas. Para cambiar el tamao de una zona, haga clic en ella para seleccionarla, mueva el cursor a un lado o esquina, tome un manipulador y muvala a la ubicacin deseada. Para mover una zona, seleccinela con la herramienta para seleccionar zonas y muvala segn desee. No puede mover una zona para ponerla encima de otra. Hacer una zona irregular por adicin Dibujar una zona del mismo tipo que se superponga parcialmente:
zona existente zona resultante
nueva zona
60
Procesamiento de documentos
Captulo 3
Unir dos zonas del mismo tipo Dibujar una zona del mismo tipo que se superponga:
zonas existentes
nueva zona
zona resultante
Hacer una zona irregular por sustraccin Dibuje una zona del mismo tipo que el fondo que se superponga (en este ejemplo, en un fondo de ignorar).
zona existente en un fondo de ignorar nueva zona de ignorar
zona resultante
Dividir una zona Dibuje una zona que se divida del mismo tipo que el fondo (en este ejemplo, en un fondo de procesar).
zona de texto existente en un fondo de procesar nueva zona de procesar
zonas resultantes
Zonas y fondos
61
Para expandir una zona ms rpidamente que utilizando sus manipuladores de cambio de tamao, dibuje una zona del mismo tipo para encerrarla completamente. La zona ms pequea es reemplazada por la ms grande. Para reemplazar un conjunto de zonas de cualquier tipo por una sola zona, dibuje una zona ms grande del tipo que desee de modo que encierre completamente las otras. Todas las zonas ms pequeas sern reemplazadas por la ms grande. Cuando dibuje una nueva zona que se superponga parcialmente con una zona existente de otro tipo, en verdad no se traslaparn; la nueva zona reemplazar la parte superpuesta de la zona existente. Los diagramas del tema de la Ayuda en lnea Dibujar zonas manualmente clarifican estos temas.
62
Procesamiento de documentos
Captulo 3
Utilice las herramientas de tablas y los cursores de la siguiente manera: Introducir separadores de fila Haga clic en esta herramienta y luego en la posicin de una zona de tabla donde desee colocar un separador de fila. Evite colocar un separador de modo que corte el texto. Introducir separadores de columna Haga clic en esta herramienta y luego en la posicin de una zona de tabla donde desee colocar un separador de columna. Mover separadores Haga clic en la herramienta y mueva el cursor al separador de fila o columna que se ha de mover. Aparecer una flecha de dos puntas. Arrastre el separador segn se desee. No podr arrastrarlo ms all de la zona vecina. Evite colocar separadores de modo que corten el texto. Eliminar separadores Haga clic en esta herramienta y luego en un solo separador de fila o columna que desee eliminar. Hgalo si un separador est colocado incorrectamente o si desea cambiar el aspecto de la tabla en el documento final. Por ejemplo, puede colocar dos columnas de datos en una sola columna, eliminando el separador entre las dos columnas originales. Colocar/eliminar todos los separadores Haga clic en esta herramienta y luego en el icono del cursor dentro de una zona de tabla sin separadores. Los separadores se detectarn y colocarn automticamente. Haga clic en una tabla con separadores para hacerlos desaparecer todos. Pulse la tecla Ctrl al hacer clic si desea colocar, mover o eliminar un separador slo en la celda actual. Puede especificar el formato de lnea para los bordes y las cuadrculas de la tabla en un men rpido. Tendr una mayor eleccin para editar los bordes y el sombreado en el Editor de texto tras el reconocimiento.
63
en la pgina actual, reemplazando las zonas que ya estn ah en todas las pginas adquiridas a futuro en las pginas preexistentes enviadas para el reconocimiento sin ninguna zona.
Con el procesamiento manual se pueden ver y modificar las zonas de plantilla en los primeros dos casos antes del reconocimiento. Con el procesamiento automtico se pueden ver y modificar las zonas de plantilla slo despus del reconocimiento. Este comportamiento contina hasta que se descarga la plantilla. Las plantillas aceptan zonas y fondos de ignorar y procesar. Por lo tanto, pueden ser de gran utilidad para definir qu partes de las pginas se procesarn con la separacin automtica de zonas y cules se ignorarn. Las reas de las zonas de procesar o del fondo de procesar en una plantilla se pueden reemplazar durante el reconocimiento por un conjunto de zonas ms pequeas, y se les asignarn tipos de zonas especficos. Cmo guardar una plantilla de zona Seleccione un valor de fondo y prepare las zonas en una pgina. Revise sus ubicaciones y propiedades. Haga clic en Plantilla de zonas... en el men Herramientas. En el cuadro de dilogo, seleccione [zonas en la pgina] y haga clic en Guardar; despus de esto asigne un nombre y haga clic en Aceptar. Cmo modificar una plantilla de zona Cargue la plantilla y obtenga una imagen adecuada mediante procesamiento manual. Aparecern las zonas de la plantilla. Modifique las zonas y/o propiedades segn desee. Abra el cuadro de dilogo Archivo de plantilla de zonas. Se seleccionar la plantilla actual. Haga clic en Guardar y luego en Cerrar.
64
Procesamiento de documentos
Captulo 3
Cmo descargar una plantilla Seleccione un parmetro sin plantilla en la lista desplegable Descripcin del diseo. Las zonas de plantilla no se eliminan de las pginas actuales o existentes, pero tampoco se utilizarn para procesamientos futuros. Tambin puede abrir el cuadro de dilogo Archivos de plantilla de zonas, seleccionar [ninguno] y hacer clic en el botn Establecer como actual. En este caso, el parmetro de la descripcin del diseo vuelve a Automtico. Cmo reemplazar una plantilla por otra Seleccione una plantilla diferente en la lista desplegable Descripcin del diseo o, bien, abra el cuadro de dilogo Archivos de plantilla de zonas, seleccione la plantilla deseada y haga clic en el botn Establecer como actual. Las zonas de la nueva plantilla se aplican a la pgina actual, reemplazando las zonas existentes. Tambin se aplicarn tal como se explic anteriormente. Cmo eliminar un archivo de plantilla Abra el cuadro de dilogo Archivos de plantilla de zonas. Seleccione una plantilla y haga clic en el botn Eliminar. Las zonas ya colocadas por esta plantilla no se eliminarn.
65
66
Procesamiento de documentos
Captulo 4
Verificacin y edicin
Los resultados del reconocimiento se colocan en el Editor de texto. stos pueden ser texto o tablas reconocidos y grficos incrustados. El nuevo editor WYSIWYG (que significa lo que se ve es lo que se obtiene) ofrece las siguientes caractersticas, que se detallan en el presente captulo:
x x x x x x x x
Pantalla y vistas del editor Verificacin de los resultados de OCR Verificar texto Diccionarios del usuario Capacitacin Edicin de texto e imgenes Edicin inmediata Lectura de texto en voz alta
67
Verde Palabras que no estn en el diccionario: stas se reconocieron con confianza, pero no se encontraron en ningn diccionario activo: estndar, del usuario o profesional. Azul Palabras con caracteres dudosos: stas contienen caracteres no reconocidos o son palabras aprobadas por el diccionario que contienen caracteres reconocidos con un menor grado de confianza. Rojo Palabras dudosas: Suelen ser palabras que no estn en el diccionario con uno o ms caracteres dudosos, pero que tambin pueden ser dudosas por otras razones.
Escoja marcar las palabras que no estn en el diccionario o que no estn en el panel Verificacin del cuadro de dilogo opciones. Todos los marcadores pueden aparecer o estar ocultos segn lo que se haya seleccionado en el panel Editor de texto, dentro del cuadro de dilogo Opciones. Tambin podr mostrar u ocultar caracteres no imprimibles e indicadores de encabezado y pie de pgina. El panel Editor de texto tambin permite definir una unidad de medicin para el programa y un parmetro de acomodacin de texto en todas las vistas del Editor de texto salvo en la vista Sin formato. OmniPage SE puede exhibir pginas con tres niveles de formato. Se puede alternar libremente entre ellos con los tres botones de la parte inferior izquierda del Editor de texto o del men Ver. Los grficos y tablas pueden aparecer en todas las vistas. A continuacin se mencionan las principales diferencias entre las vistas: Vista Sin formato Muestra el texto normal sin columnas y alineado en la izquierda con un solo tipo y tamao de fuente, con los mismos saltos de lnea que el documento original. La mayora de los botones de formato y cuadros de dilogo estn desactivados. Tampoco se ven las reglas. Esta vista puede resultar prctica para verificar y editar el texto. Vista Mantener fuentes y prrafos Muestra pantallas con texto sin columnas y con estilo de fuente y prrafo. Aparece la regla horizontal. Esta vista puede resultar prctica para verificar, editar y modificar el texto junto con su estilo. Vista True Page La vista True Page trata de conservar lo ms posible el formato del documento original. Se mantienen los estilos de caracteres y prrafo. Todos los elementos de
68
Verificacin y edicin
Captulo 4
las pginas, incluyendo las columnas, se colocan en cuadros y marcos. El orden de lectura se puede ver mediante flechas. Consulte la pgina 77. El nivel de formato para la exportacin se escoge en forma independiente al momento de exportar.
Esta ventana muestra la parte pertinente de la imagen original. Haga clic dentro de ella para agrandar o reducir la pantalla.
Arrastre una esquina o la parte inferior del cuadro de dilogo para cambiar su tamao.
3. Si la palabra reconocida es correcta, haga clic en Ignorar o Ignorar todo para pasar a la siguiente palabra dudosa. Haga clic en Agregar para aadirla al diccionario actual del usuario y pasar a la siguiente palabra dudosa.
69
4. Si la palabra reconocida no es correcta, modifquela en el panel Editar o seleccione una sugerencia del diccionario. Haga clic en Cambiar o en Cambiar todo para que el cambio surta efecto y poder pasar a la palabra dudosa siguiente. Haga clic en Agregar para aadir la palabra cambiada al diccionario actual del usuario y pasar a la siguiente palabra dudosa. 5. Los marcadores de color se eliminan de las palabras en el Editor de texto a medida que son verificadas. Podr pasar al Editor de texto durante la verificacin para hacer las correcciones all. Utilice el botn Continuar para reiniciar la verificacin. Haga clic en Cerrar para detener la verificacin antes de llegar al final del documento.
Si la verificacin se ejecut hasta el final de una pgina, sta se marca con el icono de verificacin en su miniatura y en el Administrador de documentos.
Si los marcadores estaban ocultos en el Editor de texto al iniciarse la verificacin, o si se escoge Buscar siguiente duda, los marcadores se pueden apreciar y permanecen a la vista despus de la verificacin. Si est desactivada la opcin Marcar palabras que no estn en el diccionario en el panel Verificacin del cuadro de dilogo Opciones, la verificacin se detendr slo en las palabras marcadas con rojo o azul, y no en las palabras que no estn en el diccionario. Esto es muy til al revisar pginas con muchas palabras que no estn en el diccionario, tales como catlogos de productos que contengan cdigos, y bibliografas que contengan muchos nombres propios. Utilice la opcin Volver a revisar la pgina actual en el men Herramientas para ejecutar una nueva revisin ortogrfica en una pgina que ya se haya revisado. Hgalo para revisar palabras escritas o pegadas en el Editor de texto tras efectuar la verificacin. Esto funciona incluso si la opcin Marcar palabras que no estn en el diccionario est desactivada en el panel Verificacin.
Verificar texto
Tras efectuar el OCR, podr comparar cualquier parte del texto reconocido con su correspondiente en la imagen original a fin de verificar que el texto se haya reconocido correctamente. Funciona de la siguiente manera:
70
Verificacin y edicin
Captulo 4
Utilice lo siguiente:
F9 o herramienta de verificacin Esc o F9 o la herramienta de verificacin F8: pulsar sin soltar Hacer doble clic en una palabra Alt + Num + o hacer clic en el verificador Alt + Num + o hacer clic en el verificador Alt + Num / Alt + Num /
La herramienta de verificacin est en la barra de herramientas de formato. El verificador tambin se puede controlar desde el men Herramientas. Pose el cursor sobre una pantalla del verificador para invocar la barra de herramientas del verificador. Utilcela de la siguiente manera:
Herramienta de verificacin (activar/desactivar)
para desplazar o acoplar (vuelve al ltimo estado) Cunto contexto para el verificador dinmico? una palabra tres palabras (la actual + 2 vecinas) lnea de toda la imagen a dinmico
Editor de texto
Verificar texto
71
Deber verificar el texto antes de volver a editar a gran escala. Si corta y pega grandes bloques de texto, se pueden alterar los vnculos entre el texto e imagen. Podr utilizar la funcin de texto a lenguaje de OmniPage Pro 12 para que el texto reconocido se lea en voz alta como otra manera de verificarlo. Podr escuchar el texto letra por letra, palabra por palabra, lnea por lnea, oracin por oracin o en pginas completas. Consulte la seccin Lectura de texto en voz alta en la pgina 80. Esta caracterstica no est disponible en OmniPage SE.
72
Verificacin y edicin
Captulo 4
OmniPage Pro 12 ofrece diccionarios especializados para ciertas profesiones (por el momento, diccionarios legales y mdicos) en algunos idiomas. stos diccionarios no estn disponibles en OmniPage SE.
El programa identifica el idioma del texto reconocido y lo muestra en la barra de estado. Esta marca de idioma se exporta con el documento. Utilice Definir idioma... en el men Herramientas para cambiar la marca del idioma del texto seleccionado. Esto no cambia el o los idiomas del reconocimiento.
Capacitacin
OmniPage SE no es compatible con las funcines capacitacin y IntelliTrain ni con los archivos de capacitacin. Estas caractersticas slo estn disponibles en OmniPage Pro 12. Al abrir un archivo OPD, OmniPage SE pasa por alto cualquier informacin de capacitacin incluida el archivo. La capacitacin es el proceso de cambio de las soluciones de OCR asignadas a las formas de caracteres en la imagen. Es muy til para documentos en mal estado o cuando se usa un tipo de letra poco comn en todo el documento. La capacitacin ser menos til para textos con distorsiones espordicas. A continuacin aparece un ejemplo, basado en la letra g, que se puede imprimir de diferentes maneras:
Los primeros dos ejemplos no requieren de capacitacin, ya que ambas formas son normales para la letra g y el programa las puede manejar. En el tercer ejemplo se podra aprovechar la capacitacin ya que la forma de la g es poco comn, y es probable que todas las veces que aparezca la g en el texto se parezcan a sta. El cuarto ejemplo no es bueno para el uso de la capacitacin, ya que la primera g no est bien impresa, y es poco probable que aparezca esa forma nuevamente en el documento. Puede utilizar la capacitacin para mejorar el reconocimiento de smbolos especiales tales como @, y o, bien, para reconocer letras acentuadas de manera ms fiable. El objetivo de la capacitacin no es ensearle al programa a leer caracteres de idiomas o alfabetos no compatibles. OmniPage Pro 12 ofrece dos tipos de capacitacin: la capacitacin manual y la automtica (IntelliTrain). Los datos provenientes de ambos tipos de
Capacitacin
73
capacitacin se combinan y se ofrecen para guardarlos en un archivo de capacitacin. Al salir de una pgina en la cual se generaron datos de capacitacin, se le consultar cmo aplicarlos a otras pginas existentes en el documento.
Capacitacin manual
Para efectuar la capacitacin manual, coloque el punto de insercin en la parte delantera del carcter que desea capacitar o seleccione un grupo de caracteres (hasta una palabra) y escoja Carcter de capacitacin... en el men Herramientas o el men rpido. Aparecer una vista ampliada de los caracteres que se capacitarn, junto con la solucin de OCR actual. Cambie esto a la solucin deseada y haga clic en Aceptar. El programa tomar esta capacitacin y examinar el resto de la pgina. Si encuentra posibles palabras que cambiar, stas aparecern en el cuadro de dilogo Revisar capacitacin. Las palabras incorrectas se deben capacitar antes de que se apruebe la lista. Para obtener informacin sobre el uso de los cuadros de dilogo Carcter de capacitacin y Revisar capacitacin, consulte su ayuda contextual respectiva o el tema Capacitacin manual en la ayuda en lnea y sus temas relacionados.
IntelliTrain
IntelliTrain es una forma automatizada de capacitacin. Analiza las correcciones que usted haga durante la verificacin. Cuando haga un cambio, esta funcin recordar la forma del carcter en cuestin y el cambio en la verificacin. Buscar otras formas de caracteres similares en el documento, especialmente en palabras dudosas; y evaluar si corresponde aplicar la correccin del usuario. Puede activar o desactivar IntelliTrain en el panel de OCR en el cuadro de dilogo Opciones. El siguiente ejemplo muestra cmo funciona IntelliTrain, utilizando la imagen original. En nuestro ejemplo se utilizan las letras c y e. Con algunos tipos de letra y parmetros de exploracin, la lnea horizontal en la e puede quedar muy delgada, induciendo a OCR a cometer errores que IntelliTrain puede reparar.
74
Verificacin y edicin
Captulo 4
OmniPage Pro leer esta palabra como rcsultados. Usted la cambi durante la verificacin a resultados.
IntelliTrain cambiar:
IntelliTrain recuerda los datos de capacitacin que recopila, y los agrega a toda capacitacin manual que usted haya hecho. Esta capacitacin se puede guardar en un archivo de capacitacin para uso futuro con documentos similares.
Archivos de capacitacin
Si desea que se le consulte si desea guardar los datos de capacitacin al cerrar el documento, seleccione dicha opcin en el panel Verificacin del cuadro de dilogo Opciones. Los datos de capacitacin no guardados se almacenan en un documento de OmniPage. Si no guarda el documento como OPD, la capacitacin no guardada se desechar cuando se cierre el documento. Las operaciones para guardar la capacitacin en un archivo, as como cargar, editar y descargar archivos de capacitacin se efectan en el cuadro de dilogo Archivos de capacitacin. bralo en el panel Verificacin del cuadro de dilogo Opciones o el men Herramientas.
Capacitacin
75
Seleccione esta opcin, haga clic en Guardar y escriba un nombre para guardar un nuevo archivo de capacitacin. Seleccione esta opcin para descargar un archivo de capacitacin.
Haga clic aqu para editar el archivo de capacitacin seleccionado en el cuadro de dilogo Editar capacitacin. Utilice esta opcin para guardar la nueva capacitacin en un archivo de capacitacin cargado. Aparecer como: <Nombre del archivo> [modificado]
Los datos de capacitacin no guardados se pueden editar en el cuadro de dilogo Editar capacitacin; aparecer un asterisco en la barra de ttulo en vez del nombre del archivo de capacitacin. Permanecer sin guardar cuando cierre el cuadro de dilogo Editar capacitacin. Gurdelo en el cuadro de dilogo Archivos de capacitacin. Un archivo de capacitacin tambin se puede editar; su nombre aparecer en la barra de ttulo. Si se le han agregado datos de capacitacin sin guardar, aparecer un asterisco a continuacin de su nombre. Tanto los datos de capacitacin no guardados como los modificados se guardarn al cerrar el cuadro de dilogo. El cuadro de dilogo Editar capacitacin muestra marcos que contienen la forma de un carcter y una solucin de OCR asignada a dicha forma. Haga clic en un marco para seleccionarlo. Luego podr suprimirlo con la tecla Eliminar o, bien, cambiar la asignacin. Utilice las teclas de direccin para pasar al marco siguiente o al anterior.
Est editando los datos de capacitacin no guardados. Este marco aparece en gris. Significa que se ha eliminado. Para recuperarlo, seleccinelo nuevamente y pulse la tecla Eliminar. Los caracteres marcados como eliminados se borrarn efectivamente al cerrar el cuadro de dilogo.
Haga doble clic en un marco o pulse Intro para cambiar su solucin OCR. Introduzca la nueva solucin en el cuadro de texto que aparece y pulse Intro. Las asignaciones cambiadas aparecern en rojo. Este marco est seleccionado. En la parte superior aparece la forma tomada de la imagen. En la parte inferior aparece la solucin de OCR asignada.
76
Verificacin y edicin
Captulo 4
77
Tablas Las tablas aparecen en el Editor de texto en forma de cuadrculas. Mueva el cursor al rea de una tabla. Cambiar su aspecto, permitindole mover las lneas de las cuadrculas. Tambin podr usar las reglas del Editor de texto para modificar una tabla. Modifique la colocacin de texto en las celdas con los botones de alineacin de la barra de herramientas de formato y los controles de tabulacin de la regla. Al guardar el documento en algunos tipos de archivo, podr elegir si va a exportar las tablas en cuadrculas o como columnas separadas por tabuladores o por espacios. Hipervnculos Las direcciones de pginas Web y de correo electrnico se pueden detectar y colocar como vnculos en el texto reconocido. Escoja Hipervnculo... en el men Formato para editar un vnculo existente o crear uno nuevo. Un nuevo vnculo puede ser a una pgina Web o a un archivo. Utilice un men de acceso rpido para eliminar un vnculo. Editar en True Page Los elementos de pginas estn contenidos en los cuadros de texto, de imagen y de tabla. stos generalmente corresponden a zonas de texto, de tabla y grficos en la imagen. Haga clic dentro de un elemento para ver el borde de la imagen; los elementos tienen los mismos colores que las zonas correspondientes. En el tema True Page de la ayuda en lnea encontrar detalles sobres las operaciones que aqu se resumen. Los marcos tienen bordes grises y encierran uno o ms cuadros. Se colocan cuando se detecta un borde visible en una imagen. Para dar formato al marco y a los bordes y sombreado de la tabla, utilice un men rpido o escoja Tabla... en el men Formato. El sombreado del cuadro de texto se puede especificar desde su men rpido. Para invocar un men rpido, haga clic con el botn derecho del ratn dentro de un elemento lejos de la palabra marcada. Las reas de varias columnas tienen bordes rosados y encierran uno o ms cuadros. Se detectan automticamente y muestran cul es el texto que se tratar como columna al exportar. Utilice mens rpidos para desagrupar reas y marcos de varias columnas, permitiendo la modificacin de sus elementos. Tambin puede agrupar elementos en marcos o reas de varias columnas. La opcin Orden de lectura se puede ver y cambiar. Haga clic en la herramienta Mostrar orden de lectura en la barra de herramientas de Formato para que el orden aparezca indicado mediante flechas. Haga clic nuevamente para quitar las flechas. Haga clic en la herramienta Cambiar orden de lectura para un conjunto de botones de reordenamiento en lugar de la barra de herramientas de formato. La ayuda contextual explica su uso, as como el Orden de lectura en la Ayuda en lnea. En las vistas NF y RFP se aplica un cambio de orden. Modifica la forma en que el cursor se mueve a travs de una pgina cuando se exporta como True Page.
78
Verificacin y edicin
Captulo 4
Edicin inmediata
Esto permite modificar una pgina reconocida mediante la nueva separacin de zonas, sin tener que volver a procesar toda la pgina. Cuando est habilitada la edicin inmediata, los cambios de zona (eliminacin, dibujo, cambio de tamao y de tipo) surten efecto inmediatamente en la pgina reconocida. Por el contrario, cuando modifique elementos en la vista True Page en el Editor de texto, esto cambia las zonas en dicha pgina. La separacin inmediata de zonas tambin se puede utilizar con las pginas no reconocidas. Dos herramientas vinculadas en la barra de herramientas Imagen controlan la separacin inmediata de zonas. Una de estas herramientas siempre est activa cada vez que no se est efectuando el reconocimiento. Haga clic aqu para activar la edicin inmediata. La seal roja muestra que no hay cambios almacenados en la separacin de zonas. Haga clic aqu para desactivar la edicin inmediata. Los cambios en la separacin de zonas se almacenan y las herramientas inmediatas exhiben una seal verde para mostrar que hay cambios almacenados. Para activar estos cambios, lleve a cabo uno de los siguientes procedimientos: Haga clic en la herramienta inmediata con una seal verde. Los cambios en la separacin de zonas surtirn su efecto en el Editor de texto. Haga clic en el botn Realizar OCR para que se vuelva a reconocer toda la pgina, incluyendo sus cambios de zona. Para obtener detalles sobre cmo se manipulan los cambios en la separacin inmediata de zonas y cmo esto afecta a las vistas del Editor de texto, consulte la seccin Procesamiento inmediato en la Ayuda en lnea.
Edicin inmediata
79
La funcin de texto a lenguaje se activa o desactiva en el elemento Modo de lenguaje hablado del men Herramientas o con la tecla F5. Un segundo elemento de men Parmetros de lenguaje hablado... permite seleccionar una voz (por ejemplo, hombre o mujer para un determinado idioma), una velocidad de lectura y el volumen.
80
Verificacin y edicin
Captulo 4
Las tres teclas bsicas para el lenguaje hablado estn juntas en el teclado numrico.
1
Leer palabra actual
2
Leer oracin actual
3
Leer pgina actual
Utilice lo siguiente:
Ctrl 5 teclado numrico Ctrl + signo + teclado numrico Ctrl + signo - teclado numrico Ctrl + * teclado numrico
Se tiene pensado proporcionar programas de lenguaje hablado para los siguientes idiomas: Ingls, francs, alemn, italiano, portugus y espaol. En el archivo Lame encontrar la informacin ms reciente. Slo se instalar un sistema de lenguaje hablado en OmniPage Pro, dependiendo del idioma elegido al comienzo de la instalacin. Si especifica un idioma que no disponga de un sistema de lenguaje hablado, se instalar el ingls. Si en su equipo tiene sistemas de lenguaje compatibles con SAPI para otros idiomas, stos sern detectados y quedarn disponibles para su uso. Sus voces quedarn disponibles en el cuadro de dilogo Parmetros de lenguaje hablado. Una vez que ha asociado una voz con un idioma, OmniPage Pro lo recordar y cambiar las voces segn el idioma de reconocimiento del documento.
81
82
Verificacin y edicin
Captulo 5
Guardar y exportar
Una vez que haya obtenido por lo menos una imagen para un documento, podr exportarla a un archivo. Una vez que ha reconocido por lo menos una pgina, podr exportar los resultados del reconocimiento una sola pgina, pginas seleccionadas o todo el documento a una aplicacin de destino, para lo cual debe guardarlas en un archivo, copiarlas al Portapapeles o enviarlas a una aplicacin de correo. Siempre es posible guardar como documento de OmniPage. Este captulo presenta los siguientes temas:
x x
x x
Guardar imgenes originales Guardar los resultados del reconocimiento Guardar un documento mientras trabaja Seleccionar un nivel de archivo Seleccionar opciones avanzadas de guardar Guardar en PDF Copiar pginas al Portapapeles Enviar pginas por correo
Un documento permanece en OmniPage SE tras la exportacin. Esto permite guardar, copiar o enviar sus pginas varias veces; por ejemplo, con diferentes niveles de formato, utilizando diferentes tipos de archivos, nombres o ubicaciones. Tambin podr agregar o volver a reconocer las pginas o modificar el texto ya reconocido. Con el procesamiento automtico y utilizando el Asistente de OCR, usted especifica el primer destino donde se guardar el archivo antes de comenzar dicho proceso. Cuando se reconoce (o se verifica, si ello fue solicitado) la ltima pgina disponible, aparece un cuadro de dilogo de exportacin. Podr especificar la exportacin en cualquier momento en que no est ocupando el programa. Si solicita exportar un documento con pginas no reconocidas, se le
83
consultar si primero desea reconocerlas. Si su respuesta es No, slo se exportarn los resultados de las pginas reconocidas. Si se han modificado zonas en las pginas reconocidas, se le solicitar que vuelva a reconocer dichas pginas antes de exportar.
Para ver el tamao y la resolucin original de una imagen, pose el cursor sobre su miniatura en el Panel de imgenes. En OmniPage Pro puede guardar el documento con cinco variantes de PDF. Dos de stas guardan las imgenes originales, las dems guardan los resultados del reconocimiento. Consulte las prximas secciones. Guardar a PDF no est disponible en OmniPage SE.
84
Guardar y exportar
Captulo 5
Seleccione esta opcin para abrir automticamente el archivo guardado en su aplicacin de destino. Posibles alternativas: Todas las pginas Pgina actual Pginas seleccionadas Seleccione las pginas con miniaturas o en el Administrador de documentos.
Haga clic en Avanzadas para abrir el panel inferior y en Bsicas para cerrarlo. Haga clic aqu para ver y cambiar las opciones de salida del tipo de archivo actual. Posibles alternativas: Crear un solo archivo para todas las pginas Crear un archivo por pgina Crear un archivo nuevo despus de cada pgina en blanco Crear un archivo nuevo para cada archivo de imagen
3. Seleccione una ubicacin de carpeta y un tipo de archivo para el documento. El tipo de archivo OPD especial es el ltimo en la lista de tipos de archivo. Luego seleccione el nivel de formato para el documento. Consulte Seleccionar un nivel de archivo en la pgina 87.
85
4. Escriba un nombre de archivo. Haga clic en el botn Avanzadas si desea especificar un rango de pginas, una opcin de separacin de archivo u otras opciones de guardar. Seleccione la opcin deseada. Consulte Seleccionar opciones avanzadas de guardar en la pgina 88. 5. Haga clic en Aceptar. El documento se guardar en el disco segn se especifique. Si se selecciona Guardar e iniciar, el archivo exportado aparecer en la aplicacin de destino, que es la asociada con el tipo de archivo seleccionado en su sistema Windows o en las opciones de guardar avanzadas del convertidor del tipo de archivo seleccionado.
Los grficos, cuadrculas de tablas y otras propiedades se guardan en el documento slo si el tipo de archivo seleccionado es compatible con ellas, y si se especifica su retencin en los parmetros avanzados (Opciones de convertidor) para el tipo de archivo actual. Si se crea ms de un archivo de exportacin, OmniPage SE agregar sufijos numricos al nombre de archivo a fin de crear nombres de archivo exclusivos. Si selecciona Crear un archivo nuevo despus de cada pgina en blanco con una entrada de archivos de imagen, puede colocar archivos de imgenes en blanco en el documento. Consulte Entrada desde archivos de imagen en la pgina 50. Si selecciona Crear un nuevo archivo para cada archivo de imagen, no se requiere un nombre de archivo. Cada archivo de salida recibir el nombre del archivo de entrada que lo gener y cambiar slo su extensin.
86
Guardar y exportar
Captulo 5
Si desea trabajar nuevamente con su documento en OmniPage SE en una sesin futura, gurdelo como documento de OmniPage. Este es un tipo especial de archivo de salida. Guarda las imgenes originales del archivo junto con los resultados del reconocimiento, los parmetros y los datos de capacitacin. Consulte Documentos de OmniPage en la pgina 31. El cuadro de dilogo Guardar como muestra los tipos de archivo disponibles en la lista desplegable Guardar como archivo de tipo. El documento de OmniPage es el ltimo formato de esa lista. Si guarda el documento por primera vez como documento de OmniPage (por ejemplo, llamndolo memo.opd), lo puede modificar guardndolo posteriormente como archivo de texto (por ejemplo, memo.txt), y volver a hacerle cambios, para luego hacer clic en Guardar; los cambios recientes se guardarn en el archivo memo.txt, no en el archivo OPD. Al cerrar el documento o salir del programa, se le solicitar que guarde el documento si no lo ha guardado como un documento de OmniPage, o si hay cambios desde la ltima vez que lo almacen como OPD.
87
Flujo de pginas (FP) Esta opcin mantiene el diseo original de las pginas, incluyendo las columnas. Esto se efecta cada vez que es posible con parmetros de columnas y sangras, no con cuadros de texto ni marcos. El texto fluir de una columna a otra, lo que no ocurre cuando se utilizan cuadros de texto. OmniPage SE no permite la salida de flujo de pginas. Esta funcionalidad slo est disponible en OmniPage Pro. True Page (TP) Esta opcin mantiene el diseo original de las pginas, incluyendo las columnas, y se efecta con cuadros y marcos de texto, imagen y tabla. Se ofrece slo para aplicaciones de destino que sean compatibles con estas caractersticas. Hoja de clculo Esta opcin sirve para exportar los resultados del reconocimiento en formato de tabla, adecuado para usar en aplicaciones de hoja de clculo. La eliminacin de las columnas en la exportacin NF y RFP se efecta de izquierda a derecha y de arriba hacia abajo:
Pgina original Resultado sin columnas
Antes de la exportacin, revise en la vista NF o RFP que el orden sin columnas de los elementos sea correcto. De no serlo, cambie a la vista True Page y haga clic en la herramienta Mostrar orden de lectura para que aparezca el orden de lectura mediante flechas. Utilice la herramienta Cambiar orden de lectura para especificar un orden distinto. Las reas de varias columnas muestran cules de ellas estn vinculadas. Si este vnculo no es adecuado, desagrupe el rea y cambie el orden de los elementos encerrados.
88
Guardar y exportar
Captulo 5
Haga clic en Aplicar para que los nuevos parmetros surtan efecto slo en la grabacin actual. Haga clic en Predeterminados para que toda la configuracin vuelva a los valores predeterminados del tipo de archivo actual. Haga clic en guardar para aplicar los parmetros cambiados a la grabacin actual y tambin se almacenen como parmetros que se han de aplicar a futuro cada vez que se seleccione este tipo de archivo nuevamente para guardarlo.
El programa asociado actualmente con el tipo de archivo escogido para la caracterstica Guardar e iniciar aparece en la parte inferior del cuadro de dilogo. Haga clic en el botn de los tres puntos para especificar un programa distinto. Para crear su propio convertidor personalizado, prepare los parmetros, haga clic en Nuevo convertidor, proporcione un nombre y luego haga clic en Aceptar. Alternativamente, nombre primero el convertidor, luego cambie los parmetros y despus haga clic en Guardar. Los convertidores personalizados son muy tiles para tareas repetidas como, por ejemplo, para publicar una revista semanal. Luego todas las pginas reconocidas se podrn exportar con su formato diseado para su uso especfico. Tambin puede crear un conjunto de convertidores personalizados para un tipo de archivo determinado que defina las opciones de guardar para cada nivel de formato de salida, por ejemplo: RTF sin formato, RTF mantener fuentes y prrafos y RTF True Page. Usted puede cambiar las opciones de convertidor sin guardar nada en un archivo. Abra el cuadro de dilogo Convertidores de exportacin en el men Herramientas. Seleccione el convertidor deseado y haga clic en el botn Opciones. En este caso, el botn Aplicar no est disponible.
89
Guardar en PDF
Esta seccin no es aplicable a OmniPage SE. En OmniPage Pro 12 contar con cinco opciones al guardar en archivos de Formato de documento porttil (conocido como PDF). PDF (Normal): Las pginas se exportan tal como aparecieron en el Editor de texto en la vista True Page. Este archivo PDF se puede ver y buscar con el visor de PDF y modificar en un editor de PDF. PDF editado: Utilice esta opcin si ha efectuado cambios de edicin importantes en los resultados del reconocimiento. Usted tiene tres alternativas de niveles de formato, incluyendo True Page. El archivo PDF se puede ver, buscar y editar. PDF con imagen en texto: El archivo PDF slo se puede ver pero no modificar en un editor de PDF. Las imgenes originales se exportan, pero hay un archivo de texto vinculado detrs de cada imagen, de modo que se pueda buscar el texto. La palabra buscada se resalta en la imagen. PDF con sustitutos de imagen: Tal como en el caso de PDF (Normal), pero las palabras que contienen caracteres rechazados y dudosos tienen superposiciones de imagen, de modo que estos caracteres inciertos aparezcan como estaban en el documento original. El archivo PDF se puede ver, buscar y editar. PDF, slo imagen: Se exportan las imgenes originales. El archivo en PDF slo se puede ver pero no modificar en un editor de PDF y tampoco es posible buscar texto.
90
Guardar y exportar
Captulo 5
Con el procesamiento automtico, seleccione el parmetro Copiar al Portapapeles de la lista desplegable Exportar resultados en la Caja de herramientas de OmniPage o en el Asistente de OCR. Aparecer el cuadro de dilogo Copiar al Portapapeles apenas se reconozca y verifique la ltima pgina disponible. Con el procesamiento manual, seleccione el parmetro Copiar al Portapapeles en la lista desplegable Exportar resultados y luego haga clic en su botn. Aparecer de inmediato el cuadro de dilogo Copiar al Portapapeles. Especifique un rango y nivel de formato a utilizar y luego haga clic en Aceptar para empezar a copiar.
Usted puede efectuar una operacin de cortar y pegar para la pgina actual mediante el procedimiento de arrastrar y colocar. Pulse sin soltar las teclas Ctrl+Tab a medida que hace clic en la pgina actual en el Panel de imgenes y arrastre el cursor a una aplicacin de destino con un documento abierto. El contenido de la pgina se pegar en el lugar donde se encuentre el cursor. El OCR se ejecuta si es necesario.
Con el procesamiento automtico, seleccione el parmetro Enviar como correo en la lista desplegable Exportar resultados de la Caja de herramientas de OmniPage. Aparecer el cuadro de dilogo Enviar como correo apenas se reconozca o verifique la ltima pgina disponible del documento. Con el procesamiento manual, seleccione el parmetro Enviar como correo en la lista desplegable Exportar resultados y luego haga clic en su botn. Aparecer de inmediato el cuadro de dilogo Enviar como correo.
En cualquier momento en que no est ocupado el programa, seleccione Enviar como correo en el men Archivo para invocar el cuadro de dilogo Enviar como correo.
91
1. Este cuadro de dilogo permite especificar un tipo de archivo, un rango de pginas, un nivel de formato y las opciones para adjuntar documentos: un adjunto para todas las pginas, un adjunto por cada pgina, un nuevo adjunto cada vez que haya una pgina en blanco o un adjunto por cada archivo de entrada. Fije todas las opciones y haga clic en Aceptar. 2. Regstrese en su aplicacin de correo electrnico si se le solicita hacerlo. 3. La aplicacin de correo aparecer con el documento o documentos adjuntos en un nuevo mensaje vaco. Los adjuntos toman el mismo nombre utilizado la ltima vez que se guard el documento en OmniPage SE o, bien, aparecen como Sin ttulo desde OmniPage. Se agrega la correspondiente extensin de archivo y los sufijos numricos en caso de haber ms de un documento adjunto. 4. Escriba la direccin de destino de su mensaje de correo, agregue texto al mensaje si lo desea y luego haga clic en el botn Enviar.
El programa puede detectar direcciones de correo electrnico a medida que reconoce pginas y las transmite al Editor de texto. Si hace clic en una direccin, su aplicacin de correo aparece con un nuevo mensaje vaco que contiene slo la direccin de correo electrnico.
92
Guardar y exportar
Captulo 6
Informacin tcnica
En este captulo se proporciona informacin sobre resolucin de problemas y dems informacin tcnica acerca del uso de OmniPage SE. Consulte tambin el archivo en lnea Lame y los dems temas de la ayuda o visite las pginas web de ScanSoft. La seccin del escner contiene informacin detallada y actualizada regularmente acerca de la configuracin y respaldo del escner. El archivo Lame contiene la informacin ms reciente acerca de OmniPage SE. Podr acceder al archivo Lame y a las pginas web de ScanSoft mediante el men Ayuda. Este captulo contiene la siguiente informacin:
x
Resolucin de problemas Soluciones iniciales Probar OmniPage SE Aumentar los recursos de memoria Aumentar el espacio de disco El texto no se reconoce correctamente Problemas con el reconocimiento de fax Problemas de sistema o rendimiento durante el OCR Compatibilidad con ODMA Caractersticas avanzadas en Programar OCR Tipos de archivo compatibles Tipos de archivos para abrir y guardar imgenes Tipos de archivos para guardar los resultados del reconocimiento Desinstalacin del software
x x x
93
Resolucin de problemas
Si bien OmniPage SE est diseado para un fcil uso, en ocasiones ocurren problemas. Muchos de los mensajes de error contienen descripciones autoexplicativas de lo que se debe hacer: revisar las conexiones, cerrar otras aplicaciones para liberar memoria, etc. En ocasiones bastar con esas indicaciones. En la documentacin de Windows encontrar informacin para optimizar su sistema y el rendimiento de las aplicaciones.
Soluciones iniciales
Intente estas soluciones si experimenta problemas al iniciar o usar OmniPage SE:
x x x
Cercirese de que su sistema cumpla todos los requisitos enumerados. Consulte Requisitos del sistema en la pgina 12. Cercirese de que el escner est enchufado y que todas las conexiones de cables estn fijas. En la seccin de asistencia tcnica del sitio web www.scansoft.com de ScanSoft encontrar notas tcnicas sobre temas comnmente mencionados al usar OmniPage. Nuestras pginas web tambin pueden ofrecer asistencia acerca del proceso de instalacin y resolucin de problemas. Apague su equipo y el escner, encienda nuevamente este ltimo y luego reinicie su equipo. Cercirese de que las dems aplicaciones estn funcionando correctamente. Utilice el software que viene con el escner para verificar que ste funciona correctamente antes de usarlo con OmniPage SE. Cercirese de contar con los controladores correctos para el escner, la impresora y la tarjeta de vdeo. Encontrar ms informacin al respecto en la seccin de escneres de la pgina web de ScanSoft, a la cual se puede acceder mediante el men Ayuda. Ejecute ScanDisk para Windows 98 o Me, o Check Disk para Windows NT, 2000 y XP a fin de revisar si la unidad de disco duro presenta errores. Encontrar ms informacin en la ayuda en lnea de Windows. Haga una defragmentacin en el disco duro. Encontrar ms informacin en la ayuda en lnea de Windows. Desinstale y reinstale OmniPage SE, tal como se describe en la ltima seccin, Desinstalacin del software en la pgina 103.
x x
x x
94
Informacin tcnica
Captulo 6
Probar OmniPage SE
Al reiniciar Windows 98, Me, 2000 o XP en el modo a prueba de errores o Windows NT en el modo VGA se podr probar OmniPage SE en un sistema simplificado. Esto se recomienda si no puede resolver problemas de bloqueo del sistema o si OmniPage SE ha dejado de funcionar por completo. Encontrar ms informacin en la ayuda en lnea de Windows.
El escner no funcionar con OmniPage SE en el modo a prueba de errores o en el modo VGA, de modo que no intente diagnosticar problemas con el escner en esta configuracin. w
Para probar OmniPage SE en el modo a prueba de errores (Windows 98, 2000, Me o XP): 1. Reinicie su equipo en el modo a prueba de errores pulsando F8 inmediatamente despus de que aparezca el mensaje que indica que se est reiniciando Windows. 2. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice un archivo de imagen conocido como, por ejemplo, uno de los archivos de imagen de ejemplo suministrados. Si OmniPage SE no se inicia ni funciona correctamente en el modo a prueba de errores, puede que haya un problema en la instalacin. Desinstale y reinstale OmniPage SE (consulte la parte final de este captulo) y, luego, ejectelo en el modo a prueba de errores de Windows. Si OmniPage SE se ejecuta correctamente en el modo a prueba de errores, entonces puede que un controlador de dispositivos del sistema est interfiriendo con el funcionamiento de OmniPage SE. Solucione el problema reiniciando Windows en el modo de confirmacin paso a paso. Encontrar ms informacin en la ayuda en lnea de Windows.
Para probar OmniPage SE en el modo VGA (Windows NT): 1. Reinicie su equipo. 2. Seleccione la estacin de trabajo Windows NT versin 4.00 [modo VGA] y pulse Intro. 3. Pulse Ctrl+Alt+Supr y seleccione el Administrador de tareas. 4. En el cuadro de dilogo Administrador de tareas, seleccione todas las aplicaciones en segundo plano y haga clic en la opcin para terminar el proceso. Encontrar ms informacin en la ayuda en lnea de Windows.
Resolucin de problemas
95
5. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice un archivo de imagen conocido como, por ejemplo, uno de los archivos de ejemplo suministrados.
Tambin puede ejecutar OmniPage SE desde una lnea de comando en su propio modo a prueba de errores. Seleccione Inicio Ejecutar, explore en busca del archivo OmniPage.exe y agregue la opcin /safe a la lnea de comandos. Esto iniciar el programa, pero ignorar los parmetros almacenados anteriormente y no intentar recuperar un documento proveniente de la finalizacin anormal del programa.
Reinicie su equipo. Cierre las dems aplicaciones para liberar memoria. Cierre aplicaciones innecesarias de OmniPage. Defragmente el disco duro para liberar bloques contiguos de espacio en el disco. Encontrar ms instrucciones en la ayuda en lnea de Windows. Aumente la cantidad de espacio libre en el disco. Aumente la memoria fsica (RAM) de su equipo. De esa manera podr optimizar el rendimiento de OCR. Consulte Requisitos del sistema en la pgina 12.
x x
96
Informacin tcnica
Captulo 6
Vace la Papelera de reciclaje de Windows. Cierre todas las aplicaciones y elimine los archivos *.tmp en la carpeta Temp. sta generalmente se encuentra dentro de la carpeta Windows. Ejecute ScanDisk o Check Disk. Realice una copia de seguridad de los archivos que no necesite en disquetes o en otros medios y elimnelos del disco duro. Elimine aplicaciones de Windows que no use. Haga una defragmentacin en el disco duro. Borre la cach para el explorador web y limite su tamao.
Observe la imagen de la pgina original y cercirese de que todas las reas de texto queden delimitadas por zonas de texto. Si un rea no queda delimitada en una zona, generalmente ser ignorada durante el OCR. Consulte la seccin acerca de cmo crear y modificar zonas, Trabajo con zonas en la pgina 59. Cercirese de identificar correctamente las zonas de texto. Vuelva a identificar tipos y contenidos de zonas, si fuese necesario, y vuelva a llevar a cabo el OCR en el documento. Consulte Tipos y propiedades de zonas en la pgina 58. Cercirese de no haber cargado una plantilla incorrecta por error. Si los bordes de la zona cortan texto, el reconocimiento ser deficiente. Ajuste los controles deslizantes del brillo y el contraste en el panel Escner del cuadro de dilogo Opciones. Puede que sea necesario experimentar con diferentes combinaciones de parmetros para obtener los resultados deseados. Compruebe la resolucin de la imagen original. Pose el cursor sobre la miniatura de una pgina para ver una pantalla emergente. Si la resolucin es considerablemente superior o inferior a 300 ppp, es probable que el reconocimiento sea deficiente.
x x
Resolucin de problemas
97
Cercirese de seleccionar los idiomas correctos para los documentos en el panel OCR del cuadro de dilogo Opciones. Slo se deben incluir los idiomas incluidos en el documento. Active IntelliTrain y efecte algunas correcciones de verificacin. Es probable que esto ayude ms en el caso de fuentes estilizadas o documentos que estn deteriorados uniformemente. Si ya estaba activado IntelliTrain, intente desactivarlo; en algunos tipos de documentos deteriorados puede que esta aplicacin no resulte de gran ayuda. Efecte una capacitacin manual o edite la capacitacin existente para eliminar una capacitacin incorrecta. Las referencias a la capacitacin no son aplicables a OmniPage SE. Si utiliza True Page como vista del Editor de texto o para la exportacin, el texto reconocido se colocar en marcos (cuadros de formato). Parte del texto puede quedar oculto si un marco es muy pequeo. Para ver el texto, coloque el cursor en el marco del texto y utilice las teclas de direccin del teclado para desplazarse hacia arriba, hacia abajo a la izquierda o a la derecha del marco. Verifique que el cristal, espejos y lentes del escner no tengan polvo, manchas ni estn rayados. Lmpielos si fuese necesario.
OmniPage SE slo reconoce caracteres de texto impresos, tales como mecanografiados o generados en una impresora lser. Puede manejar caracteres impresos mediante matriz de puntos, aun cuando el nivel de exactitud puede disminuir en el caso de texto con calidad de borrador; pero no tiene la capacidad para leer impresin manual o texto manuscrito. Sin embargo, s puede mantener firmas u otro texto manuscrito, en forma de grfico.
Solicite a los remitentes que en lo posible usen documentos limpios y originales. Solicite a los remitentes que seleccionen el modo Fino u ptimo cuando le enven un fax. Esto produce una resolucin de 200 x 200 ppp. Solicite a los remitentes que transmitan los archivos directamente a su equipo va fax mdem si cuenta con dicho aparato. Podr guardar imgenes de fax como archivos de imagen y luego cargarlos en OmniPage SE. Consulte Entrada desde archivos de imagen en la pgina 50.
98
Informacin tcnica
Captulo 6
Resuelva los problemas de baja memoria y espacio de disco insuficiente. Consulte Probar OmniPage SE en la pgina 95. Minimice todas las aplicaciones o haga clic en Alt+Tab para ver si hay mensajes de error de Windows. Revise la calidad de las imgenes. Consulte la documentacin del escner para averiguar formas de mejorar la calidad de las imgenes exploradas. Divida imgenes de pginas complejas (mucho texto y grficos o formato complicado) en trabajos ms pequeos. Dibuje zonas manualmente o modifique las zonas creadas automticamente y efecte el OCR en un rea de una pgina a la vez. Consulte Trabajo con zonas en la pgina 59. Reinicie Windows 98, Me, 2000 o XP en el modo a prueba de errores o, bien, en Windows NT en el modo VGA y pruebe OmniPage SE efectuando un OCR en los archivos de imgenes de ejemplo incluidos.
Si est efectuando varias tareas simultneamente, tales como reconocer e imprimir, puede que el OCR tarde ms.
99
100
Informacin tcnica
Captulo 6
Los archivos de imagen de entrada pueden tener resoluciones de hasta 600 ppp, pero se recomiendan 300 ppp (tanto horizontal como verticalmente) para una exactitud ptima de OCR. El programa almacena imgenes en blanco y negro con su resolucin original, pero las imgenes en escala de grises y en color generalmente no se guardan con ms de 150 ppp. Eso significa que no hay buenos candidatos para un futuro procesamiento de OCR. Coloque el cursor sobre una imagen para que aparezca una ventana emergente mostrando el tamao y la resolucin de la imagen original.
Si intenta guardar una imagen en blanco y negro con formato JPEG, el programa le sugerir la conversin a escala de grises. Con TIFF G3 y G4 le sugerir la conversin a blanco y negro. En OmniPage Pro 12 es posible guardar en formato PDF, con cinco opciones. Dos de stas, Slo imagen e Imagen en texto, exportan imgenes originales. Esto se efecta en el cuadro de dilogo Guardar como. Consulte Guardar en PDF en la pgina 90. No est disponible la opcin guardar a PDF en OmniPage SE. OmniPage SE tampoco puede utilizar los formatos de archivo GIF y TIFF LZW.
101
Sin formato
q q q q q q q q q q q q q
RFP
q q q q q q q q q q q q q
Flujo de pginas
(ver nota 1)
True Page
Hoja de clculo
Grficos
qq
Tablas
q q q
q q
qq q q
q q
qq qq qq qq
q q qq qq qq qq q
qq qq q
q q
qq qq q q q qq q qq qq qq qq q
q qq q q q qq qq qq qq qq qq
(q )
q
(q )
q
(q )
q q
(q )
q q
Se guarda como se ve
102
Informacin tcnica
Captulo 6
Grficos
q Tipo de archivo compatible con grficos qq Tipo de archivo compatible con grficos, con opcin de exportacin para conservar o desechar grficos. Tablas q Tipo de archivo compatible con tablas en cuadrculas, sin opciones de manipulacin de tablas al momento de la exportacin qq Tipo de archivo compatible con tablas, escoja esta opcin para usar cuadrculas o columnas separadas por tabuladores q Tipo de archivo no compatible con cuadrculas de tablas, escoja esta opcin para convertir a columnas separadas por tabuladores o espacios
1 2 3
Estos tipos de archivo y el formato Flujo de pginas no estn disponibles en OmniPage SE. Al guardar archivos en formato HTML, se almacenan todos los grficos como archivos de imagen JPEG independientes. Los resultados del reconocimiento se envan al Portapapeles y en este formato se pegarn en RTF si ello es posible o, de lo contrario, como texto Unicode o ASCII. Todos los formatos de texto estn disponibles como texto o Unicode. Este ltimo acepta la ms amplia variedad de caracteres acentuados. Puede abrir los documentos de OmniPage creados en OmniPage Pro 12 y su version Special Edition. OmniPage SE accepta tambien documentos OPD creados en OmniPage Pro 10, 11 o su version Special Edition. Estos archivos ingresan al programa como documentos sin nombre. Para mantener un archivo OPD en el formato antiguo y tambin guardarlo como nuevo documento OPD, escoja un nombre distinto para evitar sobrescribir el archivo antiguo.
4 5
103
Cierre OmniPage SE. Haga clic en Inicio en la barra de tareas de Windows y escoja el Panel de control y, luego, Agregar o quitar programas. Seleccione OmniPage SE y haga clic en Cambiar. Haga clic en Siguiente en el cuadro de dilogo que aparecer a continuacin. Seleccione la opcin para eliminar o reparar todo y luego Siguiente. Siga las instrucciones hasta terminar el procedimiento.
104
Informacin tcnica
N D I C E
Abrir archivos de imagen, 50, 101 Acercar o alejar pantallas, 24, 70 Acomodacin de texto, 34 Acoplamiento y desplazamiento de barras de herramientas, 25, 70 Actualizacin a la versin OmniPage Pro, 19 Administracin de documentos, 28 Administrador de documentos, 24, 28, 29 personalizar columnas en, 30 Administrador de tareas, 95 Agregar a zonas, 61 capacitacin a archivos de capacitacin, 76 pginas a un documento, 41 palabras a un diccionario del usuario, 70 Agrupar elementos, 78 Alfanumrica, zona, 58 Alimentador automtico de documentos, 33, 50, 53 Almacenar cambios en la separacin de zonas, 79 Alternacin entre el procesamiento manual y automtico, 27, 43 Archivos adjuntos a mensajes de correo electrnico, 91 como destino de exportacin, 84 como fuente de imagen, 50 conservar tras la desinstalacin, 103 opciones de separacin, 85, 92 tipos, 85 tipos compatibles, 101 tipos para la exportacin, 87, 102 Archivos de imagen abrir, 101 ejemplos, 36, 95 entrada, 50 orden de lectura, 50 tipos, 101 varias pginas, 50, 84, 101 Archivos OPD definicin, 31 guardar en OPD, 32 objetivo de, 32 reas de varias columnas, 26, 78 Asistente configuracin del escner, 14 procesamiento, 45
Programar OCR, 49, 100 trabajo nuevo, 49, 100 Atributos de caracteres, 77 Aumentar espacio de disco, 97 recursos de memoria, 96 Avanzadas, opciones de guardar, 88 Ayuda contextual, 9, 25, 33 en lnea, 9 en lnea registro, 17 HTML, 9
Barra de mens, 25 Barras de herramientas acoplamiento, 25 desplazables, 25 Estndar, 24, 25 formato, 24, 25 Imagen, 24, 25 Blanco y negro exploracin, 52 imgenes, 84 Botones Exportar resultados, 41, 43, 85 Obtener pgina, 40, 42 Realizar OCR, 41, 43 Brillo, 33, 52, 97 Buscar palabras dudosas, 69 palabras que no estn en el diccionario, 69 salida en PDF, 90
Caja de herramientas de OmniPage, 24, 27, 40 Calidad de las imgenes, 52 Cambiar orden de lectura, 78 parte de una pgina, 79 tamao de las zonas, 60 tipos de zonas, 59 Capacitacin, 73 archivos de capacitacin, 76 automtica, 74 cargar archivos de capacitacin, 76 crear datos de capacitacin, 76 datos de capacitacin no guardados, 31
descargar archivos de capacitacin, 76 editar archivos de capacitacin, 76 guardar archivos de capacitacin, 76 IntelliTrain, 74 interrogar antes de guardar datos, 31 manual, 74 Caracteres dudosos, 68 no imprimibles, 68 no reconocidos, 68 Caractersticas nuevas en la versin 12 de OmniPage Pro, 17 Carga archivos de capacitacin, 76 Archivos OPD, 31 de un diccionario del usuario, 72 plantillas de zonas, 55, 64 Carpetas observadas, 100 Cerrar documentos, 31 Colocar grficos desde la exportacin, 86 nuevas pginas en el documento, 33 Color exploracin, 52 imgenes, 84 marcadores, 70 Columnas de notas en el Administrador de documentos, 30 en el Administrador de documentos, 30 en tablas, 63 Comparacin de las palabras reconocidas con las originales, 70 Compatibilidad DMS, 99 ODMA, 99 Configuracin Direct OCR, 47 escner, 14 Consejos sobre problemas, 94 Contenido de documentos de OmniPage, 86 Contraste, 33, 52, 97 Control sobre el reconocimiento, 42 Conversin de imgenes, 101 Convertidores de exportacin, 88 Copiar pginas al Portapapeles, 45, 90 Correo, 41, 91 Crear datos de capacitacin, 76 Cuadros, 26, 78 texto reconocido, 98 Cuadros de dilogo
105
E
Edicin y separacin inmediatas de zonas, 79 Editar archivos de capacitacin, 76 atributos de caracteres, 77 atributos de prrafo, 77 diccionarios del usuario, 72 en True Page, 78 grficos, 77 inmediatamente, 79 Salida en PDF, 90 tablas, 62, 78 texto reconocido, 77 Editor de texto, 24, 26, 34, 68 Efecto de los parmetros, 34 Ejemplos de capacitacin, 73 Eliminar archivos de capacitacin, 76 diccionarios del usuario, 72 pginas, 28, 30 plantillas de zonas, 64 separadores de tabla, 63 Entrada desde archivos PDF, 50, 101 desde carpeta para Programar OCR, 100 desde el escner, 51 desde un archivo de imagen, 50 Enviar pginas por correo, 91 Escala de grises exploracin, 52 imgenes, 84 Escneres, 51, 98 configuracin, 14 controladores, 14 dobles, 53 Escritorio, 24 OmniPage, 24 Escuchar lectura de texto en voz alta, 80 Espacio de disco, 12, 97 Exactitud influencia de la capacitacin, 73 influencia en el brillo, 52 influencia en el modo de exploracin, 51 mejoramiento, 51, 73, 97 Exploracin a color, 52 Asistente, 14 blanco y negro, 52 brillo, 33, 52 contraste, 33 dos pginas, 33 entrada desde, 52 escala de grises, 52 imgenes, 52 libros, 33 Exportaciones mltiples, 83, 86
Datos de capacitacin no guardados, 31 Desagrupar elementos, 78 Descargar archivos de capacitacin, 76 diccionario del usuario, 72 plantillas de zonas, 64 Descripcin diseo, 41, 45, 54 diseo del documento, 41, 54 Desinstalacin del software, 103 Desplazarse entre pginas, 28 Deteccin automtica, diseo, 54 Detencin del procesamiento automtico, 41 Dibujar zonas en Direct OCR, 47 Diccionarios, 45, 70 legales, 70 mdicos, 70 profesionales, 70 Diccionarios del usuario, 69, 72 agregar palabras, 69 cargar, 72 descargar, 72 editar, 72 inicio, 72 Direct OCR, 46 panel Opciones, 33 Diseo deteccin automtica, 54 personalizado, 34, 55 Dividir zonas, 58 Documentos administracin, 28 ambas caras, 53, 54 cerrar, 31 colocar pginas nuevas, 33 con diseo variado, 54 copiar al Portapapeles, 45, 90 descripcin del diseo, 54 en OmniPage SE, 23 exportar, 23, 41, 43, 83 guardar, 32, 83 guardar mientras trabaja, 86 sin terminar, 31 terminar, 41 Documentos de OmniPage contenido, 86 definicin, 31 guardar como, 32, 87 objetivo de los archivos OPD, 32
Exportar a aplicaciones de destino, 23, 42, 84 a PDF, 90, 102 a un archivo, 85, 102 al correo, 91 al Portapapeles, 90 flujo de pginas, 88 grficos, 86, 103 tipos de archivo y niveles de formato, 102 True Page, 88 varias veces, 83, 86 Exportar resultados, botn, 41, 43, 85
Filas en tablas, 63 Flujo de pginas, 88 Fondos ignorar, 55 procesar, 55 separacin automtica de zonas, 26, 55 Funcin texto a lenguaje, 80 Funciones de OmniPage SE, 19
G
Generalidades documento, 28 pasos del procesamiento, 23 procesamiento, 36, 38 Generar separadores de tablas, 63 Grficos editar, 77 en archivos HTML, 103 en la exportacin, 86, 102 Guardadas, pginas, 28 Guardar a un archivo, 46, 84 archivos de capacitacin, 76 como documento de OmniPage, 32, 87 diccionarios del usuario, 72 documentos, 83 documentos mientras trabaja, 86 en formato OPD, 32, 85 guardar e iniciar, 86 imgenes originales, 84, 101 opciones, 88 plantillas de zonas, 64 resultados del reconocimiento, 85 texto, 85 Gua inicio rpido, 36 teclado para escuchar texto, 81
Hipervnculos, 78
106
ndice
I
Idiomas interfaz del usuario, 33 reconocimiento, 33, 45, 98 Imgenes a color, 84 archivos de entrada, 22 blanco y negro, 84 calidad, 52 conversin, 101 editar, 77 escala de grises, 84 fondos, 55 guardar, 84, 101 guardar originales, 84, 101 obtener, 23, 42 resolucin, 29, 84, 97, 101 sustitutos en PDF, 90 tamao, 29 Imprimir documentos, 31 pginas reconocidas, 31 Indicadores de encabezado y pie de pgina, 68 Informacin tcnica, 93 Iniciar aplicacin de destino, 86 diccionario del usuario, 72 programa, 14 Insertar separadores de tabla, 63 Instalacin escneres, 14 OmniPage SE, 13 IntelliTrain, 34, 49, 74, 98 Interrogar antes de guardar datos de capacitacin, 31 Interrupcin del procesamiento automtico, 41 Irregulares, zonas, 60
Modificadas, pginas, 28 Modificar plantillas de zonas, 64 Modo a prueba de errores, 95 VGA, 95 Mover separadores de tabla, 63 MS Outlook, 91
P
Pginas archivos de imagen de varias pginas, 50, 84, 101 botn Obtener pgina, 40, 42 copiar al Portapapeles, 45, 90 de hojas de clculo, 55 desplazamiento entre, 28 eliminar, 28, 30 enviar como correo, 91 estado, 28 guardadas, 28 hojas de clculo, 54 modificadas, 28 navegacin, 24, 81 nuevo archivo en pgina en blanco, 50 obtenidas, 28 pendientes, 28, 79 reconocidas, 28 reordenar, 28 seleccionar varias, 28, 29 separadas por zonas, 28 ubicacin en el documento, 33 una columna, 54, 58 una sola columna con tablas, 54 varias columnas, 54 verificadas, 28 volver a reconocerlas todas, 41 Palabras marcadas en el Editor de texto, 68 que no estn en el diccionario, 68 Panel de imgenes, 24, 26 PaperPort, 48 Para, 19 Parmetros Asistente de OCR, 46 cuadro de dilogo Opciones, 33 Direct OCR, 47 efecto, 34 Obtener texto, 47 tipos de zonas, 62 Prrafo editar atributos, 77 estilos, 77, 86 mantener estilos, 86 Pasos bsicos de procesamiento, 23 PDF, archivo de salida, 101 Pendientes, pginas, 28 Personalizar barras de herramientas, 25 columnas del Administrador de documentos, 30 convertidores de exportacin, 88
Negrita, texto, 77 Niveles de formato, 49, 68, 102 tipos de archivo, 102 Nuevas caractersticas en la versin 12 de OmniPage Pro, 17 Nuevo archivo en pgina en blanco, 50 Numrica, zona, 58
O
Objetivo archivos OPD, 32 capacitacin, 73 Obtener ayuda en lnea, 9 imgenes, 23, 42 texto, elementos de men, 47 Obtenidas, pginas, 28 OCR Asistente, 39, 45, 46 definicin, 22 Direct OCR, 33, 46 parmetros, 33 parmetros de Direct OCR, 46 procesamiento automtico, 27, 40 procesamiento manual, 27, 42 Programar OCR, 49 realizar OCR, 23 rendimiento deficiente durante, 99 resultados de la verificacin, 69 trabajos en Programar OCR, 49 verificacin de los resultados de OCR, 70 Ocultar o mostrar marcadores, 68 OmniPage Pro actualizacin a la versin, 19 nuevas caractersticas, 17 OmniPage SE, 19 caractersticas comparadas con OmniPage Pro, 10, 19 desinstalacin, 103 documentos en, 23 funciones, 19 inicio, 14 instalacin, 13 prueba, 95 registro, 17 reinstalacin, 103 versiones anteriores, 13 Opciones guardar, 88 procesamiento, 33
Juntar zonas, 61
L
Lectura orden de los archivos de imagen, 50 texto en voz alta, 80 Lista desplegable Exportar resultados, 43 Obtener pginas, 42
Mantener estilos de prrafo, 86 Marcadores, 68, 70 Marcos, 26, 78, 88, 98 Mejorar la exactitud, 51, 74, 97 Mens rpidos, 59 Miniaturas, 24, 26, 28
107
Portapapeles, 41, 90 Probar OmniPage SE, 95 Problemas reconocimiento de fax, 98 rendimiento durante el OCR, 99 sistema o rendimiento durante el OCR, 99 Procesamiento a partir de otras aplicaciones, 46 alternacin entre el procesamiento manual y automtico, 27, 43 automtico, 27, 40 automtico incompleto, 41 combinado, 27, 43 con el Asistente de OCR, 45 detencin del procesamiento automtico, 41 diferido, 31 documentos en futuras sesiones, 31 interrumpir el procesamiento automtico, 41 manual, 27, 42 paso a paso, 23, 42 pasos bsicos, 23 pasos, generalidades, 23, 38 reiniciar el procesamiento automtico, 41 Programar OCR, 49 carpetas observadas, 100 entrada de carpetas, 100 Propiedades de zonas, 58
Reordenar pginas, 28 Requisitos memoria, 12, 96 mnimos del sistema, 12 sistema, 12 Resolucin, 29, 84, 97, 101 Resolucin de problemas, 93, 94 Retencin del diseo, 69
V
Verificacin opciones, 34, 69 remota, 31 resultados de OCR, 69, 70 sesiones futuras, 31 Verificadas, pginas, 28 Verificador dinmico, 70 Verificar texto, 70 Vnculos a pginas Web, 78 Vistas Editor de texto, 26, 68 Mantener fuentes y prrafos, 68, 87 Sin formato, 68, 87 True Page, 69 Volver a reconocer pginas, 43
Seleccin de varias pginas, 29 Separacin automtica de zonas, 26, 34, 41, 54, 59 inmediata de zonas, 79 Soluciones en caso de rendimiento deficiente, 94 Special, 10 Subrayado, texto, 77 Sugerencias durante la verificacin, 70
T
Tablas columnas en, 63 editar, 78 editar separadores, 62 eliminar separadores, 62 en pginas de una sola columna, 54 filas en, 62 generar separadores, 63 insertar separadores, 63 manipular tablas en el Editor de texto, 78 mover separadores, 63 zonas, 59, 62 Terminar un documento, 41 Texto con matriz de puntos, 98 guardar, 85 TIFF, archivos de imagen, 101 Tipos archivos compatibles, 101 zonas, 58 Trabajos Programar OCR, 49 zonas, 59 True Page, 26 edicin, 78 exportar, 88 vista, 69 TWAIN, controladores para escneres, 14
W Z
Web, vnculos a pginas, 78 Zonas, 26 agregar a, 61 alfanumricas, 58 cambiar el tamao, 60 cambiar tipos, 59 descargar plantillas, 65 dibujar en Direct OCR, 47 dividir, 59 eliminar plantillas, 64 en una pgina, 28 establecer tipos, 63 grficas, 59 guardar plantillas, 64 ignorar, 59 irregulares, 60 manuales, 55, 97, 99 modificar plantillas, 64 numricas, 58 plantillas, 55, 64, 97 procesar, 59 propiedades, 58 quitar de, 59 rectangulares, 60 reemplazar plantillas, 64 separacin manual, 43, 55 tabla, 59, 62 texto, 59 tipos, 26, 58, 97 trabajo con, 59 unir, 61
Q R
Quitar de zonas, 58 Re-capacitacin, 74 Reconocidas, pginas, 28 Reconocimiento aumentar velocidad, 98 efectuar, 42 exactitud, 52, 73, 97 fax, 98 guardar los resultados, 85 idiomas, 33, 45, 98 lento, 99 ptico de caracteres, 22 problemas con el reconocimiento de fax, 98 Rectangulares, zonas, 60 Reemplazar plantillas de zonas, 64 Registro aplicaciones de Direct OCR, 47 OmniPage SE, 17 Reinicio del procesamiento automtico, 41 Reinstalacin de OmniPage SE, 103
Ubicacin de pginas nuevas, 33 Una columna pginas, 54, 58 pginas con tablas, 54
108
ndice