La categoría «digitalización de documentos» incluye aquellas aplicaciones y procesos destinados a la conversión de documentos e imágenes en formato físico, (usualmente papel) a formato digital.
Los ejemplos más usuales de este tipo de dispositivos son los escáneres.
Tabla de contenidos
Reconocimiento Óptico de Caracteres (OCR)
Al escanear un documento de texto, de forma predeterminada en muchas aplicaciones, este se digitaliza como una fotografía. En otras palabras, no existe en este documento caracteres reconocibles, sino solo píxeles, puntos de colores. Sin embargo, cada vez son más habituales las aplicaciones que, ya sea automáticamente o a petición nuestra, convierten esos píxeles escaneados en caracteres, entregándonos así un documento de texto en formatos OpenDocument, M. Word, PDF y tal vez otros. Esto es posible gracias a la tecnología de reconocimiento de caracteres OCR.
Aplicación de escaneo NAPS2
NAPS2 es una potente y completa aplicación libre para el escaneo de documentos e imágenes.
Está bajo licencia GNU GPL (ver licencia), y está disponible para Linux, Windows y Mac.
Ofrece una GUI (entorno gráfico) intuitiva, además de una CLI (interfaz de línea de comandos) la cual permite la automatización del escaneo y guardado a través de scripts.
Permite, entre otras funcionalidades:
- Rotar, recortar y otras manipulaciones de imágenes
- Convertir los documentos escaneados a texto con OCR.
- Unir diferentes páginas escaneadas en un solo documento PDF.
- Compartición de escáneres a través de la red
La instalación en Ubuntu desde el entorno gráfico es sencilla:
- Descargar el archivo .deb desde su página oficial
- En las propiedades del archivo descargado, marcamos la casilla “Permitir ejecutar el archivo como un programa”
- Menú contextual > Abrir con otra aplicación > Instalación de software
- Botón Instalar del gestor de paquetes.
Empezar a usar NAPS2 en Linux
Para empezar a usar NAPS2 debemos crear como mínimo un perfil. Para ello seguimos los pasos:
Clic sobre el botón Perfiles > Nuevo > escribir un nombre para el perfil > seleccionar protocolo, dispositivo y resto de valores demandados (más detalles sobre estos a continuación)
Controladores WIA y TWAIN de Windows
Desafortunadamente, NAPS2 no fue originalmente diseñado para Linux, así que al crear nuestros perfiles, probablemente no veremos los protocolos WIA y TWAIN, propios de sistemas Windows.
En vez de esto, en Linux el escaneo se realiza mediante otros protocolos como SANE o ESCL.
Crear el primer perfil
Para configurar una impresora en Linux de la que desconocemos su compatibilidad, recomendamos probar las opciones SANE y ESCL, ambas junto con el botón “Seleccione un dispositivo”. Elegiremos de los dos protocolos aquel con el que NAPS2 encuentre nuestro escáner en la red.
Recursos
- [naps2.com] Uso de la línea de comandos (CLI) de NAPS2
Aplicación de escaneo xSane
xSane es probablemente el mejor programa de escaneo para GNU/Linux. Muchísimo más completo que Simple Scan. XSane puede ejecutarse como un programa aislado o a través del editor de imágenes GIMP. Nota acerca de la incompatibilidad de GNU-Linux con diferentes escaners/multifunciones: He conseguido hacer funcionar el escáner de multifunciones que era imposible que el sistema detectase con Simple Scan. Recomiendo Simple Scan en el caso de que este cubra nuestras necesidades de escaneo y de que reconozca es el dispositivo y permita escanear, ya que es una aplicación de muy fácil uso. En cualquier otro caso, recomiendo la instalación de XSane.
Además de su cometido principal, el de escanear, permite convertir estos escaneos a texto con tecnología OCR. Sin OCR los escaneos serían solo instantáneas, fotografías sin caracteres reconocibles.