Instalacion de Tesseract
sudo apt-get install tesseract-ocr-spa tesseract-ocr
ocrfeeder es una aplicación gráfica para el uso de Tesseract
sudo apt-get install ocrfeeder
tesseract --help
Para conocer las opciones del comando
Para ver los lenguajes instalados usaremos el comando
tesseract --list-langs
Instalación del diccionario en español (si no lo instalamos o nos ha dado problemas).
sudo apt-get install tesseract-ocr-spa
Consola de comandos para reconocer el text del fichero ./test-ocr.jpg. Nos creará un fichero test-ocr-txt.txt
tesseract ./test-ocr.jpg test-ocr-txt -l spa
Instalarlo compilándolo desde el código fuente
La versión actual es la 5.3.3, pero la que te ofrece el repositorio de Raspberry Pi en la versión de es la 4.0.0
Para poder trabajar con la última versión tenemos que descargar el código fuente y compilarla en nuestra Raspi.
Para ello vamos a compilar la última versión de Leptonica, que es una aplicación de la que depende Tesseract. La versión que viene instalada en la Raspi es la 1.76.0
Para ello tendremos que ejecutar los siguientes comandos, descargando primero los ficheros y accediendo a la carpeta de instalación, para luego configurar e instalarlo. La información la tenemos en https://github.com/DanBloomberg/leptonica, de donde he obtenido lo siguiente:
git clone https://github.com/Microsoft/vcpkg.git
cd vcpkg
./bootstrap-vcpkg.sh # "./bootstrap-vcpkg.bat" for powershell
./vcpkg integrate install
./vcpkg install leptonica
Cuando he ejecutado la orden ./bootstrap-vcpkg.sh, me ha pedido configurar la variable de entorno VCPKG_FORCE_SYSTEM_BINARIES, por lo que he ejecutado el comando export
export VCPKG_FORCE_SYSTEM_BINARIES=1
Tras la finalización ha mostrado la siguiente información
vcpkg package management program version 2999-12-31-unknownhash
See LICENSE.txt for license information.
Telemetry
---------
vcpkg collects usage data in order to help us improve your experience.
The data collected by Microsoft is anonymous.
You can opt-out of telemetry by re-running the bootstrap-vcpkg script with -disableMetrics,
passing --disable-metrics to vcpkg on the command line,
or by setting the VCPKG_DISABLE_METRICS environment variable.
Inicialmente he vuelto a crearlo con
./bootstrap-vcpkg.sh -disableMetrics
Pero, añadiré la variable de entorno
export VCPKG_DISABLE_METRICS =1
posteriormente se debería incluir en el fichero de inicio para el entorno bashrc. Editaremos el fichero
nano $HOME/.bashrc
y añadiremos esa línea al final