7 votos

¿Cómo extraer texto de imágenes en terminal?

Sé cómo extraer texto de imágenes utilizando preview.app, sin embargo me gustaría utilizar esta función desde el terminal para extraer todo el texto de un montón de imágenes. He intentado esto usando este método para aplicar la misma operación a varias imágenes, pero no funciona (sólo selecciona el texto de una imagen a la vez).

También he intentado convertir las imágenes en un pdf, pero la selección de texto ya no funciona.

No encontré ninguna aplicación o utilidad de MacOS que pudiera utilizar para extraer el texto de mi(s) imagen(es) desde el terminal.

Ahora mismo utilicé las nuevas capacidades de aprendizaje automático de reconocimiento de texto de Apple (en MacOS y iOS , aquí se explica cómo utilizar su marco Vision).

¿Alguna idea?

7voto

hey_you Puntos 133

En la terminal:

brew install tesseract <- esto instala el programa que necesitas (asumo que tienes brew instalado, si no, ve a este sitio web: https://brew.sh/ ).

Para una imagen haces esto: tesseract my.png textfile

Y obtienes un textfile.txt de esa imagen. También debería funcionar con otros formatos de imagen.

Para recorrer todas las imágenes de un directorio, puede hacer lo siguiente:

for x in ~/Desktop/*.png; do
    tesseract ${x} ${x} 
done

En este caso estoy haciendo un bucle sobre todas las imágenes png de mi Escritorio y creando un .txt para cada uno de ellos.

Si quieres más formatos puedes especificarlos así:

~Desktop/(*.png|*.jpeg|*.jpg|*.bmp)

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X