12 votos

¿Es posible convertir una captura de pantalla en OCR en MacOS?

Quiero poder hacer una captura de pantalla en mi mac, enviarla a un motor de OCR y obtener el texto que ha identificado.

¿Existe alguna herramienta de software que haga esto para MacOS?

11voto

Matt B Puntos 41

He utilizado FastScripts para asignar un atajo de teclado a estos comandos:

screencapture -i /tmp/tesseract.png
tesseract /tmp/tesseract.png stdout|tr -d \\f|LC_CTYPE=UTF-8 pbcopy

brew install tesseract instala Tesseract. Tesseract imprime en STDOUT cuando el nombre del archivo de salida se especifica como stdout . Se añade un carácter de alimentación de forma al final de la salida.

En el caso de los textos no ingleses, hay que especificar manualmente el idioma: por ejemplo -l deu para el alemán. Para listar los idiomas disponibles, ejecute tesseract --list-langs .

Edición: En los casos en los que Tesseract produce resultados inexactos, ahora utilizo la API de Cloud Vision de Google en su lugar. Demostración: https://cloud.google.com/vision/docs/drag-and-drop .

curl -sH"Authorization:Bearer $(gcloud auth application-default print-access-token)" -HContent-Type:application/json\;charset=utf-8 https://vision.googleapis.com/v1/images:annotate -d@<(printf %s '{"requests":[{"image":{"content":"'"$(base64 input.png)"'"},"features":[{"type":"TEXT_DETECTION"}]}]}')|jq -r '.responses[0].fullTextAnnotation.text'

Edición 2: Mi prueba gratuita para la API de Google expiró, así que ahora uso Yandex Translate para hacer OCR para las imágenes con las que Tesseract tiene problemas: https://translate.yandex.com/ocr .

Edición 3: Puedes hacer esto para traducir también el texto ( https://cloud.google.com/translate/docs/basic/translating-text ):

curl -HAuthorization:Bearer\ $(gcloud auth application-default print-access-token) -HContent-Type:application/json -d@<(jq -sR '{q:.,target:"de"}'<<<example) https://translation.googleapis.com/language/translate/v2|jq -r '.data.translations[0].translatedText'

3voto

Varun Madiath Puntos 1440

TextSniper es otra aplicación que realiza capturas de pantalla OCR. Reconoce cualquier texto de la captura de pantalla y copia el texto editable en el portapapeles. No requiere conexión a Internet y es muy rápido. Otra gran característica de TextSniper es que puede convertir el texto reconocido en voz, muy útil para las personas que tienen dificultades para leer el texto de la pantalla.

2voto

Frank Bollack Puntos 10208

Recientemente he comprado Condensar ($5 appstore), que hace exactamente lo que describes.

2voto

OWLOCR es una gran aplicación que hace exactamente lo que quieres y mucho más.

0voto

rprasad Puntos 81

Lo hago con LEADTOOLS OCR. No lo he usado mucho. Es fácil de usar. Sólo lo usé en una imagen más pequeña... una captura de pantalla de un libro con ambas páginas en la toma... esto hizo que el texto fuera más pequeño, contribuyendo a los errores.

No estoy seguro de que todavía esté disponible. El copyright de LEADTOOLS OCR es de 1991-2014, y es la versión 2.

Buena suerte.

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X