Quiero poder hacer una captura de pantalla en mi mac, enviarla a un motor de OCR y obtener el texto que ha identificado.
¿Existe alguna herramienta de software que haga esto para MacOS?
Quiero poder hacer una captura de pantalla en mi mac, enviarla a un motor de OCR y obtener el texto que ha identificado.
¿Existe alguna herramienta de software que haga esto para MacOS?
He utilizado FastScripts para asignar un atajo de teclado a estos comandos:
screencapture -i /tmp/tesseract.png
tesseract /tmp/tesseract.png stdout|tr -d \\f|LC_CTYPE=UTF-8 pbcopy
brew install tesseract
instala Tesseract. Tesseract imprime en STDOUT cuando el nombre del archivo de salida se especifica como stdout
. Se añade un carácter de alimentación de forma al final de la salida.
En el caso de los textos no ingleses, hay que especificar manualmente el idioma: por ejemplo -l deu
para el alemán. Para listar los idiomas disponibles, ejecute tesseract --list-langs
.
Edición: En los casos en los que Tesseract produce resultados inexactos, ahora utilizo la API de Cloud Vision de Google en su lugar. Demostración: https://cloud.google.com/vision/docs/drag-and-drop .
curl -sH"Authorization:Bearer $(gcloud auth application-default print-access-token)" -HContent-Type:application/json\;charset=utf-8 https://vision.googleapis.com/v1/images:annotate -d@<(printf %s '{"requests":[{"image":{"content":"'"$(base64 input.png)"'"},"features":[{"type":"TEXT_DETECTION"}]}]}')|jq -r '.responses[0].fullTextAnnotation.text'
Edición 2: Mi prueba gratuita para la API de Google expiró, así que ahora uso Yandex Translate para hacer OCR para las imágenes con las que Tesseract tiene problemas: https://translate.yandex.com/ocr .
Edición 3: Puedes hacer esto para traducir también el texto ( https://cloud.google.com/translate/docs/basic/translating-text ):
curl -HAuthorization:Bearer\ $(gcloud auth application-default print-access-token) -HContent-Type:application/json -d@<(jq -sR '{q:.,target:"de"}'<<<example) https://translation.googleapis.com/language/translate/v2|jq -r '.data.translations[0].translatedText'
TextSniper es otra aplicación que realiza capturas de pantalla OCR. Reconoce cualquier texto de la captura de pantalla y copia el texto editable en el portapapeles. No requiere conexión a Internet y es muy rápido. Otra gran característica de TextSniper es que puede convertir el texto reconocido en voz, muy útil para las personas que tienen dificultades para leer el texto de la pantalla.
Recientemente he comprado Condensar ($5 appstore), que hace exactamente lo que describes.
OWLOCR es una gran aplicación que hace exactamente lo que quieres y mucho más.
Lo hago con LEADTOOLS OCR. No lo he usado mucho. Es fácil de usar. Sólo lo usé en una imagen más pequeña... una captura de pantalla de un libro con ambas páginas en la toma... esto hizo que el texto fuera más pequeño, contribuyendo a los errores.
No estoy seguro de que todavía esté disponible. El copyright de LEADTOOLS OCR es de 1991-2014, y es la versión 2.
Buena suerte.
AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.