1 votos

Automator: extracto de texto de un PDF y guardar en el directorio actual

He hecho un Automator servicio para extraer texto de un PDF y guardarlo en el directorio actual, y funciona razonablemente bien.

Toma uno o varios archivos PDF, extrae el texto, y la guarda como independiente .los rtf colocado en el mismo directorio donde el original Pdf fue encontrado.
Bien, excelente, excepto por un pequeño problema: ¿cuál es invariablemente también se guardan junto a los otros .los rtf es un vacío (cero bytes), con el nombre del directorio actual.

Buscando en el flujo de trabajo a continuación, parece que ambas variables ("PDF" y "Perdición") se pasa a la acción "Hent ut PDF-tekst". Es mi suposición razonable y, en cualquier caso, ¿cómo puedo solucionarlo?

enter image description here

La secuencia de comandos en texto plano:

on run {input, parameters}
 tell application "System Events"
 set thePath to POSIX path of (container of (item 1 of input))
 end tell
 return thePath
end run

Como un aparte, Automator, se crea automáticamente una representación PNG de tu flujo de trabajo cuando se guarde, y puede ser fácilmente consiguió por revelar el contenido del paquete.
Genio me di cuenta de esto sólo después de un poco de faffing sobre con la captura de pantalla y GIMP.

1voto

user3439894 Puntos 5883

Aquí está el problema que me encontré con la traducción de "Hent ut PDF-tekst" en el traductor de Google, mientras que la traducción de noruego, inglés, traducido como "Obtener el texto de un PDF" así que cuando he escrito "Get" en las Acciones de Búsqueda en la Casilla de no mostrar ningún PDF Acciones con el "Get" las Acciones que hizo show. Tras un examen ulterior he encontrado Extracto de la PTF de Texto .

Yo era capaz de replicar el problema de un cero tamaño de archivo RTF que está siendo creado junto con el de la real archivo PDF sin embargo yo no era capaz de depurar de por qué y me hizo probar muchas cosas diferentes. A través del Flujo de trabajo se mostró de Bane como una Carpeta de la ruta de acceso al Archivo PDF seleccionado, pero luego convertido en el cero de tamaño RTF, junto con el adecuado archivo RTF y me parece un error en Automator.

Dicho esto, os presento una solución que usted puede elegir si nadie tiene una respuesta que resuelve el problema sin tener que recurrir a esta solución.

Añadir un Ejecutar el Shell Script de Acción al final de la lista de Acciones, la configuración de Shell: /bin/bash y Pase de entrada: como argumento con el siguiente código:

for f in "$@"; do
    if [ ! -s "$f" ]; then
        rm "$f"
    fi
done

Lo que se traduce a: Si este archivo no tiene un tamaño mayor que cero, a continuación, eliminarlo.

Por CIERTO, Si quieres probar el código en primer lugar, usted puede reemplazar temporalmente rm "$f" con algo como say deleting "$f" así que usted puede oír lo que el archivo que va a eliminar. Cuando esté convencido de que va a eliminar el cero de tamaño de archivo, a continuación, poner de nuevo a rm "$f".

Aquí está una imagen de mi Automator Servicio.

Export PDF Text Automator Service

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X