1 votos

¿Cómo buscar en los PDF y extraer las páginas coincidentes con Automator?

Estoy tratando de hacer un flujo de trabajo de Automator que me permita:

  1. Especifique una carpeta para ejecutar las acciones
  2. Buscar en todos los archivos PDF de esa carpeta una determinada palabra (el nombre de mi cliente)
  3. Crear un nuevo archivo PDF con sólo las páginas en las que aparece el nombre de mi cliente
  4. Guarda ese archivo en el escritorio

enter image description here

Hasta ahora, puedo hacer los pasos 1 y 2. Pero, ¿hay alguna forma de ver en qué páginas estaban las coincidencias o de crear un nuevo PDF para las páginas coincidentes?

1voto

SPRBRN Puntos 1008

Me doy cuenta de que esto es un año después de que hicieras la pregunta, pero me gustó el reto. Así que, en resumen, así es como yo lograría esto...

  • Para cada PDF de la carpeta, conviértalo en texto.
  • Utilice un comando perl para buscar en los archivos de texto la palabra clave y devolver el número de página(s).
  • Utilice la herramienta de línea de comandos para extraer páginas del PDF.
  • Combinar las páginas extraídas.

Puedes hacer la primera parte fácilmente con applescript/automator.

El comando perl para obtener los números de página es:

perl -ne 'print "$1$2" if /blah/ .. /--- Page (\d+) ---(\n)/'

La herramienta de comandos que se utiliza para extraer las páginas del archivo PDF se encuentra en users.skynet.be/tools/

Finalmente para fusionar las páginas individuales se puede hacer con automator o las herramientas anteriores también.

Espero que esto ayude.

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X