1 votos

¿Leer la información dentro del PDF?

Me gustaría automatizar las facturas que recibo de una determinada empresa. Desgraciadamente, nombran los archivos de forma muy extraña y el nombre del archivo no tiene nada que ver con el número de la factura, ni con la fecha. Así que estoy tratando de encontrar algo para extraer información del interior del PDF. Buscaría cadenas y números concretos. Se me ocurre que Spotlight podría hacer eso, pero no creo que sea la mejor manera. Se agradecen las sugerencias y soluciones a este problema en particular.

Gracias.

1voto

jherran Puntos 6511

Para ese tipo de cosas uso Hazel . Tengo una forma muy fácil de filtrar el contenido de los PDFs basándome en reglas. La siguiente imagen contiene una regla que utilizo para organizar mis facturas. Hazel vigila una carpeta, y actúa sobre cada nuevo archivo allí basado en sus reglas definidas.

Screenshot of Hazel configuration

0 votos

Oh, tienes toda la razón. Olvidé que también puedo hacer coincidir el contenido y hacer una ficha con él. Eso debería servir. Lo intento.

0voto

Milliways Puntos 1548

Sin ver uno de los archivos es difícil dar un consejo específico. Yo probaría con un flujo de trabajo de Automator. Hay una biblioteca de PDF que puede realizar muchas acciones, por ejemplo, Extraer los metadatos de los documentos PDF, Extraer el texto de los documentos PDF

0 votos

Los PDF tienen texto legible. ¿Qué otra información necesita?

0voto

dm199913 Puntos 36

Ni siquiera tiene que comprar Hazel - sólo tiene que crear un Automator script que ponga los archivos en una carpeta especificada que fueron descargados desde el sitio web especificado.

0 votos

Este post no responde a la pregunta original. No dice cómo Automator puede hacer lo que he estado preguntando originalmente.

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X