Tengo una carpeta con más de 2.000 páginas web que me he descargado. La mayoría de las extensiones de archivo son .html, aunque algunas son .pdf o .webarchive. Mi sistema operativo es Mojave.
Cuando resalto un icono en Finder, aparece una lista de metadatos, como la URL de origen, el título de la página, el autor y la fecha en que la descargué.
¿Hay alguna forma de obtener toda esa información (el nombre de cada archivo, la URL de origen, el título de la página, el autor y la fecha de descarga) para incluirla en una hoja de cálculo de Numbers?
Puedo hacerlo manualmente, archivo por archivo, pero me llevará días.
0 votos
El archivo metadatos puede verse en Terminal con el
mdls
comando Verman mdls
para más información. Visite también Referencia de atributos de metadatos de archivos - Atributos de metadatos Spotlight . Ej.mdls -name kMDItemAuthors -name kMDItemDownloadedDate -name kMDItemFSName -name kMDItemWhereFroms file ...
Tendría que capturar/procesar la salida de cada archivo y convertirla en un formato utilizable, por ejemplo, un archivo de valores separados por tabulaciones que pudiera abrirse en Numbers.0 votos
Cuando dice "páginas web que he descargado", ¿de qué está hablando exactamente? ¿Se trata de un archivo por página, como en Safari, que guarda una página en un archivo web, filename.webarchive, o está hablando de páginas HTML, filename.html, o de qué exactamente? Por favor, sea explícito y específico. Además, ¿qué versión de MacOS está ejecutando?
0 votos
La mayoría de las extensiones de archivo son .html. Sin embargo, algunos son .pdf o .webarchive. No hay archivos de imagen. Además, estoy ejecutando Mojave OS.
0 votos
En comando mencionado en la respuesta de StarGeek gestionará todos los archivos HTML y PDF de la carpeta a la vez, pero no incluirá los archivos web (.webarchive), ya que ese tipo de archivo no se admite de esa forma.
0 votos
Probablemente no habrá un autor sobre los archivos .webarchive, así que para manejarlos, he aquí un ejemplo de cómo generaría un archivo para Numbers. Primero
cd /path/to/files
a continuación, utilice, por ejemploprintf "File Name\tDownload Date\tWhere From\n" > foobar.csv ; for f in *.webarchive ; do d="$(mdls -name kMDItemDownloadedDate -raw "$f" | awk 'FNR==2 { sub(/^ +/, "", $0); gsub(/\"/, "", $0); print }')" ; w="$(mdls -name kMDItemWhereFroms -raw "$f" | awk 'FNR==2 { sub(/^ +/, "", $0); gsub(/\"/, "", $0); print }')" ; printf "${f}\t${d}\t${w}\n" >> foobar.csv ; done
1 votos
Por favor, no incluya la respuesta en la pregunta, envíela a continuación.