3 votos

¿Automatizar el ahorro diario de webarchive?

¿Es posible automatizar el ahorro de una página web (formato .webarchive) cualquiera de Automator (en un proceso en segundo plano) o utilizando Terminal?

Gracias de antemano.

2voto

Malik hassan Puntos 16

Sí es la respuesta simple, ya sea con.

Estoy en mi iPad en el mes. Pero usted puede usar comandos de unix curl para descargar de la página web y la tubería para el comando unix textutil que puede dar salida a un archivo webarchive.

Si tengo la oportunidad voy a publicar un ejemplo.


He aquí un pequeño ejemplo (rápida ) de lo que yo estaba pensando. Escrito en Applescript ejecutando hacer script de shell de comandos.

  property agent : "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.6; en-US; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3"

property outPutFormat : "rtf"
property saveDIR : "/Users/USERNAME/Desktop/"
property fileName : "test2"

set theData to do shell script "curl " & " -A" & space & quoted form of agent & space & "http://weather.yahoo.com/france/auvergne/france-29332634/" as string


do shell script "echo " & quoted form of theData & "|textutil -format html -convert" & space & outPutFormat & space & "-stdin -output " & space & saveDIR & fileName & "." & outPutFormat

Aunque esto funciona. No estoy muy feliz con los resultados. Esto es debido a la curvatura y textutil sólo procesa el código html, pero no los recursos.

Así que estoy trabajando en algo que va a guardar un archivo web de una manera mucho mejor. El 90% no, pero tomará un poco más de tiempo para mí de escribir

2voto

myhd Puntos 1948

Descargar y guardar como archivo web

Una herramienta de línea de comandos denominada webarchiver va a direcciones Url de descarga y salvar a .webarchive formato. Puede instalar esta herramienta a través de la MacPorts (¡ay, que no homebrew!) o compilarlo con XCode. Soy un XCode ficticio, pero el éxito con las instrucciones que se encuentran aquí.

Cómo funciona:

webarchiver 0.5
Usage: webarchiver -url URL -output FILE 
Example: webarchiver -url http://www.google.com -output google.webarchive
-url    http:// or path to local file
-output File to write webarchive to

Bonito nombres de archivo

Este largo de una línea de terminal permite configurar la URL deseada y se descarga de una AAAA-MM-DD-prefijo de archivo webarchive:

URL="www.nytimes.com"; ./webarchiver -url "http://$URL" -output "/Users/<your username>/Desktop/$(date +"%Y-%m-%d-$URL.webarchive")"

Esto va a guardar un archivo web a tu Escritorio:

2014-02-10-www.nytimes.com.webarchive

Si usted no está seguro de lo <your username> , ingrese whoami en la Terminal.de la aplicación y presione entrar, por supuesto).

Cron

Prefiero utilizar launchd, como "el uso de cron en OS X es desanimado". Hay un bonito launchd editor llamado Lingon. Divertirse!

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X