Obtener el texto de varias páginas web no funciona si una de las URL está caída

Question

Obtener el texto de varias páginas web no funciona si una de las URL está caída

Preguntado el 27 de Febrero, 2013: Cuando se hizo la pregunta
730 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

He creado un flujo de trabajo simple en Automator que extraerá el texto de una lista de URLs y los guardará en un archivo de texto.

Las acciones son:

Obtener el texto especificado
Obtener texto de una página web
Nuevo archivo de texto

Cada vez que hay un problema con una de las URLs, Automator lanza un error y deja de funcionar - ¿es posible hacer que ignore la URL problemática y continúe?

Preguntado el 27 de Febrero, 2013 por Rana

Answer 1

2 Respuestas

Answer 2

1voto

slick1537 Puntos 26

La razón es que el "Get Specified Text" no permite retornos (si está poniendo más de una línea de texto).

Para poder solucionar este problema (el mío era similar), encontré un pack de acciones de texto de Automator en línea y lo compré (realmente barato). Puedes encontrarlo aquí:

http://www.automatedworkflows.com

Respondido el 28 de Febrero, 2013 por slick1537 (26 Puntos )

Answer 3

0voto

Fuzzy Purple Monkey Puntos 702

¿Podría utilizar curl o wget en su lugar?

for u in $(cat urls.txt); do curl -L "$u"; done > output.txt
brew install wget
wget -i urls.txt -U mozilla -O output.txt

Respondido el 27 de Febrero, 2013 por Fuzzy Purple Monkey (702 Puntos )

Obtener el texto de varias páginas web no funciona si una de las URL está caída

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

AppleAyuda.com

Powered by:

Obtener el texto de varias páginas web no funciona si una de las URL está caída

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

AppleAyuda.com

Powered by: