extraer el dominio de primer nivel y el dominio de segundo nivel de una URL

Question

extraer el dominio de primer nivel y el dominio de segundo nivel de una URL

Preguntado el 20 de Julio, 2019: Cuando se hizo la pregunta
300 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Me gustaría extraer el dominio de primer nivel y el dominio de segundo nivel de una URL como " https://apple.stackexchange.com/questions/ask "

Ejemplo de URL con el resultado deseado a continuación.

https://apple.stackexchange.com/questions/ask
   stackexchange.com

https://www.nytimes.com/2019/07/16/science/5g-cellphones-wireless-cancer.html
   nytimes.com

https://nextdoor.com/news_feed/?post=117602&ct=-A17-ghvVOF0tfn9vptW_5a7JOBEyP4w6_hJAZUnMQqN56952&ec=OWKiQRDj9vEHefhwfGYAE0s%3D&lc=1002&is=tpe
   nextdoor.com

https://www.amazon.com/gp/product/B007B60SCG/ref=ox_sc_act_title_1?smid=ATVPDKIKX0DER&psc=1
   amazon.com

http://www.verizon.net/index.php
   verizon.net

Ignoro esos dominios de varios niveles. Prefiero usar Bash en MacOS.

Hay muchas páginas para conseguir el nombre de dominio completo:

Extraer el nombre de dominio de la URL utilizando la sustitución de parámetros del shell bash

https://www.cyberciti.biz/faq/get-extract-domain-name-from-url-in-linux-unix-bash/
echo http://example.com/index.php | awk -F[/:] '{print $4}'

https://stackoverflow.com/a/11385736/1360075

No necesito este nivel de perfección.

https://github.com/john-kurkowski/tldextract

Preguntado el 20 de Julio, 2019 por Kerry

Answer 1

2 Respuestas

Answer 2

6voto

Matthew A. Flinchbaugh Puntos 41

Como ya está utilizando awk y buscan una solución sencilla:

awk -F/ '{n=split($3, a, "."); printf("%s.%s", a[n-1], a[n])}' <<< 'http://www.example.com/index.php'
      ^ ^   ^^^^^^^^^^^^^^^^^^                  ^^^^^^^^^^^^
      | |          |                                  |
      | |          |                            last two elements 
      | |          |
      | |          +--- Split the 3rd field (aka the part after //) into
      | |               the array 'a', using '.' as the separator for splitting.
      | |               Returns the number of created array elements in 'n'.
      | |
      | +-------------- The awk code between the '' gets run once for every
      |                 input line, with the fields split by -F/ stored in
      |                 $1, $2 etc. In our case $1 contains "http:", $2 is 
      |                 empty, $3 contains "www.example.com" and $4 etc. the
      |                 various path elements (if there are any)
      |
      +---------------- Split the input lines into fields, separated by '/'

Respondido el 20 de Julio, 2019 por Matthew A. Flinchbaugh (41 Puntos )

Answer 3

4voto

Steve Evans Puntos 155

Análisis de URLs con Bash

Las siguientes preguntas deberían ser un buen punto de partida:

Respuesta de @pjz divide una URL en partes más manejables:

#!/bin/sh

INPUT_URL="https://www.amazon.com/gp/product/B007B60SCG/ref=ox_sc_act_title_1?smid=ATVPDKIKX0DER&psc=1"

# extract the protocol
proto="`echo $INPUT_URL | grep '://' | sed -e's,^\(.*://\).*,\1,g'`"
# remove the protocol
url=`echo $INPUT_URL | sed -e s,$proto,,g`

# extract the user and password (if any)
userpass="`echo $url | grep @ | cut -d@ -f1`"
pass=`echo $userpass | grep : | cut -d: -f2`
if [ -n "$pass" ]; then
    user=`echo $userpass | grep : | cut -d: -f1`
else
    user=$userpass
fi

# extract the host -- updated
hostport=`echo $url | sed -e s,$userpass@,,g | cut -d/ -f1`
port=`echo $hostport | grep : | cut -d: -f2`
if [ -n "$port" ]; then
    host=`echo $hostport | grep : | cut -d: -f1`
else
    host=$hostport
fi

# extract the path (if any)
path="`echo $url | grep / | cut -d/ -f2-`"

echo $hostport

Dada la $hostport Ahora debería ser capaz de despojar el dominio como se desea.

Respondido el 20 de Julio, 2019 por Steve Evans (155 Puntos )

extraer el dominio de primer nivel y el dominio de segundo nivel de una URL

Respuestas

Análisis de URLs con Bash

Preguntas Destacadas

Etiquetas mas usadas

AppleAyuda.com

Powered by:

extraer el dominio de primer nivel y el dominio de segundo nivel de una URL

Respuestas

Análisis de URLs con Bash

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

AppleAyuda.com

Powered by: