2 votos

¿Cómo puedo hacer una conversión por lotes de entidades HTML a Hanzi?

Tengo un enorme archivo .txt que contiene un montón de entidades HTML que representan caracteres Unicode, así:

哀牢山

En pinyin, se diría "Ai Lao Shan" o "Ai1 Lao2 Shan1", para ser más precisos. Necesito una herramienta o línea de comandos o macro de Pages/Numbers, lo que sea, que sustituya todas las cadenas como &#....; en dicho archivo en Hanzi apropiado, que en este caso sería:

¿Alguna sugerencia de una herramienta o script o programa que funcione en MacOS?

5voto

TN. Puntos 3450

Puede instalar recodificar a través de la Terminal con Homebrew :

brew install recode

y luego usarlo para convertir HTML a Unicode, así:

echo '哀牢山' | recode html..utf8

Esto produce

哀牢山

(inspirado en el de @creving <a href="https://stackoverflow.com/a/5929519/4751173">respuesta en Stack Overflow </a>)

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X