¿Qué la diferencia y el uso de codificaciones UTF-8 y UTF-8-MAC en iconv?
Pensé que era la diferencia entre \n y \r (MAC OS 9) al principio.
Pero traté de``
El contenido del archivo no cambia en la vista hex.
Respuesta
¿Demasiados anuncios?Como se explica aquí, utf-8-mac es el utf 8 versión de un texto después de la aplicación de la normalización de Unicode DFN (e.g caracteres acentuados están representados por la base de caracteres además de una combinación de carácter con acento), con cierto punto de código rangos excluidos de la descomposición de la operación.
Por ejemplo, el carácter é se puede representar en dos diferentes igualmente válidos en Unicode:
- "\x{00E9}" - único punto de código, LETRA a minúscula LATINA E AGUDO, utf-8 C3 A9, "compuesto".
- "\x{0065}\x{0301}" - dos puntos de codificación, LETRA a minúscula LATINA E y la COMBINACIÓN de ACENTO AGUDO, utf-8 65 CC, 81, "descompuesto"
UTF-8-MAC se asegurará de que el segundo, descompuesto formulario que se utiliza siempre.