Me gustaría llamar a una utilidad de línea de comandos en Mac OS X 10.8 que me da la capacidad para convertir un archivo de texto guardado en Occidental estándar de Mac OS Romano de la codificación a la más genérica UTF-8.
Voy a estar llamando a la utilidad de un AppleScript que he creado. AppleScript es muy lento cuando se trabaja con grandes bloques de texto. Como tal, quiero hacer mi análisis de texto y conversión mediante el OS X de la línea de comandos. He encontrado una herramienta que se llama, "sed", que me permite hacer el análisis de texto. Sin embargo, todavía son muchos los elementos de los archivos que necesitan ser limpiadas, los personajes que aparecen como basura si se abre el archivo como utf-8 (por ejemplo inteligente de las comillas y los puntos suspensivos).
Estoy pensando que forzar un texto de conversión de codificación puede ayudar a eliminar todos los no-utf8 caracteres en el archivo. Sin embargo, no puedo ver cómo "sed" fácilmente se puede convertir la codificación de texto.
Voy a guardar la temp archivo txt, como MacRoman, el disco utilizando el construido-en AppleScript rutinas.
¿Alguno de ustedes tiene alguna idea como a un dispositivo integrado en la herramienta de línea de comandos que puede convertir la codificación de texto? De línea de comandos para el rendimiento y integrada, ya que otros usuarios de mi script no necesariamente tienen el buen conjunto de herramientas si no está construido.
Gracias por su ayuda!