5 votos

¿Utilidad comercial de línea de comandos para transcribir notas de voz a texto?

Estoy buscando una utilidad comercial de línea de comandos para transcribir mis notas de voz MP3 a archivos de texto. Mi flujo de trabajo consiste en grabar notas de voz a lo largo del día y subirlas como archivos MP3 a Dropbox. Me gustaría convertir estos archivos MP3 en archivos TXT equivalentes por lotes. Mis notas de voz van desde < 1 minuto a un máximo de ~ 10 minutos.

Intenté utilizar Dragon Dictate 4 para Mac y me pareció una pesadilla y muy poco fiable. Me encantaría comprar una versión reducida de esta aplicación que sólo transcribiera archivos de audio, pero no puedo encontrar un producto de este tipo en el sitio web de Nuance. Por desgracia, no pude conseguir esta aplicación para trabajar de forma fiable lo suficiente como para buscar una API o interfaz de secuencias de comandos ... y estoy un poco receloso de este proveedor después de leer acerca de experiencias similares de otros usuarios.

También he mirado servicios en la nube, pero los que he encontrado parecen ser bastante caros: 0,20 $/minuto y con limitaciones en el tamaño máximo del archivo de audio que se puede subir.

4voto

Nikolay Shmyrev Puntos 121

Dudo que puedas encontrar una aplicación comercial de línea de comandos.

Es mejor que utilices alguna librería de código abierto como pocketsphinx http://cmusphinx.sourceforge.net

Para transcribir un archivo puedes utilizar la última versión 5prealpha:

   ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
   pocketsphinx_continuous -infile file.wav -logfn /dev/null

que debería darte una transcripción automática. Para aumentar la precisión puedes adaptarla a tu propia voz.

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X