3 votos

¿Utilizar el dictado para transcribir archivos de audio por lotes?

Tengo muchos archivos de audio que quiero transcribir. Dictation es el mejor transcriptor que he encontrado que funcione en mi MacBook (existen otros como PocketSphinx pero no es ni de lejos tan preciso).

¿Cómo puedo utilizar Dictation para transcribir archivos de audio por lotes?

0 votos

No sé si has visto o no el siguiente artículo, pero pensé que merecía la pena echarle un vistazo. Échale un vistazo: Cómo transcribir audio .MP3 de podcasts o películas .MP4 a texto en Mac OS

0 votos

@user3439894 no me sirve, lo necesito específicamente por lotes . Por supuesto, ya me he dado cuenta de que podría usar la redirección salida>entrada para transcribir sólo un par de minutos de audio, pero estoy hablando de días de audio, y no quiero no poder usar mi MacBook durante días.

0 votos

Entiendo perfectamente que quieras hacerlo por lotes, después de todo dijiste "¿Cómo puedo usar Dictation para transcribir archivos de audio por lotes?". Además, si tienes que transcribir durante días y también tienes que usar el Mac al mismo tiempo, no creo que puedas hacerlo con Dictation. Dicho esto, yo configuraría una solución con guión que se ejecute mientras no estoy usando el ordenador, por ejemplo, mientras duermo, para que no interfiera con mi uso.

2voto

David Hollman Puntos 1186

Acabo de probar a usar eqMac con VLC. En VLC puedes seleccionar qué dispositivo de audio usar para la salida en el menú de audio.
A continuación, en los ajustes de dictado, puedes seleccionar eqMac como entrada y continuar desde ahí, como se indica en la entrada del blog mencionada en los comentarios.
Para el procesamiento por lotes, basta con tener una lista de reproducción VLC de todos sus archivos y dejarlo ir. Todo irá a un archivo de texto sin embargo.
Hice la prueba con algunas grabaciones anteriores y el reconocimiento fue deficiente. Espero que mejore con un discurso más articulado y claro.

2voto

Franck Dernoncourt Puntos 1280

Puede utilizar SFSpeechRecognizer ( espejo ) (requiere MacOS 10.15 +): está hecho para el reconocimiento de voz y es un SDK para que puedas escribir algo de código para el procesamiento por lotes.

Realice el reconocimiento de voz en audio en directo o pregrabado, reciba transcripciones, interpretaciones alternativas y niveles de confianza de los resultados.

Tenga en cuenta que de https://developer.apple.com/videos/play/wwdc2019/256/ ( espejo ):

enter image description here

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X