10 votos

¿Utilizar el dictado de Mac OS X en un archivo?

En Mountain Lion, Mac OS X puede utilizar su sistema de dictado/reconocimiento de voz para convertir lo que hablas en texto.

Supongamos que tengo un archivo de audio con mi voz hablando. ¿Existe alguna forma de utilizar esta capacidad de dictado para convertir ese archivo de audio en un archivo de texto?

Supongo que la solución de fuerza bruta sería conectar unos auriculares al puerto de audio y acercarlos al micrófono. ¿Existe una solución basada en software más análoga a las tuberías de Unix?

0 votos

Puede que esto no funcione tan bien, ya que la función de dictado de voz tiene un corte que parece estar en torno a los 30 segundos. He tenido mucho más éxito con el dictado corto que con el largo (el largo se sitúa en torno a los 20 segundos).

0 votos

Puedo dividirlo en trozos de diez a veinte segundos si es necesario.

5voto

Matt DeKrey Puntos 111

Puedes instalar Soundflower. Es una gran utilidad que crea dispositivos virtuales de entrada y salida. Así que usted podría ruta reproductor QuickTime, por ejemplo, como la entrada para el dictado. http://cycling74.com/soundflower-landing-page/

0 votos

Soundflower también puede alimentar otros programas de reconocimiento de voz, por ejemplo, Google Docs en el navegador Chrome tiene una función de "escritura por voz".

0 votos

Con este método tendría que esperar la duración del archivo de audio para que se realizara el dictado. Hay algún método más rápido sin utilizar los SDK de Apple?

3voto

RyanCu Puntos 21

En Mavericks, puedes utilizar el dictado en un archivo de audio si utilizas Soundflower además de un reproductor de audio que te permita elegir el dispositivo de salida de sonido, como Audacity. De esta manera no te afectará que Mavericks silencie la salida de sonido del sistema durante el dictado, porque la salida irá a Soundflower antes de que se silencie, y configuras el dictado para recibir sólo de Soundflower. Esto también tiene la ventaja de que otros sonidos que puedan producirse (como el sonido de notificación de un recordatorio) no causarán interferencias. También funcionará mejor que las versiones anteriores de Mac OS X porque el dictado mejorado en Mavericks (que necesita ser activado primero) no corta el dictado después de 30 segundos.

Esta página web proporciona los detalles sobre cómo utilizar el dictado de Mac OS X 10.9 en un archivo de audio: http://www.leveluplunch.com/blog/2013/12/30/convert-recorded-audio-text-using-osx-dictation-audacity-soundflower/

3voto

voulembrar Puntos 11

En Yosemite, cada vez que intentamos utilizar la función de dictado en OSX, se silencian otros sonidos y sólo se activa el micrófono integrado. Es necesario configurar algunas preferencias ocultas para que esto funcione. Abra Terminal e introduzca los dos comandos siguientes:

defaults write com.apple.SpeechRecognitionCore AllowAudioDucking -bool NO

defaults write com.apple.speech.recognition.AppleSpeechRecognition.prefs DictationIMAllowAudioDucking -bool NO

Una vez hecho esto, desactive el dictado en Preferencias del Sistema, espere unos segundos y vuelva a activarlo. Ahora deberías poder dictar mientras se reproduce el audio. Sólo lo he probado con auriculares, probablemente no sea aconsejable sin ellos :)

Para restaurar su sistema a su estado virginal, ejecute estos comandos en Terminal y luego reinicie dictation:

defaults delete com.apple.SpeechRecognitionCore AllowAudioDucking

defaults delete com.apple.speech.recognition.AppleSpeechRecognition.prefs DictationIMAllowAudioDucking

3voto

Khb Puntos 1002

A partir de Catalina/Big Sur, la función de Dictado incorporada ya no acepta audio de ningún micrófono virtual o audio emitido por el sistema. Curiosamente, a menudo parece ignorar el micrófono seleccionado en las preferencias de dictado y simplemente utilizar uno diferente.

¡Pero hay una solución! Utiliza la función de control por voz en lugar de la de dictado. Esto sucede todo sin conexión, por lo que la calidad es algo peor y no es tan consistente como la función de Dictado. Este post trata sobre ese tema: https://machow2.com/dictate-offline-catalina/

Leyendo entre líneas, parece que Apple está tratando de evitar que su elegante servicio de voz a texto basado en la nube se utilice para la transcripción automática... Al igual que la funcionalidad de texto a voz integrada en MacOS ( say ) los rechazos no saldrán usando las voces de Siri de alta calidad.

1voto

pgn674 Puntos 21

Si tienes el software Loopback de Rogue Amoeba, puedes crear un dispositivo de "dictado virtual" y reproducir audio a través de él al servicio de Dictado.

Tienen un guía completa aquí pero aquí está el resumen:

  1. Inicia Loopback y crea un nuevo 'Dispositivo Virtual' llamado algo así como Transcripción.
  2. Añade tu aplicación de reproducción como fuente (por ejemplo, Quicktime, Música, Podcasts, lo que sea).
  3. En el panel de Preferencias del Sistema de Teclado, en Dictado, seleccione su nuevo dispositivo virtual de Transcripción bajo el micrófono como fuente de audio.
  4. Abre una aplicación que admita el dictado, como TextEdit.
  5. Iniciar la reproducción de audio desde la aplicación de reproducción
  6. En TextEdit, haga clic en Edición > Iniciar dictado...

Acabo de probarlo en MacOS Monterey y parece que funciona bastante bien para mis archivos de palabra hablada.

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X