4 votos

¿Qué es el ratio de morosidad habla para el programa de síntesis de discurso?

Yo he estado buscando por todo internet, pero parece que no puedo averiguar el valor por defecto hablando de tasa para el programa de síntesis de discurso integrado en Mac OS.

say "What to say" -r <rate>

¿Como se muestra arriba hay una forma para especificar el tipo de discurso (wpm) pero no hay nada que especifica el ratio de morosidad?

¿Alguien tiene una idea de lo que es?

4voto

Fuzzy Purple Monkey Puntos 702

El defecto de hablar de las tasas en realidad puede ser cambiado desde Preferencias del Sistema:

El regulador puede ser ajustado a una posición diferente para diferentes voces. Cuando traté de arrastrar los controles deslizantes para Alex y Mikko a la mitad, la WPMs se muestra en la salida por debajo de 175 y 180.

$ defaults read com.apple.speech.voice.prefs VoiceRateDataArray
(
        (
        1835364215,
        201,
        175
    ),
        (
        1919902066,
        546,
        180
    )
)

Las salidas de say -r 175 y say sin -r opción eran idénticos para Agnes, Alex, y Bruce, y casi idénticas para algunas otras voces. Pero, por ejemplo, el valor predeterminado tasa de hablar de la "Bahh" la voz es mucho más lento.

$ say -v ? | sed 's/  .*//' | while read l; do say -v "$l" -r 175 {1..9} -o "$l 1.aif"; say -v "$l" {1..9} -o "$l 2.aif"; done
$ stat -f '%z %N' *
120136 Agnes 1.aif
120136 Agnes 2.aif
131692 Albert 1.aif
180260 Albert 2.aif
122968 Alex 1.aif
122968 Alex 2.aif
231596 Bad News 1.aif
231820 Bad News 2.aif
131692 Bahh 1.aif
180264 Bahh 2.aif
318508 Bells 1.aif
318488 Bells 2.aif
131692 Boing 1.aif
164368 Boing 2.aif
116514 Bruce 1.aif
116514 Bruce 2.aif
131692 Bubbles 1.aif
138860 Bubbles 2.aif
196652 Cellos 1.aif
197088 Cellos 2.aif
131692 Deranged 1.aif
150720 Deranged 2.aif
131692 Fred 1.aif
138860 Fred 2.aif
331052 Good News 1.aif
331492 Good News 2.aif
301932 Hysterical 1.aif
301916 Hysterical 2.aif
131692 Junior 1.aif
144676 Junior 2.aif
131692 Kathy 1.aif
144676 Kathy 2.aif
118196 Kyoko 1.aif
114440 Kyoko 2.aif
420970 Mikko 1.aif
408432 Mikko 2.aif
228012 Pipe Organ 1.aif
228448 Pipe Organ 2.aif
131692 Princess 1.aif
144676 Princess 2.aif
131692 Ralph 1.aif
144676 Ralph 2.aif
128810 Sin-Ji 1.aif
124834 Sin-Ji 2.aif
131692 Trinoids 1.aif
138860 Trinoids 2.aif
119410 Vicki 1.aif
116118 Vicki 2.aif
122742 Victoria 1.aif
119444 Victoria 2.aif
131692 Whisper 1.aif
150724 Whisper 2.aif
131692 Zarvox 1.aif
138860 Zarvox 2.aif

0voto

Layla Puntos 880

No una "buena" manera de hacerlo, pero se pueden hacer algunas muestras, tal vez comenzando en 120 palabras por minuto, y compararlos con un control de la grabación del "default" de la velocidad (por supuesto, con todas las grabaciones con la misma voz y de texto). Para más precisión, puede cargar los archivos en cualquier básicas de edición de audio de la aplicación y ver las formas de onda que realmente se compara la velocidad de una grabación y otra. No puedo imaginar que sería demasiado largo para reducirla. Me gustaría hacerlo yo mismo si tuviera el tiempo ahora mismo.

Alternativamente, usted puede obtener algunos ejemplos de texto de longitudes conocidas (digamos 100 palabras, de 200 palabras, etc.), grabar la voz a todos ellos a la configuración predeterminada, a continuación, utilizar las duraciones para calcular el promedio de wmp de todas las grabaciones. Con muestras suficientes, estoy seguro que estarás cerca de conseguirlo.

EDIT: Tras el primer procedimiento que he descrito anteriormente, he encontrado el defecto de la tasa de hablar de Alex (la voz predeterminada) para ser exactamente 175 ppm.

En predeterminado y 175 ppm velocidades, las dos formas de onda coinciden perfectamente.

0voto

Mario Delgado Puntos 28

720 parece max para la voz que estoy usando

AppleAyuda.com

AppleAyuda es una comunidad de usuarios de los productos de Apple en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X