¿Qué es el ratio de morosidad habla para el programa de síntesis de discurso?

Question

¿Qué es el ratio de morosidad habla para el programa de síntesis de discurso?

Preguntado el 20 de Julio, 2013: Cuando se hizo la pregunta
1019 visitas: Cuantas visitas ha tenido la pregunta
3 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Yo he estado buscando por todo internet, pero parece que no puedo averiguar el valor por defecto hablando de tasa para el programa de síntesis de discurso integrado en Mac OS.

say "What to say" -r <rate>

¿Como se muestra arriba hay una forma para especificar el tipo de discurso (wpm) pero no hay nada que especifica el ratio de morosidad?

¿Alguien tiene una idea de lo que es?

Preguntado el 20 de Julio, 2013 por Gil

Answer 1

3 Respuestas

Answer 2

4voto

Fuzzy Purple Monkey Puntos 702

El defecto de hablar de las tasas en realidad puede ser cambiado desde Preferencias del Sistema:

El regulador puede ser ajustado a una posición diferente para diferentes voces. Cuando traté de arrastrar los controles deslizantes para Alex y Mikko a la mitad, la WPMs se muestra en la salida por debajo de 175 y 180.

$ defaults read com.apple.speech.voice.prefs VoiceRateDataArray
(
        (
        1835364215,
        201,
        175
    ),
        (
        1919902066,
        546,
        180
    )
)

Las salidas de say -r 175 y say sin -r opción eran idénticos para Agnes, Alex, y Bruce, y casi idénticas para algunas otras voces. Pero, por ejemplo, el valor predeterminado tasa de hablar de la "Bahh" la voz es mucho más lento.

$ say -v ? | sed 's/  .*//' | while read l; do say -v "$l" -r 175 {1..9} -o "$l 1.aif"; say -v "$l" {1..9} -o "$l 2.aif"; done
$ stat -f '%z %N' *
120136 Agnes 1.aif
120136 Agnes 2.aif
131692 Albert 1.aif
180260 Albert 2.aif
122968 Alex 1.aif
122968 Alex 2.aif
231596 Bad News 1.aif
231820 Bad News 2.aif
131692 Bahh 1.aif
180264 Bahh 2.aif
318508 Bells 1.aif
318488 Bells 2.aif
131692 Boing 1.aif
164368 Boing 2.aif
116514 Bruce 1.aif
116514 Bruce 2.aif
131692 Bubbles 1.aif
138860 Bubbles 2.aif
196652 Cellos 1.aif
197088 Cellos 2.aif
131692 Deranged 1.aif
150720 Deranged 2.aif
131692 Fred 1.aif
138860 Fred 2.aif
331052 Good News 1.aif
331492 Good News 2.aif
301932 Hysterical 1.aif
301916 Hysterical 2.aif
131692 Junior 1.aif
144676 Junior 2.aif
131692 Kathy 1.aif
144676 Kathy 2.aif
118196 Kyoko 1.aif
114440 Kyoko 2.aif
420970 Mikko 1.aif
408432 Mikko 2.aif
228012 Pipe Organ 1.aif
228448 Pipe Organ 2.aif
131692 Princess 1.aif
144676 Princess 2.aif
131692 Ralph 1.aif
144676 Ralph 2.aif
128810 Sin-Ji 1.aif
124834 Sin-Ji 2.aif
131692 Trinoids 1.aif
138860 Trinoids 2.aif
119410 Vicki 1.aif
116118 Vicki 2.aif
122742 Victoria 1.aif
119444 Victoria 2.aif
131692 Whisper 1.aif
150724 Whisper 2.aif
131692 Zarvox 1.aif
138860 Zarvox 2.aif

Respondido el 20 de Julio, 2013 por Fuzzy Purple Monkey (702 Puntos )

Answer 3

0voto

Layla Puntos 880

No una "buena" manera de hacerlo, pero se pueden hacer algunas muestras, tal vez comenzando en 120 palabras por minuto, y compararlos con un control de la grabación del "default" de la velocidad (por supuesto, con todas las grabaciones con la misma voz y de texto). Para más precisión, puede cargar los archivos en cualquier básicas de edición de audio de la aplicación y ver las formas de onda que realmente se compara la velocidad de una grabación y otra. No puedo imaginar que sería demasiado largo para reducirla. Me gustaría hacerlo yo mismo si tuviera el tiempo ahora mismo.

Alternativamente, usted puede obtener algunos ejemplos de texto de longitudes conocidas (digamos 100 palabras, de 200 palabras, etc.), grabar la voz a todos ellos a la configuración predeterminada, a continuación, utilizar las duraciones para calcular el promedio de wmp de todas las grabaciones. Con muestras suficientes, estoy seguro que estarás cerca de conseguirlo.

EDIT: Tras el primer procedimiento que he descrito anteriormente, he encontrado el defecto de la tasa de hablar de Alex (la voz predeterminada) para ser exactamente 175 ppm.

En predeterminado y 175 ppm velocidades, las dos formas de onda coinciden perfectamente.

Respondido el 20 de Julio, 2013 por Layla (880 Puntos )

Answer 4

0voto

Mario Delgado Puntos 28

720 parece max para la voz que estoy usando

Respondido el 7 de Septiembre, 2015 por Mario Delgado (28 Puntos )

¿Qué es el ratio de morosidad habla para el programa de síntesis de discurso?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

AppleAyuda.com

Powered by:

¿Qué es el ratio de morosidad habla para el programa de síntesis de discurso?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

AppleAyuda.com

Powered by: