Как использовать голосовой элемент с разными голосами в ssml?

Я пытаюсь создать аудиофайл с помощью API преобразования текста в речь Google. Поскольку мне нужны разные голоса в моих диалогах, я пытаюсь использовать голосовой элемент ssml:

<speak>
<voice languages="en-US" gender="female" name="en-US-Wavenet-F">Have you got a girlfriend?</voice>
<voice languages="en-GB" gender="male" name="en-GB-Wavenet-B">Yes, I have.</voice>
</speak>

Но это не работает, и будет распознан только атрибут пола - но только с голосом по умолчанию, а не с выбранным голосом Wavenet.

Мой вопрос - есть ли способ использовать разные голоса Wavenet в одном файле ssml или я могу определить голос только глобально для всего файла?


person Babelfish    schedule 02.05.2019    source источник


Ответы (2)


Я столкнулся с тем же вопросом, и, к сожалению, согласно документация, элемент voice в настоящее время не поддерживается:

Обратите внимание, что не все элементы и параметры, описанные в спецификации W3 SSML, в настоящее время поддерживаются Cloud Text-to-Speech. На этой странице подробно описаны элементы и параметры, доступные для вашего приложения. Ссылки на W3, приведенные ниже, могут быть полезны для дополнительного контекста и примеров.

Думаю, лучше всего создать несколько файлов, а затем объединить их, по крайней мере, это то, что я собираюсь сделать.

person jfix    schedule 04.10.2019

Интересно, что вы не можете изменить пол голоса с помощью тега в Cloud Text To Speech, протестировано с эмулятором «Преобразуйте текст в речь прямо сейчас» здесь, но с TTS emulator в Google Actions, вы можете это сделать, но обе ссылки для SSML одинаковы 1, 2.

Я создал запрос функции, чтобы иметь "голосовые параметры" в общедоступном трекере проблем, вы можете пометить его по порядку чтобы получать уведомления об обновлениях. Пожалуйста, имейте в виду, что у нас нет ETA для этого.

person Jaroslav    schedule 23.10.2019