Звук Google Speech API слишком медленный в потоковом режиме

Я пытаюсь передать свои аудиоданные UDP в Google Speech API, и это работает очень хорошо. Однако у меня возникла проблема:

Когда я начинаю распознавать, я жду пакетов, и поэтому никакие данные не передаются в Google Speech API. Когда приходят пакеты, я начинаю отправлять их в API, а он возвращает ошибку: Аудиоданные передаются слишком медленно. Пожалуйста, транслируйте аудиоданные примерно в реальном времени. Итак, проблема в том, что когда после установления соединения с Google Speech API происходит задержка и перед началом отправки данных не отправляется никаких данных, это всегда приводит к такому поведению.

Это предполагаемое поведение или какой-то обходной путь?

С уважением, Артемий


person Artemiy Firsov    schedule 03.04.2017    source источник


Ответы (1)


Мы видели эту ошибку, когда наше приложение слишком медленно передавало звук на платформу Google Speech или когда между двумя последовательными операциями записи была чрезмерная задержка:

  • Вы должны быть готовы начать потоковую передачу аудио (запись аудиофрагментов) на платформу Google Speech, как только отправите начальное распознавание.
  • Ваше приложение должно продолжать подавать звук на платформу Google Speech со стабильной скоростью (например, при работе со звуком 8 кГц x 8 бит вы должны предоставлять примерно 8 КБ звука каждую секунду, например, с последовательной записью 4 КБ с задержкой около 0,5 с). )
person Alberto Navatta    schedule 06.07.2017