Как получить ответ на асинхронный запрос API речи Google?

Я пытаюсь заставить работать асинхронный запрос google-speech-api. В соответствии с советом я использую команду play:

play audio2min.flac

введите здесь описание изображения

Используя код отсюда: https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/api-client. Затем я адаптирую запрос с соответствующей кодировкой.

Затем я получаю сообщение об ошибке:

"Audio 'content' cannot be longer than 1 min.
For long audio, use the 'uri' parameter to specify a file."

Затем я помещаю свой файл в хранилище Google и адаптирую свой запрос с помощью "uri": "gs://path/to/my/audio2min.flac".

Но затем я получаю сообщение об ошибке:

For audio inputs longer than 1 min, please use LINEAR16 encoding.

Проблема в том, что когда я меняю кодировку для LINEAR16 вместо FLAC, я получаю пустой ответ.

Чтобы убедиться, что кодировка действительно была проблемой, я попробовал 30-секундный образец из моего файла с синхронными запросами. Он работал с кодировкой FLAC, но не с кодировкой LINEAR16.

Может ли кто-нибудь объяснить мне, как что мне делать отсюда?


person Albyorix    schedule 13.11.2016    source источник


Ответы (1)


Наконец-то мне удалось заставить его работать, изменив кодировку моего файла.

  1. Скачать audacity: http://www.audacityteam.org/

  2. Откройте файл

  3. В Файл -> Экспорт аудио -> Выберите:

other uncompressed files

Заголовок : RAW

Кодировка: 16-bit PCM

введите здесь описание изображения

Теперь это должно работать

person Albyorix    schedule 13.11.2016