Как я могу использовать Google Speech API с потоковой передачей из веб-приложения?

В настоящее время я пытаюсь использовать Google Speech API для транскрипции живой речи в текст в веб-приложении. Для этого я должен использовать потоковое распознавание RPC (веб-сокеты). Я знаю, что существует несколько клиентских библиотек, но ни одна из них не дает возможности передавать аудио прямо из веб-приложения в Google Speech API. Нет простых библиотек javascript.

Я также знаю, что, вероятно, это можно сделать, настроив соединение через веб-сокет между интерфейсом и сервером, а затем, в моем случае, используя клиентскую библиотеку NodeJS для потоковой передачи в Google Speech API. Тем не менее, это кажется ненужным сложным.

Неужели нет поддерживаемого способа использования потокового распознавания непосредственно из веб-приложения?

Кто-нибудь знает, как это можно сделать?

EDIT Я так и не отправил поток в службу, что является основой моего вопроса. Позвольте мне перефразировать мой вопрос: есть ли способ отправить аудиопоток в Google Speech API прямо из браузера/микрофона? Мое приложение создано на JavaScript (Angular).

Раньше я использовал IBM Watson S2T, и они предоставляют JavaScript SDK, доступный через Bower. который может транслировать звук с микрофона непосредственно в сервис, не пропуская его через серверный уровень.

С уважением,

Кьетил


person kaamodt    schedule 01.11.2017    source источник
comment
Какие проблемы возникают у вас при потоковой передаче аудиоданных в API? Как API ожидает потоковой передачи данных? ArrayBuffer, FormData или File объектное представление аудиофайла? Активный MediaStreamTrack?   -  person guest271314    schedule 02.11.2017
comment
Спасибо за ваш ответ! Я отредактировал свой первоначальный вопрос, чтобы лучше отразить то, что я на самом деле ищу.   -  person kaamodt    schedule 02.11.2017
comment
Вы так и не ответили на вопросы в предыдущем комментарии   -  person guest271314    schedule 02.11.2017
comment
Я спрашиваю, как использовать RPC API для StreamingRecognize. Похоже, что запрос определен здесь. Тем не менее, я надеялся, что существует существующая оболочка/библиотека (для Angular), благодаря которой мне не нужно самостоятельно реализовывать этот код интеграции. Я не уверен, что это отвечает на ваш вопрос, но это лучшее, что я могу сделать :(   -  person kaamodt    schedule 02.11.2017
comment
Вы можете отправить аудиоданные в формате ArrayBuffer. Не пробовали Angular и не знаете, как Angular связан с Question?   -  person guest271314    schedule 02.11.2017
comment
Я тоже не считаю, что это актуально, но конкретизировать не помешает :) Итак, по сути, вы говорите, что я должен сам создать код интеграции. Не существует существующей библиотеки или аналогичной, которая бы обертывала этот код и упрощала бы раскрытие методов. Если это правда: это URI для вызова RPC Google Speech API для StreamingRecognize?   -  person kaamodt    schedule 02.11.2017
comment
В чем именно проблема?   -  person guest271314    schedule 02.11.2017
comment
Давайте продолжим обсуждение в чате.   -  person kaamodt    schedule 02.11.2017