Как я могу использовать Google Speech API с потоковой передачей из веб-приложения?

В настоящее время я пытаюсь использовать Google Speech API для транскрипции живой речи в текст в веб-приложении. Для этого я должен использовать потоковое распознавание RPC (веб-сокеты). Я знаю, что существует несколько клиентских библиотек, но ни одна из них не дает возможности передавать аудио прямо из веб-приложения в Google Speech API. Нет простых библиотек javascript.

Я также знаю, что, вероятно, это можно сделать, настроив соединение через веб-сокет между интерфейсом и сервером, а затем, в моем случае, используя клиентскую библиотеку NodeJS для потоковой передачи в Google Speech API. Тем не менее, это кажется ненужным сложным.

Неужели нет поддерживаемого способа использования потокового распознавания непосредственно из веб-приложения?

Кто-нибудь знает, как это можно сделать?

EDIT Я так и не отправил поток в службу, что является основой моего вопроса. Позвольте мне перефразировать мой вопрос: есть ли способ отправить аудиопоток в Google Speech API прямо из браузера/микрофона? Мое приложение создано на JavaScript (Angular).

Раньше я использовал IBM Watson S2T, и они предоставляют JavaScript SDK, доступный через Bower. который может транслировать звук с микрофона непосредственно в сервис, не пропуская его через серверный уровень.

С уважением,

Кьетил

google-cloud-platform javascript google-speech-api

kaamodt 01.11.2017 источник

comment

Какие проблемы возникают у вас при потоковой передаче аудиоданных в API? Как API ожидает потоковой передачи данных? ArrayBuffer, FormData или File объектное представление аудиофайла? Активный MediaStreamTrack? - guest271314 02.11.2017

comment

См. Как я могу извлечь предыдущий звук (с микрофона) в качестве буфера при обнаружении тишины (JS)? - guest271314 02.11.2017

comment

Спасибо за ваш ответ! Я отредактировал свой первоначальный вопрос, чтобы лучше отразить то, что я на самом деле ищу. - kaamodt 02.11.2017

comment

Вы так и не ответили на вопросы в предыдущем комментарии - guest271314 02.11.2017

comment

Я спрашиваю, как использовать RPC API для StreamingRecognize. Похоже, что запрос определен здесь. Тем не менее, я надеялся, что существует существующая оболочка/библиотека (для Angular), благодаря которой мне не нужно самостоятельно реализовывать этот код интеграции. Я не уверен, что это отвечает на ваш вопрос, но это лучшее, что я могу сделать :( - kaamodt 02.11.2017

comment

Вы можете отправить аудиоданные в формате ArrayBuffer. Не пробовали Angular и не знаете, как Angular связан с Question? - guest271314 02.11.2017

comment

Я тоже не считаю, что это актуально, но конкретизировать не помешает :) Итак, по сути, вы говорите, что я должен сам создать код интеграции. Не существует существующей библиотеки или аналогичной, которая бы обертывала этот код и упрощала бы раскрытие методов. Если это правда: это URI для вызова RPC Google Speech API для StreamingRecognize? - kaamodt 02.11.2017

comment

В чем именно проблема? - guest271314 02.11.2017

comment

Давайте продолжим обсуждение в чате. - kaamodt 02.11.2017

Как я могу использовать Google Speech API с потоковой передачей из веб-приложения?

Вопросы по теме