В настоящее время я пытаюсь использовать Google Speech API для транскрипции живой речи в текст в веб-приложении. Для этого я должен использовать потоковое распознавание RPC (веб-сокеты). Я знаю, что существует несколько клиентских библиотек, но ни одна из них не дает возможности передавать аудио прямо из веб-приложения в Google Speech API. Нет простых библиотек javascript.
Я также знаю, что, вероятно, это можно сделать, настроив соединение через веб-сокет между интерфейсом и сервером, а затем, в моем случае, используя клиентскую библиотеку NodeJS для потоковой передачи в Google Speech API. Тем не менее, это кажется ненужным сложным.
Неужели нет поддерживаемого способа использования потокового распознавания непосредственно из веб-приложения?
Кто-нибудь знает, как это можно сделать?
EDIT Я так и не отправил поток в службу, что является основой моего вопроса. Позвольте мне перефразировать мой вопрос: есть ли способ отправить аудиопоток в Google Speech API прямо из браузера/микрофона? Мое приложение создано на JavaScript (Angular).
Раньше я использовал IBM Watson S2T, и они предоставляют JavaScript SDK, доступный через Bower. который может транслировать звук с микрофона непосредственно в сервис, не пропуская его через серверный уровень.
С уважением,
Кьетил
ArrayBuffer
,FormData
илиFile
объектное представление аудиофайла? АктивныйMediaStreamTrack
? - person guest271314   schedule 02.11.2017ArrayBuffer
. Не пробовали Angular и не знаете, как Angular связан с Question? - person guest271314   schedule 02.11.2017