Коэффициенты ошибок Word для Google Cloud Speech API по сравнению с Web Speech API

В настоящее время я использую W3C Web Speech API для испанского и Мандарин. В целом распознавание нормальное, но есть много ошибок (особенно с отдельными словами), а иногда в транскрибированных испанских словах произвольно добавляются акценты, например, lo siento ==> lo síento.

Я думаю о переходе на более надежный и точный API и обнаружил Google Speech API. Хотя Web Speech API бесплатный, я бы предпочел платить деньги за точность (меньшее количество ошибок). В общем, я не нуждаюсь в транскрибировании длинных аудиофайлов (предложения из 6-8 слов, обычно максимум, но чаще всего предложения из 1-4 слов) и намереваюсь выполнять эти вызовы из браузера.

Я не могу найти документацию по производительности этих двух API, поэтому любая помощь в принятии решения о переключении будет полезна.

javascript speech-recognition webspeech-api

Growler 10.09.2019 источник

Ответы (1)

arrow_upward
1
arrow_downward

API Google Speech также не идеален, вы можете получить максимальную точность от специализированного решения.

Вызов напрямую из браузера на самом деле не вариант для Google Speech API, поскольку вам нужно предоставить свой ключ API в браузере, что является плохой идеей, вам все равно придется поддерживать инфраструктуру сервера.

Nikolay Shmyrev 11.09.2019

comment

Является ли веб-интерфейс API лучшим вариантом для распознавания речи на иностранном языке в браузере? - Growler; 11.09.2019

comment

Если вы не хотите иметь сервер, то да. Это во многом зависит от деталей приложения. - Nikolay Shmyrev; 11.09.2019

comment

Что ж, у меня уже есть PHP API, поэтому, если Google Cloud Speech API лучше распознает, чем Web Speech API, я сделаю переключение - Growler; 11.09.2019

Коэффициенты ошибок Word для Google Cloud Speech API по сравнению с Web Speech API

Ответы (1)

Вопросы по теме