Коэффициенты ошибок Word для Google Cloud Speech API по сравнению с Web Speech API

В настоящее время я использую W3C Web Speech API для испанского и Мандарин. В целом распознавание нормальное, но есть много ошибок (особенно с отдельными словами), а иногда в транскрибированных испанских словах произвольно добавляются акценты, например, lo siento ==> lo síento.

Я думаю о переходе на более надежный и точный API и обнаружил Google Speech API. Хотя Web Speech API бесплатный, я бы предпочел платить деньги за точность (меньшее количество ошибок). В общем, я не нуждаюсь в транскрибировании длинных аудиофайлов (предложения из 6-8 слов, обычно максимум, но чаще всего предложения из 1-4 слов) и намереваюсь выполнять эти вызовы из браузера.

Я не могу найти документацию по производительности этих двух API, поэтому любая помощь в принятии решения о переключении будет полезна.


person Growler    schedule 10.09.2019    source источник


Ответы (1)


API Google Speech также не идеален, вы можете получить максимальную точность от специализированного решения.

Вызов напрямую из браузера на самом деле не вариант для Google Speech API, поскольку вам нужно предоставить свой ключ API в браузере, что является плохой идеей, вам все равно придется поддерживать инфраструктуру сервера.

person Nikolay Shmyrev    schedule 11.09.2019
comment
Является ли веб-интерфейс API лучшим вариантом для распознавания речи на иностранном языке в браузере? - person Growler; 11.09.2019
comment
Если вы не хотите иметь сервер, то да. Это во многом зависит от деталей приложения. - person Nikolay Shmyrev; 11.09.2019
comment
Что ж, у меня уже есть PHP API, поэтому, если Google Cloud Speech API лучше распознает, чем Web Speech API, я сделаю переключение - person Growler; 11.09.2019