Я уже использую HTK (набор инструментов скрытой марковской модели) для распознавания определенных команд, используемых для управления моим приложением Android, но в этом случае мне нужно передать некоторые голосовые данные на сервер, и это может занять больше времени.
Чтобы предотвратить эту задержку, я думаю об использовании pocketsphinx для локального распознавания голосовых данных с помощью Android. приложение, чтобы мне не нужно было передавать этот звук на сервер.
Если это хорошая идея, легко ли выучить pocketsphinx с нуля? Кроме того, каковы преимущества и недостатки обоих методов (серверного и локального распознавания голоса) и какой из них лучше?