Автономное распознавание голоса на Android

Я уже использую HTK (набор инструментов скрытой марковской модели) для распознавания определенных команд, используемых для управления моим приложением Android, но в этом случае мне нужно передать некоторые голосовые данные на сервер, и это может занять больше времени.

Чтобы предотвратить эту задержку, я думаю об использовании pocketsphinx для локального распознавания голосовых данных с помощью Android. приложение, чтобы мне не нужно было передавать этот звук на сервер.

Если это хорошая идея, легко ли выучить pocketsphinx с нуля? Кроме того, каковы преимущества и недостатки обоих методов (серверного и локального распознавания голоса) и какой из них лучше?


person Mohamed Abas Tabousha    schedule 10.03.2013    source источник
comment
Не могли бы вы уточнить вопрос и немного отформатировать его для удобства чтения?   -  person fredrik    schedule 10.03.2013
comment
Теперь он должен выглядеть лучше.   -  person Philip Conrad    schedule 31.08.2013


Ответы (1)


CMUSphinx, безусловно, отличная идея, у него есть ряд преимуществ перед HTK:

  • Лучшая лицензия
  • Работает в автономном режиме на Android
  • Быстрый
  • Поддерживает несколько языков из коробки
  • Легче использовать и учиться

Вам определенно стоит попробовать Pocketsphinx, для получения дополнительной информации см.

http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/

person Nikolay Shmyrev    schedule 11.03.2013