Вопросы по теме 'cmusphinx'

У кого-нибудь есть опыт работы с распознаванием речи Sphinx?
Кто-нибудь использовал стек распознавания речи Sphinx для создания приложений IVR? Я ищу альтернативы с открытым исходным кодом дорогому и несколько ограничивающему выбору от MSFT и других. Мне не удалось найти комплексный пакет, объединяющий...
4171 просмотров
schedule 07.10.2022

Распознавание речи с использованием CMU Shinx, JSAPI и Google Speech API
Распознавание речи — одна из многих возможностей моего текущего проекта, который, скорее всего, будет разрабатываться в J2EE (другие языки также приветствуются, если их выбор оправдан). Большинство ссылок на google и SO предлагают...
2128 просмотров

Как использовать CMU Sphinx 4 для преобразования речи в текст с английскими моделями voxforge
Я пытаюсь понять, как использовать sphinx4 или pocketsphinx с английской моделью voxforge, но не могу заставить ее работать. Я пробовал читать страницы документов (например, этот...
27488 просмотров
schedule 04.04.2022

Не удается запустить программу CMUSphinx
Я установил CMUSphinx с помощью этого блога ( здесь ). Я сделал все шаги правильно. Но когда я запустил пример программы из того же блога ( эта программа ). Он показывает мне следующую ошибку --------- ОШИБКА: ---------- Невозможно создать...
626 просмотров
schedule 23.07.2022

Ошибка при компиляции sphinxbase в cygwin
Я попытался установить sphinxbase на свою Windows 7, используя Cygwin для запуска демо-версии pocketsphinx для Android. Но я получил следующую ошибку после выполнения make: gcc -shared -Wl,--enable-auto-image-base...
2012 просмотров
schedule 26.05.2022

Извлечение фонем с помощью pocketsphinx
Можно ли с помощью pocketsphinx извлекать фонемы произнесенного слова?
775 просмотров
schedule 22.12.2022

Как преобразовать простое слово в Sphinx4 WSJ, например, словарное произношение?
Я только что перешел к этому распознаванию речи Sphinx4, я реализовал его с демонстрацией helloworld sphinx4, теперь мне нужно создать динамический словарь для текстового файла, заданного в качестве входных данных. Прямо сейчас мне нужно просто...
799 просмотров

Фиксированный, небольшой словарный запас, независимое от языка распознавание речи (или команд)
Ищем любой механизм распознавания с низкой вычислительной сложностью (и, надеюсь, FOSS), который хорошо работает для: фиксированный набор / малый словарный запас (до 100 фраз) независимый от языка прерывистая речь/команды Хорошо, если...
372 просмотров
schedule 17.12.2022

Преобразование аудиофайлов для ввода CMU Sphinx 4
У меня есть большая партия файлов, которые я хотел бы запустить для распознавания с помощью CMU Sphinx 4. Для Sphinx требуется следующий формат: 16 кГц 16 бит мононуклеоз прямой порядок байтов Мои файлы - это что-то вроде 44100 кГц,...
10434 просмотров

Как вы извлекаете теги из грамматик JSGF с помощью sphinx?
Я написал приложение на Java, которое использует API CloudGarden для анализа грамматик JSAPI, возврата тегов из правил грамматики и последующей обработки этих тегов соответствующим образом. Проблема с API CloudGarden заключается в его зависимости от...
1630 просмотров
schedule 01.05.2023

CMU Sphinx для распознавания голоса / динамика
Я ищу способ сопоставить известный набор данных, скажем, список файлов MP3 или WAV, каждый из которых является образцом чьей-то речи. На данный момент я знаю, что файл ABC говорит о человеке X. Затем я хотел бы взять еще один образец и выполнить...
2830 просмотров

Автономное распознавание голоса на Android
Я уже использую HTK (набор инструментов скрытой марковской модели) для распознавания определенных команд, используемых для управления моим приложением Android, но в этом случае мне нужно передать некоторые голосовые данные на сервер, и это может...
1448 просмотров
schedule 23.04.2023

микрофон не запускается после одной итерации в sphinx
Я использую библиотеку CMU sphinx, но после успешного запуска одной итерации появляется эта ошибка «Не удается открыть линию микрофона с форматом PCM_SIGNED 16000,0 Гц, 16 бит, моно, 2 байта/кадр, обратный порядок байтов не поддерживается». Не...
1203 просмотров
schedule 26.06.2022

Как использовать CMU Sphinx для принудительного распознавания фонем?
Я работаю над простым TTS-движком. Было бы хорошо иметь автоматическую систему сегментации дифонов, которая берет звук записывающего устройства и индекс фонемы (для одиночного высказывания) и устанавливает границы фонемы в звуке. Можно ли это...
4052 просмотров

Получение следующей ошибки в Sphinx 4.0: свойство «helloLinguist»: «грамматика» — обязательное свойство не установлено
Я использую распознаватель sphinx 4.0. Пока я запускаю свое приложение для замены двух статически определенных грамматик во время выполнения, я получаю сообщение об ошибке в eclipse как «свойство «helloLinguist»: «grammar» — обязательное свойство не...
94 просмотров
schedule 06.07.2023

Внедрение демонстрации CMU pocketsphinx для Android в Android NDK с помощью SWIG и JNI
Я столкнулся с проблемой при реализации демо-версии android распознавания cmu pocketsphinx в android NDK. Ошибка Импортное образование. кму. карманный сфинкс. Конфигурация не может быть разрешена Импорт edu. кму. карманный сфинкс. Декодер...
826 просмотров
schedule 02.07.2022

Преобразование речи в текст в Android без интернета и сервера Google
У меня есть список английских слов. Я хочу искать с голосом. Когда я говорю слово отображать список слов. Я прочитал Android: распознавание речи без использования сервера Google . И я попробовал несколько примеров. package...
12109 просмотров

Как отключить E_INFO в pocketsphinx?
E_INFO печатает кучу журналов. Я не знаю, как я могу отключить это. Я искал E_INFO во всех исходных файлах в pocket/base sphinx, но не смог найти, где он устанавливает флаг.
4736 просмотров
schedule 11.08.2022

Состояние гонки Pocketsphinx + Gstreamer? Pocketsphinx не может слушать аудио + запись с него одновременно в скрипте Python?
Обзор: Итак, это продолжение моей последней проблемы ( здесь ). Я опубликую полный ответ на это очень скоро. Я могу заставить pocketsphinx распознавать аудиовход с моего PS3 Eye в Python через Gstreamer. Указав правильное устройство alsa (hw:1 в...
1319 просмотров

Конвейер gstreamer с элементом VADER останавливается на PAUSE при использовании с тройником
У меня есть этот конвейер, который использует элемент VAD pocketsphinx: Gst.parse_launch( "pulsesrc device=\"alsa_input.usb-046d_08c9_674634A4-02-U0x46d0x8c9.analog-mono\" " + "! vader name=vad...
628 просмотров
schedule 18.01.2023