Вопросы по теме 'cmusphinx'
У кого-нибудь есть опыт работы с распознаванием речи Sphinx?
Кто-нибудь использовал стек распознавания речи Sphinx для создания приложений IVR? Я ищу альтернативы с открытым исходным кодом дорогому и несколько ограничивающему выбору от MSFT и других. Мне не удалось найти комплексный пакет, объединяющий...
4171 просмотров
schedule
07.10.2022
Распознавание речи с использованием CMU Shinx, JSAPI и Google Speech API
Распознавание речи — одна из многих возможностей моего текущего проекта, который, скорее всего, будет разрабатываться в J2EE (другие языки также приветствуются, если их выбор оправдан).
Большинство ссылок на google и SO предлагают...
2128 просмотров
schedule
24.11.2022
Как использовать CMU Sphinx 4 для преобразования речи в текст с английскими моделями voxforge
Я пытаюсь понять, как использовать sphinx4 или pocketsphinx с английской моделью voxforge, но не могу заставить ее работать. Я пробовал читать страницы документов (например, этот...
27488 просмотров
schedule
04.04.2022
Не удается запустить программу CMUSphinx
Я установил CMUSphinx с помощью этого блога ( здесь ). Я сделал все шаги правильно. Но когда я запустил пример программы из того же блога ( эта программа ). Он показывает мне следующую ошибку
--------- ОШИБКА: ---------- Невозможно создать...
626 просмотров
schedule
23.07.2022
Ошибка при компиляции sphinxbase в cygwin
Я попытался установить sphinxbase на свою Windows 7, используя Cygwin для запуска демо-версии pocketsphinx для Android. Но я получил следующую ошибку после выполнения make:
gcc -shared -Wl,--enable-auto-image-base...
2012 просмотров
schedule
26.05.2022
Извлечение фонем с помощью pocketsphinx
Можно ли с помощью pocketsphinx извлекать фонемы произнесенного слова?
775 просмотров
schedule
22.12.2022
Как преобразовать простое слово в Sphinx4 WSJ, например, словарное произношение?
Я только что перешел к этому распознаванию речи Sphinx4, я реализовал его с демонстрацией helloworld sphinx4, теперь мне нужно создать динамический словарь для текстового файла, заданного в качестве входных данных. Прямо сейчас мне нужно просто...
799 просмотров
schedule
06.11.2022
Фиксированный, небольшой словарный запас, независимое от языка распознавание речи (или команд)
Ищем любой механизм распознавания с низкой вычислительной сложностью (и, надеюсь, FOSS), который хорошо работает для:
фиксированный набор / малый словарный запас (до 100 фраз)
независимый от языка
прерывистая речь/команды
Хорошо, если...
372 просмотров
schedule
17.12.2022
Преобразование аудиофайлов для ввода CMU Sphinx 4
У меня есть большая партия файлов, которые я хотел бы запустить для распознавания с помощью CMU Sphinx 4. Для Sphinx требуется следующий формат:
16 кГц
16 бит
мононуклеоз
прямой порядок байтов
Мои файлы - это что-то вроде 44100 кГц,...
10434 просмотров
schedule
29.08.2022
Как вы извлекаете теги из грамматик JSGF с помощью sphinx?
Я написал приложение на Java, которое использует API CloudGarden для анализа грамматик JSAPI, возврата тегов из правил грамматики и последующей обработки этих тегов соответствующим образом. Проблема с API CloudGarden заключается в его зависимости от...
1630 просмотров
schedule
01.05.2023
CMU Sphinx для распознавания голоса / динамика
Я ищу способ сопоставить известный набор данных, скажем, список файлов MP3 или WAV, каждый из которых является образцом чьей-то речи. На данный момент я знаю, что файл ABC говорит о человеке X.
Затем я хотел бы взять еще один образец и выполнить...
2830 просмотров
schedule
31.05.2023
Автономное распознавание голоса на Android
Я уже использую HTK (набор инструментов скрытой марковской модели) для распознавания определенных команд, используемых для управления моим приложением Android, но в этом случае мне нужно передать некоторые голосовые данные на сервер, и это может...
1448 просмотров
schedule
23.04.2023
микрофон не запускается после одной итерации в sphinx
Я использую библиотеку CMU sphinx, но после успешного запуска одной итерации появляется эта ошибка «Не удается открыть линию микрофона с форматом PCM_SIGNED 16000,0 Гц, 16 бит, моно, 2 байта/кадр, обратный порядок байтов не поддерживается». Не...
1203 просмотров
schedule
26.06.2022
Как использовать CMU Sphinx для принудительного распознавания фонем?
Я работаю над простым TTS-движком. Было бы хорошо иметь автоматическую систему сегментации дифонов, которая берет звук записывающего устройства и индекс фонемы (для одиночного высказывания) и устанавливает границы фонемы в звуке. Можно ли это...
4052 просмотров
schedule
21.05.2022
Получение следующей ошибки в Sphinx 4.0: свойство «helloLinguist»: «грамматика» — обязательное свойство не установлено
Я использую распознаватель sphinx 4.0. Пока я запускаю свое приложение для замены двух статически определенных грамматик во время выполнения, я получаю сообщение об ошибке в eclipse как «свойство «helloLinguist»: «grammar» — обязательное свойство не...
94 просмотров
schedule
06.07.2023
Внедрение демонстрации CMU pocketsphinx для Android в Android NDK с помощью SWIG и JNI
Я столкнулся с проблемой при реализации демо-версии android распознавания cmu pocketsphinx в android NDK.
Ошибка
Импортное образование. кму. карманный сфинкс. Конфигурация не может быть разрешена Импорт edu. кму. карманный сфинкс. Декодер...
826 просмотров
schedule
02.07.2022
Преобразование речи в текст в Android без интернета и сервера Google
У меня есть список английских слов. Я хочу искать с голосом. Когда я говорю слово отображать список слов. Я прочитал Android: распознавание речи без использования сервера Google . И я попробовал несколько примеров.
package...
12109 просмотров
schedule
06.11.2023
Как отключить E_INFO в pocketsphinx?
E_INFO печатает кучу журналов. Я не знаю, как я могу отключить это. Я искал E_INFO во всех исходных файлах в pocket/base sphinx, но не смог найти, где он устанавливает флаг.
4736 просмотров
schedule
11.08.2022
Состояние гонки Pocketsphinx + Gstreamer? Pocketsphinx не может слушать аудио + запись с него одновременно в скрипте Python?
Обзор: Итак, это продолжение моей последней проблемы ( здесь ). Я опубликую полный ответ на это очень скоро. Я могу заставить pocketsphinx распознавать аудиовход с моего PS3 Eye в Python через Gstreamer. Указав правильное устройство alsa (hw:1 в...
1319 просмотров
schedule
20.06.2022
Конвейер gstreamer с элементом VADER останавливается на PAUSE при использовании с тройником
У меня есть этот конвейер, который использует элемент VAD pocketsphinx:
Gst.parse_launch(
"pulsesrc device=\"alsa_input.usb-046d_08c9_674634A4-02-U0x46d0x8c9.analog-mono\" " +
"! vader name=vad...
628 просмотров
schedule
18.01.2023