Инструмент HTK и частота дискретизации

Здравствуйте, ребята. ~~(Можно ли начинать это предложение?)~~

Я попытался с помощью инструмента HTK смоделировать распознавание голоса (слова).
И у меня есть файлы *.wav.
Некоторые файлы имеют частоту дискретизации 16 кГц, некоторые файлы имеют частоту дискретизации 44,1 кГц.

И я делаю файл mfcc для каждой частоты дискретизации.
Но я делаю модель HMM, используя все (16 кГц и 44,1 кГц) файлы mfcc.

voice_16KHz.wav -> voice_1.mfcc
voice_44.1KHz.wav -> voice_2.mfcc
make hmm_model using voice_1.mfcc and voice_2.mfcc

Можно ли делать модели HMM со смешением разных частот дискретизации?

Я должен знать, конечно, информацию, а не предложение.

Спасибо за прочтение.

mfcc htk

Won Hyoung Lee 02.06.2016 источник

Ответы (1)

arrow_upward
1
arrow_downward

Я предлагаю вам выбрать только одну частоту дискретизации. Это будет работать, но точность изменится, а также вам необходимо изменить детали конфигурации в конфигурационном файле MFCC. Понизить файлы 44,1 кГц до 16 кГц очень просто.

Nilkanth Shirodkar 05.08.2016

Инструмент HTK и частота дискретизации

Ответы (1)

Вопросы по теме