Здравствуйте, ребята. (Можно ли начинать это предложение?)
Я попытался с помощью инструмента HTK смоделировать распознавание голоса (слова).
И у меня есть файлы *.wav.
Некоторые файлы имеют частоту дискретизации 16 кГц, некоторые файлы имеют частоту дискретизации 44,1 кГц.
И я делаю файл mfcc для каждой частоты дискретизации.
Но я делаю модель HMM, используя все (16 кГц и 44,1 кГц) файлы mfcc.
voice_16KHz.wav -> voice_1.mfcc
voice_44.1KHz.wav -> voice_2.mfcc
make hmm_model using voice_1.mfcc and voice_2.mfcc
Можно ли делать модели HMM со смешением разных частот дискретизации?
Я должен знать, конечно, информацию, а не предложение.
Спасибо за прочтение.