Инструмент HTK и частота дискретизации


Здравствуйте, ребята. (Можно ли начинать это предложение?)

Я попытался с помощью инструмента HTK смоделировать распознавание голоса (слова).
И у меня есть файлы *.wav.
Некоторые файлы имеют частоту дискретизации 16 кГц, некоторые файлы имеют частоту дискретизации 44,1 кГц.

И я делаю файл mfcc для каждой частоты дискретизации.
Но я делаю модель HMM, используя все (16 кГц и 44,1 кГц) файлы mfcc.

voice_16KHz.wav -> voice_1.mfcc
voice_44.1KHz.wav -> voice_2.mfcc
make hmm_model using voice_1.mfcc and voice_2.mfcc

Можно ли делать модели HMM со смешением разных частот дискретизации?

Я должен знать, конечно, информацию, а не предложение.

Спасибо за прочтение.


person Won Hyoung Lee    schedule 02.06.2016    source источник


Ответы (1)


Я предлагаю вам выбрать только одну частоту дискретизации. Это будет работать, но точность изменится, а также вам необходимо изменить детали конфигурации в конфигурационном файле MFCC. Понизить файлы 44,1 кГц до 16 кГц очень просто.

person Nilkanth Shirodkar    schedule 05.08.2016