Я хочу тренировать GMM с помощью MFCC.
У меня 588 аудиофайлов (wav, если важно). После извлечения функций я получаю набор из 588 двумерных массивов (13x?). В каждом файле разное количество столбцов.
А как подать MFCC во входной алгоритм?
Я хочу тренировать GMM с помощью MFCC.
У меня 588 аудиофайлов (wav, если важно). После извлечения функций я получаю набор из 588 двумерных массивов (13x?). В каждом файле разное количество столбцов.
А как подать MFCC во входной алгоритм?
Вы можете вычислить длину столбцов. Сделайте самый длинный как ссылку. Затем пройдите по mfccs. Если количество столбцов меньше эталонного, заполните mfcc нулями. После этого mfcc будут в той же форме. Затем mfcc могут быть загружены в модель.