HTK HCompV: входной файл не в формате RIFF

Я пытаюсь использовать HTK и соответствующим образом настраиваю проект. Мне удалось успешно закодировать обучающие данные с помощью HCopy, но при попытке выполнить:

HCompV -C config -f 0.01 -m -S codetr.scp -M hmm0 proto

Я получаю следующую ошибку:

ERROR [+6251] Input file is not in RIFF format
ERROR [+6213] OpenWaveInput: Get[format]HeaderInfo failed
ERROR [+6313] OpenAsChannel: OpenWaveInput failed
ERROR [+6316] OpenBuffer: OpenAsChannel failed
ERROR [+2050] LoadFile: Config parameters invalid
FATAL ERROR - Terminating program

Для справки, я запускаю это в оболочке MSYS, и конфигурация выглядит следующим образом:

# Coding parameters
SOURCEFORMAT = WAV # We read in .wav files
TARGETKIND = MFCC_0_D_A # Identifier for coefficients
TARGETRATE = 100000.0 # 10ms = frame periodicity
SAVECOMPRESSED = T
SAVEWITHCRC = T
WINDOWSIZE = 250000.0 # 25ms = time frame length
USEHAMMING = T # Use of Hamming function for windowing
PREEMCOEF = 0.97 # Pre-emphasis coefficient
NUMCHANS = 26 # Number of filterbank channels
CEPLIFTER = 22 # Length of cepstral filtering
NUMCEPS = 12 # Number of MFCC coefficients
ENORMALISE = F # Normalise intensity of data

прото-файл выглядит следующим образом:

~o <VecSize> 39 <MFCC_0_D_A>
~h "proto"
<BeginHMM>
  <NumStates> 5
  <State> 2
    <Mean> 39
      0.0 0.0 0.0 0.0 ...
    <Variance> 39
      1.0 1.0 1.0 1.0 ...
  <State> 3
    <Mean> 39
      0.0 0.0 0.0 0.0 ...
    <Variance> 39
      1.0 1.0 1.0 1.0 ...
  <State> 4
    <Mean> 39
      0.0 0.0 0.0 0.0 ...
    <Variance> 39
      1.0 1.0 1.0 1.0 ...
  <TransP> 5
    0.0 1.0 0.0 0.0 0.0
    0.0 0.6 0.4 0.0 0.0
    0.0 0.0 0.6 0.4 0.0
    0.0 0.0 0.0 0.7 0.3
    0.0 0.0 0.0 0.0 0.0
<EndHMM>

а файл codetr.scp такой (все файлы присутствуют):

samples/cough1.wav samples/cough1.mfc
samples/cough2.wav samples/cough2.mfc
samples/cough3.wav samples/cough3.mfc
samples/cough4.wav samples/cough4.mfc
samples/silence1.wav samples/silence1.mfc
samples/silence2.wav samples/silence2.mfc
samples/silence3.wav samples/silence3.mfc
samples/silence4.wav samples/silence4.mfc

Любая помощь приветствуется!


htk
person Botato    schedule 22.09.2015    source источник


Ответы (2)


У меня была такая же ошибка. Я решил это в Windows, удалив SOURCEFORMAT = WAV

Кроме того, у вас могут быть ошибки в какой-то части вашего прото-файла. Я почти уверен, что все двойники должны быть на одной строке, например, в вашем: 5

0.0 1.0 0.0 0.0 0.0 ....следует продолжить эту строку и не переходить на другую

Надеюсь это поможет!

person aoifedeb    schedule 23.11.2015
comment
ты герой! - person Mehdi Souregi; 09.01.2019

Вы проверили формат входного файла? В unix/linux вы можете попробовать файл [имя файла]. Выложите результат теста. Для преобразования в формат RIFF можно использовать такой инструмент, как Audacity.

person D Lyzer    schedule 25.10.2015