Я использую массивы, хранящиеся в формате Python .npz. У меня есть много таких файлов, которые имеют одинаковую общую структуру: имя файла my_file_var1_var2_var3.npz
содержит следующие элементы (все массивы представляют собой 32-битные числа с плавающей запятой):
- двумерный массив (N=11, Ns=2000)
- двумерный массив (12, N )
- двумерный массив ( 300, N )
- двумерный массив ( 300, Ns )
- поплавок
- целое число
Очень раздражает иметь более 1000 файлов, и каждый из них занимает около 4 МБ. Я подумал, что было бы неплохо переместить их в контейнер, такой как HDF5/Pytables или аналогичный. Различные массивы - это просто массивы, нет предпочтительного порядка или чего-то еще (они фактически являются матрицами или стеками векторов, с которыми будут работать). Все массивы для каждого имени файла требуются вместе одновременно.
Есть ли какие-либо рекомендации о том, в каких форматах лучше извлекать массивы, связанные с var1
, var2
и var3
, которые переносимы и эффективны при хранении?