У меня есть объект dataframe pandas, который я предварительно выделил 400 000 записей. 2 столбца: метка времени типа datetime.datetime и число с плавающей запятой. Когда я пытаюсь вставить (перезаписать) строку в таблицу, это кажется довольно медленным, в зависимости от размера таблицы я получаю что-то вроде 0,044 секунды. Я создал целочисленный индекс и использую этот индекс для доступа к строке. Вот как я его использую:
maxsize = 400000
data = pd.DataFrame({'ts' : date_list, 'val' : zeros}, index=range(maxsize))
# later on, the next statement is "slow"
data.iloc[0] = pd.Series({'ts' : datetime.datetime.now(), 'val': val})
Согласно моему расследованию, последнее утверждение занимает около 0,044 секунды на моей машине (i7-4650U). Это кажется довольно медленным. Есть ли что-то, что я делаю принципиально неправильно? Могу ли я использовать что-то вроде HDF Store для повышения скорости записи, но при этом сохранить высокую скорость чтения?
Спасибо.