Вопросы по теме 'hdfstore'
Датафрейм Pandas и скорость
У меня есть объект dataframe pandas, который я предварительно выделил 400 000 записей. 2 столбца: метка времени типа datetime.datetime и число с плавающей запятой. Когда я пытаюсь вставить (перезаписать) строку в таблицу, это кажется довольно...
1407 просмотров
schedule
21.07.2022
Выбор Python Pandas hdfstore (где = '') возвращает неквалифицированные результаты
Когда я запрашиваю большой файл hdfstore (> 10G) следующим образом:
hdf = pd.HDFStore('raw_sample_storage.h5')
nrows = hdf.get_storer('raw_sample_all').nrows
chunksize = 300000
for i in xrange(nrows//chunksize + 1):
chunk =...
237 просмотров
schedule
25.09.2023
Pandas HDFStore: сохранение и извлечение серии с индексом иерархического периода
Сначала я создаю серию с двумерным иерархическим индексом. Тип индекса (pandas.period, numpy.int32)
In [265]: import pandas as pd
In [266]: import numpy as np
In [267]: hdf_file = r'F:\test.h5'
In [268]: data = np.random.randint(10, size=(7,...
672 просмотров
schedule
27.02.2023
Как объединить несколько фреймов данных pandas в объект HDF5 под одним ключом / группой?
Я разбираю данные из большого CSV размером 800 ГБ. Для каждой строки данных я сохраняю это как фрейм данных pandas.
readcsvfile = csv.reader(csvfile)
for i, line in readcsvfile:
# parse create dictionary of key:value pairs by csv field:value,...
1753 просмотров
schedule
16.04.2023
Numexpr/PyTables: как передать выполнение нескольких условных запросов из списка/массива?
Я делаю запрос (т. е. выбираю несколько строк на основе некоторого условия), используя PyTables, с функциями tables.Table.read() и tables.Table.read_where() . По сути, это основано на numpy и pandas с NumExpr:...
364 просмотров
schedule
24.06.2022
python pandas HDFStore добавляет данные неконтрастного размера
Я использую Python 2.7 с пандами и HDFStore.
Я пытаюсь обработать большой набор данных, который помещается на диск, но не в память.
Я храню набор данных большого размера в файле .h5, размер данных в каждом столбце не является постоянным,...
240 просмотров
schedule
29.06.2023
файлы hdf5 становятся огромными, пока только добавляются
Я использую pandas HDFStore для хранения данных в файлах hfd5.
Как правило, данные добавляются по одной выборке за раз, а не длинными пакетами.
Я заметил, что файлы растут довольно быстро, и я могу существенно уменьшить их с помощью ptrepack....
300 просмотров
schedule
24.03.2023
Ошибка инициализации HDFStore: имя не определено
Когда я инициализирую HDFStore
import numpy as np
import pandas as pd
hdf = pd.HDFStore('polar.h5')
Я вижу ошибку во флейворе.py:
NameError, имя '_conv_python_to_python' не определено
Я использую anaconda, а pandas...
384 просмотров
schedule
30.05.2024
Панды Python добавляют кадр данных с содержимым массива в файл hdf
Как я могу добавить кадр данных к другому кадру данных, который уже сохранен в файле, не загружая его из файла? (Python 3.6 и Pandas 1.0.1) Пример:
import pandas as pd
data =...
240 просмотров
schedule
11.09.2022