Вопросы по теме 'hdfstore'

Датафрейм Pandas и скорость
У меня есть объект dataframe pandas, который я предварительно выделил 400 000 записей. 2 столбца: метка времени типа datetime.datetime и число с плавающей запятой. Когда я пытаюсь вставить (перезаписать) строку в таблицу, это кажется довольно...
1407 просмотров
schedule 21.07.2022

Выбор Python Pandas hdfstore (где = '') возвращает неквалифицированные результаты
Когда я запрашиваю большой файл hdfstore (> 10G) следующим образом: hdf = pd.HDFStore('raw_sample_storage.h5') nrows = hdf.get_storer('raw_sample_all').nrows chunksize = 300000 for i in xrange(nrows//chunksize + 1): chunk =...
237 просмотров
schedule 25.09.2023

Pandas HDFStore: сохранение и извлечение серии с индексом иерархического периода
Сначала я создаю серию с двумерным иерархическим индексом. Тип индекса (pandas.period, numpy.int32) In [265]: import pandas as pd In [266]: import numpy as np In [267]: hdf_file = r'F:\test.h5' In [268]: data = np.random.randint(10, size=(7,...
672 просмотров
schedule 27.02.2023

Как объединить несколько фреймов данных pandas в объект HDF5 под одним ключом / группой?
Я разбираю данные из большого CSV размером 800 ГБ. Для каждой строки данных я сохраняю это как фрейм данных pandas. readcsvfile = csv.reader(csvfile) for i, line in readcsvfile: # parse create dictionary of key:value pairs by csv field:value,...
1753 просмотров
schedule 16.04.2023

Numexpr/PyTables: как передать выполнение нескольких условных запросов из списка/массива?
Я делаю запрос (т. е. выбираю несколько строк на основе некоторого условия), используя PyTables, с функциями tables.Table.read() и tables.Table.read_where() . По сути, это основано на numpy и pandas с NumExpr:...
364 просмотров
schedule 24.06.2022

python pandas HDFStore добавляет данные неконтрастного размера
Я использую Python 2.7 с пандами и HDFStore. Я пытаюсь обработать большой набор данных, который помещается на диск, но не в память. Я храню набор данных большого размера в файле .h5, размер данных в каждом столбце не является постоянным,...
240 просмотров
schedule 29.06.2023

файлы hdf5 становятся огромными, пока только добавляются
Я использую pandas HDFStore для хранения данных в файлах hfd5. Как правило, данные добавляются по одной выборке за раз, а не длинными пакетами. Я заметил, что файлы растут довольно быстро, и я могу существенно уменьшить их с помощью ptrepack....
300 просмотров
schedule 24.03.2023

Ошибка инициализации HDFStore: имя не определено
Когда я инициализирую HDFStore import numpy as np import pandas as pd hdf = pd.HDFStore('polar.h5') Я вижу ошибку во флейворе.py: NameError, имя '_conv_python_to_python' не определено Я использую anaconda, а pandas...
384 просмотров
schedule 30.05.2024

Панды Python добавляют кадр данных с содержимым массива в файл hdf
Как я могу добавить кадр данных к другому кадру данных, который уже сохранен в файле, не загружая его из файла? (Python 3.6 и Pandas 1.0.1) Пример: import pandas as pd data =...
240 просмотров
schedule 11.09.2022