Хочу уточнить: позволяет ли vaex.ml.sklearn
выполнять ML вне ядра? Я пытаюсь использовать примеры из документации и вижу, что если я использую набор данных из файла hdf5 (оцененный набор данных потребляет ~ 3 ГБ ОЗУ) в процессе xgboosting, использование ОЗУ составляет около 7-8 ГБ. Наивно предположил, что вне ядра не так много оперативной памяти. Что я не так?
Мой код
import vaex.ml.sklearn
xgb_model = xgboost.sklearn.XGBRegressor(max_depth=4,
learning_rate=0.1,
n_estimators=100,
subsample=0.75,
random_state=42,
)
vaex_xgb_model = vaex.ml.sklearn.Predictor(features=features,
target='target',
model=xgb_model,
prediction_name='prediction_xgb')
vaex_xgb_model.fit(df_train)
df_train = vaex_xgb_model.transform(df_train)
где features
- список из ~ 40 пунктов.