Кажется, есть несколько вариантов экспорта моделей PMML из scikit-learn, например sklearn2pmml, но гораздо меньше информации идет в другом направлении. Мой случай - это модель XGboost, ранее созданная в R и сохраненная в PMML с помощью r2pmml, которую я хотел бы использовать в Python. Scikit обычно использует pickle для сохранения / загрузки моделей, но можно ли также импортировать модели в scikit-learn с помощью PMML?
Импорт моделей PMML в Python (Scikit-learn)
Ответы (1)
Вы не можете соединить различные специализированные представления (такие как собственные структуры данных R и Scikit-Learn) по обобщенному представлению (например, PMML). Возможно, вам больше повезет, если вы попытаетесь напрямую преобразовать структуры данных R в структуры данных Scikit-Learn.
XGBoost действительно является исключением из приведенного выше правила, потому что его реализации R и Scikit-Learn представляют собой лишь тонкую оболочку для собственной библиотеки XGBoost. Внутри обученного объекта R XGBoost есть blob raw
, который является моделью в его собственном представлении XGBoost. Сохраните его в файл и загрузите в Python с помощью метода xgb.Booster.load_model(fname)
.
Если вы знаете, что вам нужно развернуть модель XGBoost в Scikit-Learn, то зачем вы тренируете ее в R?