Я разработал классификатор спама, используя pandas и scikit, чтобы он был готов к интеграции в нашу систему на основе Hadoop. Для этого мне нужно экспортировать мой классификатор в более распространенный формат, чем травление.
Predictive Model Markup Language (PMML) — мой предпочтительный формат экспорта. Он очень хорошо работает с Cascading, который мы уже используем. Однако я, к удивлению, не могу найти библиотеки Python, которые экспортируют модели scikit-learn в PMML.
Кто-нибудь имел опыт использования этого варианта использования? Существует ли какая-либо альтернатива PMML, обеспечивающая взаимодействие между scikit-learn и hadoop? Как насчет надежной библиотеки экспорта PMML?