Как TF-IDF преобразовать InstanceList FeatureVectors

У меня есть MALLET InstanceList, где поля данных объектов Instance являются MALLET FeatureVector.

Я хочу, чтобы TF-IDF преобразовал их с тем же эффектом, что и http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.TfidfTransformer.html

Есть ли существующая библиотека или какая-то часть API MALLET, которая делает это?


person Mark Collier    schedule 18.07.2016    source источник
comment
Я также думаю, что эта функция была бы полезна, пожалуйста, напишите здесь, если вы достигли какого-либо прогресса в этом. Вам, вероятно, придется использовать для этого что-то вроде Lucene, см. stackoverflow.com/a/27233433/3229995   -  person tkja    schedule 24.08.2016