как получить вероятность каждой темы в маллете

Я занимаюсь моделированием тем с помощью молотка. Я импортировал свой файл (каждый документ в строке) и обучил молоток с 200 темами. Теперь у меня есть 200 тем со словами, связанными с ними для каждой темы. Теперь мне нужно знать каждую тему` s вероятность. Как я могу знать? Спасибо


person user2088363    schedule 06.10.2013    source источник


Ответы (1)


Команда bin/mallet train-topics имеет опцию --output-doc-topics topic-composition.txt. Это выводит большую таблицу в текстовом формате, разделенном TAB, содержащую состав темы каждого текста.

person jk - Reinstate Monica    schedule 29.05.2015