У меня есть корпус статей в одном документе, и я применяю алгоритм моделирования темы от MALLET, чтобы позже использовать функцию поиска, которая позволит пользователю искать статьи, соответствующие его вводу. Алгоритм, который я использую, — это руководство для разработчиков API моделирования тем, которое можно найти здесь.
Я новичок в тематическом моделировании, но, насколько я понимаю, оно генерирует заданное пользователем количество тем, содержащих слова, относящиеся к этой теме, но программа не знает, что это за тема. Пользователь должен указать это вручную, я прав?
Мой вопрос: как мне вручную установить эти имена тем, чтобы я мог использовать их позже? то есть вывод темы из алгоритма будет:
0 bush republican usa immigration mexico control conservatives
где 0 - название темы. Я хочу вручную изменить имя на что-то вроде:
Immigration Policy: bush republican usa immigration mexico control conservatives
Любая помощь, пожалуйста?