В пакете топиков R, как мы можем получить распределение тем по срокам?

Я запускаю LDA с помощью пакета топиков.

lda.model = LDA(dtm, k,control = list(em = list(iter.max = 1000, tol = 10^-4)))
apps.terms<-terms(lda.model,15)
head(apps.terms)

    Topic.1 Topic.2 Topic.3 Topic.4 Topic.5
1      38      55     187      38      38
2      40      38     171      40      35
3      55      35     178      56      44
4      49      49      74      35      55
5      35      44     177     190      52
6      44      53      80      55      49

Этот код получает порядок 15 терминов по их пропорции. Если я не плохо понял алгоритм LDA. Каждая тема представляет собой распределение по терминам. Поэтому я хочу знать точное распределение по этим терминам. Например. Тема.1 на 30% связана с 38, на 20% связана с 40 ..и т.д. Есть ли способ получить его с помощью пакета topicmodels?


person ysfseu    schedule 12.08.2015    source источник


Ответы (1)


Похоже, вам нужны апостериорные вероятности для каждого документа.

lda.inf <- posterior(lda.model,dtm)
person groceryheist    schedule 31.12.2015
comment
Каково значение порядка тем? - person Scott; 29.10.2017
comment
Не уверен, что этот пакет сортирует темы. Но обычно порядок тем не имеет значения. - person groceryheist; 31.10.2017