У меня есть вопрос о функции «дополнения» из учебника Сильге и Робинсона «Интеллектуальный анализ текста с помощью R: аккуратный подход». Запустив LDA в корпусе, я применяю «дополнение», чтобы назначить темы для каждого слова.
Я получаю результаты, но не уверен, что происходит «под капотом» за «увеличением», то есть как тема для каждого слова определяется с использованием байесовской структуры. Основано ли это только на формуле условной вероятности и оценивается после того, как LDA подходит с использованием p (тема | слово) = p (слово | тема) * p (тема) / p (слово)?
Буду признателен, если кто-нибудь может предоставить статистические данные о том, как это делает «дополнение». Не могли бы вы также предоставить ссылки на документы, где это задокументировано.
augment()
— это общая функция изbroom
. Он делает разные вещи в зависимости от того, что вы передаете, и это совсем не относится к тематическому моделированию. Вам необходимо проверить документацию по другим функциям, которые вы используете, чтобы определить, какой метод используется во время моделирования. - person MrFlick   schedule 16.11.2018