Публикации по теме 'topic-modeling'


Знакомство с тематическим моделированием с помощью NMF
Представьте себе: вы потерялись в цифровом лесу текстов, тонете в море слов и отчаянно ищете идеи. Или вам было поручено получить информацию из множества отзывов клиентов, но вы не знаете, с чего начать? Не волнуйся! В этом сообщении блога я расскажу вам, как можно использовать факторизацию неотрицательной матрицы (NMF) для выполнения тематического моделирования. Учитывая большие объемы текстовых данных, которые доступны нам сегодня, понимание основных тем и закономерностей..

Демистификация методов тематического моделирования в НЛП
Добро пожаловать в эту познавательную статью, в которой мы погрузимся в увлекательный мир тематического моделирования. Мы раскроем истинную суть тематического моделирования, изучим его внутреннюю работу и узнаем, почему оно стало незаменимым инструментом. Попутно мы раскроем наиболее важные методы, используемые в отрасли. Чтобы сделать вещи еще более увлекательными, мы продемонстрируем приложения, работающие в реальном времени, и примеры использования, в которых эти методы проявляют себя...

Что такое тематическое моделирование?
Тематическое моделирование — это метод неконтролируемого обучения, используемый в текстовой аналитике, НЛП (обработке естественного языка) или машинном обучении с целью выявления тем или тем, существующих в большом корпусе (наборе документов), что приводит к извлечению полезных идей, закономерностей. и отношения. Практический пример Данная газетная статья может включать такие слова, как; футбол, бейсбол, баскетбол, игрок, стадион; его тема — спорт , а также такие слова, как..

Анализ отзывов об автомобилях с помощью тематического моделирования
В этом проекте мы рассмотрим практический подход к использованию метода моделирования темы или анализа текста для определения основных тем в коллекции документов и группировки их по темам. Введение Тематическое моделирование — это метод, используемый при обработке естественного языка для автоматического определения и извлечения основных тем или тем, присутствующих в наборе документов. Он работает путем анализа текста документов и выявления шаблонов в используемых словах, которые затем..

Изучение больших коллекций документов с помощью неконтролируемого тематического моделирования — Часть 1/4
Интерпретация извлеченных тем с помощью модульности темы В этой серии статей мы сосредоточимся на изучении больших коллекций немаркированных документов на основе тематического моделирования. Предположим, что мы ничего не знаем о содержании корпуса, кроме контекста корпуса. Наша цель — завершить исследование некоторыми новыми количественными знаниями о том, что обсуждается в корпусе. Это 1-я часть из 4-х частей. Давайте углубимся в это. Введение Тематическое моделирование 101..

Руководство по OCTIS для новичков: оптимизация и сравнение тематических моделей - это просто
Практические руководства Руководство по OCTIS для новичков: оптимизация и сравнение тематических моделей - это просто Пакет Python с наибольшим количеством интегрированных современных тематических моделей. Тематические модели являются многообещающими методами генеративной статистики, которые направлены на извлечение скрытых тем, лежащих в основе коллекции документов. Обычно тематические модели имеют на выходе две матрицы. 1. Матрица тем-слов ( словарь x number_topics ),..

Тематическое моделирование на крупномасштабном корпусе с помощью Spark
Построение LDA-моделей на основе различных конвейеров NLP Введение Тематическое моделирование - это метод машинного обучения без учителя, который обнаруживает скрытые темы из коллекции документов. Существует ряд алгоритмов, которые используются для обучения тематических моделей, таких как вероятностный скрытый семантический анализ (pLSA), скрытый семантический анализ (LSA) и скрытое распределение Дирихле (LDA) . Этот пост посвящен LDA - самому популярному и хорошо изученному..