Публикации по теме 'topic-modeling'
Полное руководство по алгоритмам кластеризации и тематическому моделированию
Полное руководство по алгоритмам кластеризации и тематическому моделированию
Часть 1: Руководство по K-means для начинающих
Кластеризация - один из наиболее часто используемых алгоритмов машинного обучения без учителя . Вы можете думать о кластеризации как о помещении неорганизованных точек данных в разные категории, чтобы вы могли больше узнать о структурах ваших данных. Кластеризация имеет множество приложений для извлечения информации из данных без меток. Например, компании..
Тематическое моделирование — 4: Веб-сайт — Размещено на S3
Это последняя статья из серии статей, посвященных тематическому моделированию документов на телугу. Здесь мы, наконец, создаем веб-страницу, которая применяет сгенерированную модель темы к любому тексту на телугу и отображает темы, связанные с этим текстом.
Серия статей
Статьи в серии
Сканировать и собирать данные Построить модель LDA для документов на телугу Настройка LDA (Gensim) на AWS Lambda Собираем все вместе — создаем веб-сайт (текущая статья)
Цель
Цель этой..
Моделирование темы твита: очистка и предварительная обработка твитов
Веб-парсинг , Программирование , Обработка естественного языка
Моделирование темы твита: очистка и предварительная обработка твитов
Серия из нескольких частей, показывающая, как очищать, предварительно обрабатывать, применять и визуализировать моделирование коротких текстовых тем для любой коллекции твитов.
Отказ от ответственности: эта статья предназначена только для образовательных целей. Мы не призываем кого-либо очищать веб-сайты, особенно те веб-ресурсы, которые могут..
Простой способ извлечь темы из комментариев пользователей
Как мы хотим помочь компаниям понять, что чувствуют их сотрудники
Импульсные опросы — большой тренд в HR. В этих коротких еженедельных опросах сотрудникам задаются простые вопросы о том, как они себя чувствуют на работе. В Officevibe людям также предлагается оставлять дополнительные отзывы при заполнении анкеты.
И им есть что сказать! Типичный менеджер получает примерно по одному комментарию в месяц от каждого члена своей команды. В средних и крупных компаниях (более 200..
Контекстное моделирование тем с помощью Python (EACL2021)
Объединение BERT и друзей с нейронными вариационными тематическими моделями
В этом сообщении в блоге я обсуждаю нашу последнюю опубликованную статью по тематическому моделированию:
Бьянки, Ф., Терраньи, С., Хови, Д., Ноцца, Д., и Ферсини, Э. (2021). Межъязыковые контекстуализированные тематические модели с беспроблемным обучением. Европейское отделение Ассоциации компьютерной лингвистики (EACL). «Https://arxiv.org/pdf/2004.07737 Фак /
Предположим, у нас есть небольшой набор..
Комплексное тематическое моделирование с помощью NMF, LSA, PLSA, LDA и lda2vec (Часть-1)
Эта статья представляет собой исчерпывающий обзор тематического моделирования и связанных с ним методов. Это первая часть статьи, в которой будут рассмотрены только NMF, LSA и PLSA. LDA и lda2vec будут рассмотрены в следующей части здесь .
В задачах понимания естественного языка (NLU) существует иерархия линз, через которые мы можем извлекать значение - от слов до предложений, от абзацев до документов. На уровне документа одним из наиболее полезных способов понимания текста..
Создание потенциала в области науки о данных в UKHO: наша неделя исследований в июле 2021 г.
Соавторами этого блога являются Эндрю Смит, доктор Сьюзан Нельмс, Кейт Сил , Доктор Томас Редферн и Рэйчел Ки .
Использование недель исследований для расширения границ науки о данных в UKHO
Добро пожаловать в наш ежеквартальный пост в блоге, в котором мы делимся результатами « исследовательской недели» , исследуя интересные аспекты науки о данных и машинного обучения. В этом месяце команда изучает обнаружение морской инфраструктуры, метаобучение, моделирование текстовых тем,..