Публикации по теме 'natural-language-process'


ML: сравнение документов стало проще
На пути обучения машинному обучению я начал сталкиваться с множеством проблем, которые можно легко решить с помощью машинного обучения. Итак, как только я начал работать с обработкой естественного языка, у меня возникла идея построить модель для сравнения документов. Это простая модель, и я намерен улучшить ее, когда столкнусь с некоторыми продвинутыми моделями. Итак, достаточно разговоров, давайте начнем с построения модели. нам нужно установить пару пакетов Python, чтобы наши модели..

Классификация текстов и анализ тональности на r / SGExams
Использование Support Vector Machines и VADER (словарь Valence Aware Dictionary и sEntiment Reasoner) Введение Два месяца назад я закончил CS50 «Введение в искусственный интеллект» с использованием курса Python. Во время курса меня особенно заинтриговала концепция анализа настроений, извлечения функций из текстовых данных и перехода в алгоритмы машинного обучения для определения эмоционального тона. Я решил заняться проектом, который включает в себя классификацию текста и анализ..

Комплексное тематическое моделирование с помощью NMF, LSA, PLSA, LDA и lda2vec (Часть-1)
Эта статья представляет собой исчерпывающий обзор тематического моделирования и связанных с ним методов. Это первая часть статьи, в которой будут рассмотрены только NMF, LSA и PLSA. LDA и lda2vec будут рассмотрены в следующей части здесь . В задачах понимания естественного языка (NLU) существует иерархия линз, через которые мы можем извлекать значение - от слов до предложений, от абзацев до документов. На уровне документа одним из наиболее полезных способов понимания текста..

Извлечение функций при обработке естественного языка с помощью Python
Объяснение того, как извлекать функции из данных документа Введение В этой статье объясняется извлечение функций при обработке естественного языка. Данные документа не поддаются вычислению, поэтому их необходимо преобразовать в числовые данные, такие как модель векторного пространства. Эта задача преобразования обычно называется извлечением функции из данных документа. Извлечение признаков в основном имеет два основных метода: набор слов и встраивание слов. Оба они широко..

Является ли Flair подходящей альтернативой SpaCy?
Flair - это мощная библиотека NLP (обработка естественного языка) с открытым исходным кодом, разработанная Zalando Research. Фреймворк Flair построен непосредственно на PyTorch, который известен как отличный фреймворк для глубокого обучения, в настоящее время он находится в версии 0.4.3. Во время этого всплеска я исследовал как Flair, так и SpaCy, чтобы сравнить их преимущества, плюсы и минусы и оценить, является ли Flair подходящей альтернативой SpaCy. Flair выпустил следующие..