Публикации по теме 'classification'


Классификация списков книг на Craigslist
В рамках одного из наших выпускных проектов нам было поручено составить постановку задачи, чтобы улучшить какую-либо функцию на Craigslist. Подраздел «Книги» в разделе «Продается» — один из самых популярных подразделов с тысячами книг, перечисленных для разных городов, но в нем не было опции фильтрации для классификации книг по жанру. Мы поняли, что это может быть интересной, но сложной проблемой для решения. Шаг 1. Требование к данным — определение предикторов и набора обучающих..

Краткое изложение оценки композиции в представлениях вектора предложения
Исчерпывающий обзор знаменитой исследовательской работы по НЛП Источник: https://www.aclweb.org/anthology/C18-1152.pdf (Ettinger et al., 2018) Предыстория. Чтобы понять, что такое встраивание предложений, необходимо понимать вложения слов. Вложения слов стали очень известными из-за их способности представлять слово в виде вектора, который можно использовать повсеместно. Известные вложения включают word2vec, Glove и т. Д. Ту же концепцию встраивания слов можно распространить..

Понимание логистической регрессии
До сих пор мы либо рассматривали оценку условных ожиданий непрерывных переменных (как в регрессии). Однако есть много ситуаций, когда нас интересуют отношения ввода-вывода, например, в регрессии, но выходная переменная является дискретной, а не непрерывной. В частности, есть много ситуаций, когда у нас есть двоичные исходы (есть только два возможных исхода в определенной ситуации). В дополнение к двоичному результату у нас есть несколько входных переменных, которые могут быть или не..

Разница между предсказать() и предсказать_проба()
Предсказать() и предсказать_проба() в API scikit-learn для прогнозирования в машинном обучении. В течение долгого времени меня сбивали с толку два метода в библиотеке sklearn, используемые в задачах классификации. Это методы predict() и predict_proba(). Немного помучившись и почесав голову над концепциями (недостаток связных статей по этой теме) , я пришел к соглашению с интуицией, стоящей за обоими методами, и поэтому решил задокументировать свое понимание, чтобы оно могло..

Серия глубокого обучения: часть 3 — часто используемые функции потерь в регрессии и классификации
Функция потерь — это математическая функция, которая оценивает эффективность прогнозирования модели. Он говорит нам, «насколько хорошо или плохо» модель делает прогнозы с учетом набора величин, влияющих на выходные данные математического объекта, называемого параметрами . Функция потерь имеет свою кривую и производные. Наклон этой кривой говорит нам, как изменить параметры, чтобы улучшить производительность модели (или сделать предсказание модели более точным). Доступны различные..

Случайный лесной классификатор
Блокнот, использованный для этого урока: Нажмите здесь (поставьте лайк, если понравилось😉) Случайный лес — это метаоценка, которая соответствует ряду классификаторов дерева решений для различных подвыборок набора данных и использует усреднение для повышения точности прогнозирования и контроля переобучения. Размер подвыборки управляется параметром max_samples , если bootstrap=True (по умолчанию), в противном случае для построения каждого дерева используется весь набор данных. ~..

Классификация настроений в Python
Анализ тональности с помощью VADER и TextBlob и контролируемая классификация текста с помощью scikit-learn Этот пост является последним из трех последовательных постов, посвященных этапам построения классификатора настроений. Сделав некоторый исследовательский анализ текста и предварительно обработав текст , пора классифицировать отзывы по тональности. В этом посте мы сначала рассмотрим 2 способа получить мнение без построения модели, а затем создадим собственную модель. Прежде..