Публикации по теме 'class-imbalance'


Решение проблемы классового дисбаланса — часть 2/4
Предварительная обработка несбалансированных наборов данных с использованием выбора признаков. Известно, что проблема дисбаланса классов значительно ухудшает эффективность классификации и привлекает все большее внимание исследователей. Выбор признаков (FS) выделяется в литературе как одна из процедур предварительной обработки набора данных, которая улучшает обучение на несбалансированных данных. В этой статье мы решили изучить причины этого, изучив влияние FS на несбалансированные наборы..

Классификация максимального правдоподобия с ограничением на распределение классов
Подход линейной задачи назначения (LAP) к установке ограничений распределения населения В задачах контролируемой классификации прогнозы обычно генерируются для каждой выборки независимо от других. Рассмотрим сценарий, в котором вы классифицируете изображения как «домашнюю кошку» или «дикую кошку». Модель оценивает каждое изображение отдельно, определяя, что на нем больше похоже — домашнюю или дикую кошку. После того, как все изображения классифицированы, результирующее распределение..

PU обучение
Работа с отрицательным классом, скрытым в немаркированных данных Проблема, которая продолжает проявляться в работе, - это отсутствие помеченного отрицательного класса в контексте необходимости обучения двоичного классификатора. Как правило, проблема связана с ужасно несбалансированными наборами данных и нехваткой времени, я часто выбирал упрощенный путь суб-выборки неизвестного набора и рассматривал их как неизвестные. Очевидно, это не идеально, поскольку неизвестный набор загрязнен,..

Дисбаланс классов и гиперпараметры в SVM
В недавнем проекте Broadway Grosses я использовал машинное обучение, чтобы предсказать, когда бродвейское шоу закроется, на основе таких характеристик, как сборы на прошлой неделе. Идея состоит в том, что, когда мы смотрим на этот график, мы видим видимое снижение валовых продаж, а красный цвет обозначает конец срока службы продукции. Мы сделали это в наборе данных, в котором были собраны бродвейские сборы за 5 лет, и отметили последние 6 недель каждого шоу, которое закончилось, цифрой 1, а..

Распознавайте классовый дисбаланс с помощью базовых и лучших показателей
В моем первом курсе машинного обучения в качестве старшекурсника я построил систему рекомендаций. Используя набор данных с веб-сайта социальной музыки, я создал модель, чтобы предсказать, понравится ли конкретный пользователь определенного исполнителя. Я был взволнован, когда первоначальные эксперименты показали, что для 99% точек в моем наборе данных я дал правильную оценку - я ошибался только в 1% случаев! Когда я с гордостью поделился результатами со своим профессором, он сказал, что я..

Как справиться с проблемой дисбаланса классов
Некоторые советы и методы машинного обучения для работы с несбалансированным набором данных Проблема дисбаланса классов влияет на качество и надежность результатов в задаче машинного обучения, и по этой причине она должна решаться с помощью специальных методов и показателей качества. Интерес к этой области в последние годы растет, поскольку применение методов машинного обучения становится все более широким в различных областях. В литературе и в реальных приложениях проблема..

Советы по решению проблемы дисбаланса классов
Проблема несбалансированной классификации - это пример проблемы классификации, когда распределение примеров по известным классам смещено или искажено. Распределение может варьироваться от небольшого смещения до серьезного дисбаланса, когда есть один пример в классе меньшинства на сотни, тысячи или миллионы примеров в классе или классах большинства. Несбалансированные классификации создают проблему для прогнозного моделирования, поскольку большинство алгоритмов машинного обучения,..