Публикации по теме 'imbalanced-data'


Различные способы обработки несбалансированного набора данных в машинном обучении
В этой статье мы увидим, что такое несбалансированный набор данных и как с этим справиться. Во-первых, мы поймем, что такое несбалансированный набор данных. Предположим, у нас есть набор данных о диабете, и мы должны предсказать, есть ли у пациента диабет или нет. В этом случае наш результат будет либо да, либо нет. Поскольку это проблема машинного обучения классификации, мы увидим два класса «Диабет» и «Не диабет» в нашей целевой или зависимой функции набора данных. Предположим,..

Победа над несбалансированными наборами данных
Это выборка ответа? Давайте разберемся! Абхи Савалия , Чираю Шах , Сагар Парих Предположим, вы работаете в финансовом учреждении, и перед вами стоит задача прогнозировать мошенничество с кредитными картами. Вы выбрали лучший алгоритм для обучения своей модели. Оценив модель, вы обнаружите, что она имеет точность 99,8%. В восторге, вы открываете пиво, но подождите! В ходе расследования мы обнаружили, что у нас имеется очень несбалансированный набор данных, что..

Моделирование редких событий
Введение В некоторых из моих предыдущих постов я говорил об обнаружении аномалий — способах обнаружения лишнего, неожиданной мелочи, редкой, в основном неопределенной и часто нежелательной. Что, если бы вы искали конкретную, редкую вещь? Что, если вы хотите найти золотой самородок в куче речной грязи или иголку в стоге сена? В ситуации, когда у нас есть много примеров для одного или нескольких случаев и мало примеров для других, мы называем набор данных «несбалансированным»...

Машинное обучение: проблема дисбаланса меток целевых функций и решения
"Начиная" Машинное обучение: проблемы с дисбалансом меток целевых функций и решения Оглавление Часть 1: Концепции "Вступление" Что такое данные поезда? Зачем нужно балансировать данные поездов? Как на самом деле выглядят« данные балансировки ?» Нам также нужно сбалансировать тестовые данные? Метрики оценки несбалансированных данных испытаний Часть 2: Код "Настраивать" Проектирование начальных характеристик Трансформация цели модели Обращение к..

Как бороться с несбалансированными данными в Python
Питонический раствор для уравновешивания несбалансированного Несбалансированные данные - очень частое явление в реальных областях, особенно когда предмет, представляющий интерес для системы принятия решений, является редким, но важным случаем. Это может быть проблемой, когда будущее решение должно приниматься на основе исторических данных. Недостаточные данные по делу меньшинства могут снизить надежность принимаемого нового решения. Случай несбалансированных данных существует..

Балансировка - это неуравновешенность
Приступая к работе , МАШИННОЕ ОБУЧЕНИЕ Балансировка - это неуравновешенность Теория несбалансированной классификации Несбалансированная классификация - это контролируемая проблема машинного обучения, когда распределение классов слишком далеко от единообразия (например, 5% положительных и 95% отрицательных), и обычно решения по данным с меткой класса меньшинства значительны, чтобы быть правильными. В этом случае обучение является более сложным, потому что при использовании обычных..

Модель логистической регрессии для прогнозирования инсульта с несбалансированным набором данных I.
Инсульт - это заболевание, которое поражает артерии, ведущие к головному мозгу и внутри него. По данным Американской ассоциации инсульта, это причина смерти №5 и ведущая причина инвалидности в США. Исследования также показали, что черные чаще встречаются у чернокожих, чем у людей двухрасового происхождения. Воздействие инсульта на жизнь людей представляет собой серьезную проблему для общества. Помимо того, что инсульт является внезапным событием, он поражает как отдельного человека,..