Публикации по теме 'classification-problem'


Классификация фишинговых писем
Обнаружение фишинговой электронной почты с использованием методов ML и NLP. Метод обнаружения фишинговых электронных писем с использованием машинного обучения в основном использует помеченные фишинговые электронные письма и законные электронные письма для обучения алгоритма классификации в алгоритме машинного обучения для получения модели классификатора для классификации электронной почты. ПОСТАНОВКА ПРОБЛЕМЫ: Мошеннические электронные письма стали обычным явлением в современной..

Что такое несбалансированные данные? Как обрабатывать несбалансированные данные в python?
В машинном обучении иногда, когда мы решаем задачи классификации, мы видим, что один класс имеет точность 95% (класс 1), тогда как другой класс имеет точность всего 7,5% (класс 0). Что ж, можно подумать, почему такая диспропорция точности возникает в нашем проекте? Чтобы понять причину этой несоразмерности, нам нужно сначала понять следующие моменты. Что такое несбалансированный набор данных? В чем разница между несбалансированной и несбалансированной классификацией (набором данных)?..

Чтобы иметь дело с классом дисбаланса в задаче классификации
Недавно я участвовал в хакатоне, задача которого заключалась в том, чтобы предсказать неплательщика по кредиту путем анализа заданного набора данных. После выполнения базового EDA я обнаружил, что эта проблема связана с дисбалансом классов. Для тех, кто не знает об этой проблеме, несбалансированный класс означает, что количество точек данных одного класса превышает количество точек данных других классов в данном наборе данных. В этом случае класс дисбаланса означает, что количество..

Функции потерь для задач классификации
Проблемы классификации в машинном обучении можно разделить на бинарную классификацию и мультиклассовую классификацию . Разница заключается в общем возможном количестве классов, которым может принадлежать любая входная точка данных. Функция потери Это функция двух переменных, прогнозируемого значения и фактического значения. Он измеряет производительность модели, вычисляя, насколько далеко прогнозируемое значение от фактического ожидаемого значения. Чем ниже функция потерь, тем..