Топ-5 показателей производительности для задач классификации в машинном обучении

Обучить — Оценить — Повторить

В этой статье мы собираемся обсудить наиболее часто используемые показатели для оценки разработанной модели классификации.

Начнем с определения оценки. Это метод, используемый для количественной оценки эффективности модели, разработанной после обучения алгоритма на пользовательских данных. Очень важно выбрать правильную метрику, поскольку она является мерой производительности модели. Мы собираемся обсудить матрицу путаницы, точность, отзыв, оценку F1 и точность. У нас также есть такие показатели, как Log-Loss и AUC (площадь под кривой), которые выходят за рамки этой статьи.

1. Точность:

Это наиболее широко используемый показатель для количественной оценки эффективности модели классификации. Он рассчитывается путем деления количества правильных прогнозов на общее количество прогнозов.

Точность = TP + TN / TP + FP + TN + FN

2. Точность:

Точность — это отношение числа правильно предсказанных положительных результатов к общему количеству записей, предсказанных как положительные.

Точность = TP / TP + FP

3.Напомнить:

Полнота — это отношение количества правильно предсказанных положительных результатов к общему количеству фактических положительных результатов в данных.

Отзыв = ТП / ТП + FN

4. Счет F1:

Это гармоническое среднее Точности и Отзыва. Это лучший показатель для использования, когда данные несбалансированы.

Оценка F1 = 2 (точность * отзыв) / (точность + отзыв)

5. Матрица путаницы:

Это таблица, которая определяет производительность алгоритма классификации путем визуализации истинных положительных результатов, истинных отрицательных результатов, ложных положительных результатов и ложных отрицательных результатов.

Я надеюсь, что эта статья дала общее представление об использовании различных метрик на основе сценариев.