Привет, читатели, надеюсь, у вас все хорошо. В этом посте я попытаюсь упростить матрицу путаницы и постараюсь использовать как можно меньше технических терминов, а также постараюсь понять каждый термин, прочитав его на простом английском языке, и научусь строить матрицу путаницы вместо вспоминая это.

Что такое «матрица путаницы»?

Простая матрица, которая показывает, сколько из того, что должно было быть предсказано правильно или неправильно, и сколько из того, что было предсказано правильно или неправильно? Просто сбивает с толку, не так ли? Ладно, подожди…

Как мы все знаем, для бинарной классификации либо точка данных может быть классифицирована как 0, либо как 1, верно? Теперь также модель классификации может предсказать это правильно или неправильно. Таким образом, мы приходим к четырем случаям:

Основные условия:

a) Истинно положительные результаты (TP): баллы, которые действительно являются положительными или (1), и наша модель правильно классифицировала их как (1).

б) Истинно отрицательные (TN): Да, вы правильно догадались. Точки, которые на самом деле отрицательные или (0), и наша модель правильно классифицировала их как (0).

c) Ложные срабатывания (FP): баллы, которые наша модель классифицировала как положительные (1), но на самом деле отрицательные (0). Также называется ошибкой первого рода.

г) Ложноотрицательные (FN): баллы, которые наша модель классифицировала как отрицательные (0), но на самом деле являются положительными (1). Также называется ошибкой второго рода.

Все еще в замешательстве? Есть простой способ понять и запомнить их.

  • Для True Positives и True Negatives у нас есть слово «True», которое говорит, что наша модель была верной или была правильной в предсказании того, что она предсказывала.
  • Для ложных срабатываний и ложных отрицаний у нас есть слово «ложь», которое говорит, что наша модель была ложной или неправильной в предсказании того, что она предсказывала.

Таким образом, последнее слово (Положительное или Отрицательное) говорит о том, что было предсказано моделью, а первое слово (Истина или Ложь) говорит о том, правильно ли это предсказала наша модель или нет? Таким образом, просто взглянув на термин «ложноположительный», мы можем сказать… хорошо, «положительный» означает, что наша модель предсказала его как (1) или положительный, а из «ложного» мы говорим… наша модель предсказала неправильно, что означает, что на самом деле это была отрицательная точка и был предсказан как положительный момент.

Имеет смысл, верно?

Теперь давайте научимся строить матрицу путаницы. Помните, что матрица путаницы говорит о том, что предсказала модель и что должно было быть предсказано.

  • 1-й шаг — выбрать ось для фактических значений, чтобы другая ось представляла прогнозируемые значения, и мы назначаем 0 и 1 как одной строке, так и столбцу. Любая строка может быть либо 0, либо 1 и такой же для столбца

  • Теперь отметьте «N» в строках, соответствующих прогнозируемым нулям, и в строках, соответствующих прогнозируемым единицам, отметьте «P».

  • Теперь оцените логическую операцию И для каждой ячейки матрицы.

  • И наконец…

Все еще не понял? Посмотрите ниже…..

Сноски

Итак, это был мой первый пост на Medium, надеюсь, он был в порядке, а также дайте мне несколько предложений по улучшению. В следующем посте я расскажу о различных показателях, таких как TPR, FPR, TNR и FNR, а также о некоторых других, которые мы получаем из матрицы путаницы, а также о том, что называется «матрицей отзывов» и «матрицей точности».

Большое спасибо за чтение :)