Как использовать Матрицу путаницы в киберпреступности?

Привет всем …

Это Pritee, и я пришел с другой статьей, в которой мы устраним всю путаницу, связанную с Матрицей путаницы, и посмотрим, как она используется в Киберпреступности. .?

Итак, начнем с основных моментов… :)

Матрица неточностей…. ?

Матрица путаницы - это матрица N x N, используемая для оценки эффективности модели классификации, где N - количество целевых классов. Матрица сравнивает фактические целевые значения с предсказанными моделью машинного обучения. Это дает нам целостное представление о том, насколько хорошо работает наша классификационная модель и какие ошибки она допускает.

Матрица неточностей - это таблица, которая часто используется для описания эффективности модели классификации (или «классификатора») на наборе тестовых данных, для которых известны истинные значения. Сама матрица неточностей относительно проста для понимания, но связанная с ней терминология может сбивать с толку.

Матрица неточностей - хороший и надежный показатель для использования в задачах классификации. Он используется для доказательства того, что модель хороша или плоха для разных классов и их разного влияния. Например, если модели нужно улавливать классы одного конкретного класса больше, чем другого, мы можем создать эту меру из матрицы неточностей. Давайте разберемся в этом на примере двух классов 0 и 1. Во время прогнозирования могут произойти четыре возможных сценария:

Класс равен 1, а наша модель предсказала 1 - это верно!

Класс равен 1, а наша модель предсказала 0 - Плохо.

Класс равен 0, а наша модель предсказала 1 - снова не очень хорошо.

Класс равен 0, а наша модель предсказала 0 - правильно!

Мы можем связать все эти сценарии в такую ​​матрицу:

Давайте понимать TP, FP, FN, TN с точки зрения аналогии с беременностью.

◼ ** Истинно положительный:

Интерпретация: вы предсказали положительный результат, и это правда.

Вы предсказали, что женщина беременна, и это действительно так.

◼ ** True Negative:

Интерпретация: вы предсказали отрицательный результат, и это правда.

Вы предсказали, что мужчина не беременен, а на самом деле это не так.

◼ ** Ложное срабатывание: (ошибка типа 1)

Интерпретация: вы предсказали положительный результат, но он неверен.

Вы предсказали, что мужчина беременен, но на самом деле это не так.

◼ ** Ложноотрицательный: (ошибка типа 2)

Интерпретация: вы предсказали отрицательный результат, но он неверен.

Вы предсказали, что женщина не беременна, но на самом деле она беременна.

Просто помните, мы описываем прогнозируемые значения как положительные и отрицательные, а фактические значения как истинные и ложные.

Что мы можем извлечь из этого ..?

Возникает закономерный вопрос, что мы можем сделать с этой матрицей. Основываясь на этом, есть несколько важных терминов:

Точность :

Это часть значений, которые определены моделью как правильные и имеют отношение к решению постановки задачи. Мы также можем процитировать это как значения, которые являются частью общих положительных результатов, данных моделью, и являются положительными. Следовательно, мы можем дать его формулу как TP / (TP + FP).

Отзывать :

Это часть ценностей, которые модель правильно определяет как положительные. Это также называется истинно положительной скоростью или чувствительностью. Его формула получается TP / (TP + FN).

Оценка F-1:

Это гармоническое среднее Точность и Напоминание. Это означает, что если бы мы сравнивали две модели, то эта метрика подавила бы экстремальные значения и одновременно учитывала бы как ложные срабатывания, так и ложные отрицательные результаты. Его можно указать как 2 * Точность * Напоминание / (Точность + Напоминание).

Точность :

Это часть ценностей, которые определены правильно, независимо от того, положительные они или отрицательные. Это означает, что сюда включены все Истинные положительные и Истинные отрицания. Формула для этого: (TP + TN) / (TP + TN + FP + FN).

Из всех терминов наиболее широко используются точность и отзыв. Их компромисс - полезная мера успеха прогноза. Желаемая модель должна иметь высокую точность и отзывчивость, но это только в идеально разделяемых данных. В практических случаях данные сильно неорганизованы и несбалансированы.

Теперь, после всей этой базовой и важной концепции, давайте перейдем к основной части, к этой киберпреступности и к матрице случаев путаницы в киберпреступности.

Матрица путаницы в киберпреступности:

Особенно в последнее десятилетие использование Интернета быстро растет. Однако по мере того, как Интернет становится частью повседневной деятельности, киберпреступность также растет. Согласно отчету о предприятиях в области кибербезопасности в 2020 году киберпреступность будет стоить почти 6 триллионов долларов в год к 2021 году. Для незаконной деятельности киберпреступники используют любые сетевые вычислительные устройства в качестве основного средства связи с устройствами жертв, поэтому злоумышленники получают прибыль с точки зрения финансов. публичность и другие, используя уязвимости системы. Киберпреступность неуклонно растет с каждым днем. Оценка атак киберпреступности и обеспечение защитных мер ручными методами с использованием существующих технических подходов, а также расследования часто не позволяют контролировать атаки киберпреступности.

Кибер атака становится критической проблемой для информационных систем организации. Был введен ряд методов обнаружения и классификации кибератак с разным уровнем успеха, которые используются в качестве контрмеры для сохранения целостности данных и доступности системы от атак. Классификация атак на компьютерные сети становится все более сложной проблемой в области сетевой безопасности.

  • Истинно положительное (TP): количество обнаруженной атаки, когда она фактически является атакой.
  • Истинно-отрицательный (TN): количество обнаруженных нормальных значений, когда они на самом деле являются нормальными.
  • Ложно-положительный результат (FP): количество обнаруженных атак, когда оно действительно нормальное (ложное срабатывание).
  • Ложноотрицательный (FN): количество нормальных значений, обнаруженных при фактической атаке.

Ошибка типа I:

Этот тип ошибки может оказаться очень опасным. Наша система не спрогнозировала никакой атаки, но на самом деле атака имеет место, в этом случае никакое уведомление не дошло бы до службы безопасности, и ничего нельзя сделать, чтобы предотвратить ее. Вышеупомянутые ложноположительные случаи попадают в эту категорию, и поэтому одна из целей модели - минимизировать это значение.

Ошибка типа II:

Этот тип ошибок не очень опасен, поскольку наша система в действительности защищена, но модель предсказывала атаку. команда получит уведомление и проверит любую вредоносную активность. Это не причинит никакого вреда. Их можно назвать Ложной тревогой.

Итак, все ... Я надеюсь, что эта статья кое-что прояснит и ваше замешательство прояснится ... :)

Так что, если вам это нравится, похлопайте и поделитесь. И если вы хотите связаться со мной, то ниже находится ссылка на мой профиль в LinkedIn.



Большое спасибо за чтение ... До скорой встречи ... :)