Как использовать Матрицу путаницы в киберпреступности?
Привет всем …
Это Pritee, и я пришел с другой статьей, в которой мы устраним всю путаницу, связанную с Матрицей путаницы, и посмотрим, как она используется в Киберпреступности. .?
Итак, начнем с основных моментов… :)
Матрица неточностей…. ?
Матрица путаницы - это матрица N x N, используемая для оценки эффективности модели классификации, где N - количество целевых классов. Матрица сравнивает фактические целевые значения с предсказанными моделью машинного обучения. Это дает нам целостное представление о том, насколько хорошо работает наша классификационная модель и какие ошибки она допускает.
Матрица неточностей - это таблица, которая часто используется для описания эффективности модели классификации (или «классификатора») на наборе тестовых данных, для которых известны истинные значения. Сама матрица неточностей относительно проста для понимания, но связанная с ней терминология может сбивать с толку.
Матрица неточностей - хороший и надежный показатель для использования в задачах классификации. Он используется для доказательства того, что модель хороша или плоха для разных классов и их разного влияния. Например, если модели нужно улавливать классы одного конкретного класса больше, чем другого, мы можем создать эту меру из матрицы неточностей. Давайте разберемся в этом на примере двух классов 0 и 1. Во время прогнозирования могут произойти четыре возможных сценария:
Класс равен 1, а наша модель предсказала 1 - это верно!
Класс равен 1, а наша модель предсказала 0 - Плохо.
Класс равен 0, а наша модель предсказала 1 - снова не очень хорошо.
Класс равен 0, а наша модель предсказала 0 - правильно!
Мы можем связать все эти сценарии в такую матрицу:
Давайте понимать TP, FP, FN, TN с точки зрения аналогии с беременностью.
◼ ** Истинно положительный:
Интерпретация: вы предсказали положительный результат, и это правда.
Вы предсказали, что женщина беременна, и это действительно так.
◼ ** True Negative:
Интерпретация: вы предсказали отрицательный результат, и это правда.
Вы предсказали, что мужчина не беременен, а на самом деле это не так.
◼ ** Ложное срабатывание: (ошибка типа 1)
Интерпретация: вы предсказали положительный результат, но он неверен.
Вы предсказали, что мужчина беременен, но на самом деле это не так.
◼ ** Ложноотрицательный: (ошибка типа 2)
Интерпретация: вы предсказали отрицательный результат, но он неверен.
Вы предсказали, что женщина не беременна, но на самом деле она беременна.
Просто помните, мы описываем прогнозируемые значения как положительные и отрицательные, а фактические значения как истинные и ложные.
Что мы можем извлечь из этого ..?
Возникает закономерный вопрос, что мы можем сделать с этой матрицей. Основываясь на этом, есть несколько важных терминов:
Точность :
Это часть значений, которые определены моделью как правильные и имеют отношение к решению постановки задачи. Мы также можем процитировать это как значения, которые являются частью общих положительных результатов, данных моделью, и являются положительными. Следовательно, мы можем дать его формулу как TP / (TP + FP).
Отзывать :
Это часть ценностей, которые модель правильно определяет как положительные. Это также называется истинно положительной скоростью или чувствительностью. Его формула получается TP / (TP + FN).
Оценка F-1:
Это гармоническое среднее Точность и Напоминание. Это означает, что если бы мы сравнивали две модели, то эта метрика подавила бы экстремальные значения и одновременно учитывала бы как ложные срабатывания, так и ложные отрицательные результаты. Его можно указать как 2 * Точность * Напоминание / (Точность + Напоминание).
Точность :
Это часть ценностей, которые определены правильно, независимо от того, положительные они или отрицательные. Это означает, что сюда включены все Истинные положительные и Истинные отрицания. Формула для этого: (TP + TN) / (TP + TN + FP + FN).
Из всех терминов наиболее широко используются точность и отзыв. Их компромисс - полезная мера успеха прогноза. Желаемая модель должна иметь высокую точность и отзывчивость, но это только в идеально разделяемых данных. В практических случаях данные сильно неорганизованы и несбалансированы.
Теперь, после всей этой базовой и важной концепции, давайте перейдем к основной части, к этой киберпреступности и к матрице случаев путаницы в киберпреступности.
Матрица путаницы в киберпреступности:
Особенно в последнее десятилетие использование Интернета быстро растет. Однако по мере того, как Интернет становится частью повседневной деятельности, киберпреступность также растет. Согласно отчету о предприятиях в области кибербезопасности в 2020 году киберпреступность будет стоить почти 6 триллионов долларов в год к 2021 году. Для незаконной деятельности киберпреступники используют любые сетевые вычислительные устройства в качестве основного средства связи с устройствами жертв, поэтому злоумышленники получают прибыль с точки зрения финансов. публичность и другие, используя уязвимости системы. Киберпреступность неуклонно растет с каждым днем. Оценка атак киберпреступности и обеспечение защитных мер ручными методами с использованием существующих технических подходов, а также расследования часто не позволяют контролировать атаки киберпреступности.
Кибер атака становится критической проблемой для информационных систем организации. Был введен ряд методов обнаружения и классификации кибератак с разным уровнем успеха, которые используются в качестве контрмеры для сохранения целостности данных и доступности системы от атак. Классификация атак на компьютерные сети становится все более сложной проблемой в области сетевой безопасности.
- Истинно положительное (TP): количество обнаруженной атаки, когда она фактически является атакой.
- Истинно-отрицательный (TN): количество обнаруженных нормальных значений, когда они на самом деле являются нормальными.
- Ложно-положительный результат (FP): количество обнаруженных атак, когда оно действительно нормальное (ложное срабатывание).
- Ложноотрицательный (FN): количество нормальных значений, обнаруженных при фактической атаке.
Ошибка типа I:
Этот тип ошибки может оказаться очень опасным. Наша система не спрогнозировала никакой атаки, но на самом деле атака имеет место, в этом случае никакое уведомление не дошло бы до службы безопасности, и ничего нельзя сделать, чтобы предотвратить ее. Вышеупомянутые ложноположительные случаи попадают в эту категорию, и поэтому одна из целей модели - минимизировать это значение.
Ошибка типа II:
Этот тип ошибок не очень опасен, поскольку наша система в действительности защищена, но модель предсказывала атаку. команда получит уведомление и проверит любую вредоносную активность. Это не причинит никакого вреда. Их можно назвать Ложной тревогой.
Итак, все ... Я надеюсь, что эта статья кое-что прояснит и ваше замешательство прояснится ... :)
Так что, если вам это нравится, похлопайте и поделитесь. И если вы хотите связаться со мной, то ниже находится ссылка на мой профиль в LinkedIn.