На этой неделе (03.01.2021–03.07.2021) я буду читать следующие две исследовательские работы.

Алгоритмы обнаружения аномалий с полууправлением: сравнительный обзор и направления будущих исследований

Авторы: Мирьям Элизабет Вилья-Переса, Мигель А. Альварес-Кармонаб, Октавио Лойола-Гонсалес, Мигель Анхель Медина-Переса, Хуан Карлос Веласко-Россельк и Ким-Кванг Рэймонд Чуд

Место проведения: Системы, основанные на знаниях

Бумага: URL

Абстрактный:

Хотя обнаружение аномалий относительно хорошо изучено, оно остается предметом постоянного интереса и вызовов, поскольку наше общество становится все более взаимосвязанным и оцифрованным. В этой статье мы сосредоточимся на существующих подходах к обнаружению аномалий, эмпирически изучив производительность 29 полуконтролируемых алгоритмов обнаружения аномалий в 95 эталонных несбалансированных базах данных из репозитория KEEL. К ним относятся хорошо зарекомендовавшие себя и часто используемые классификаторы (например, машина опорных векторов одного класса (ocSVM) и лес изоляции) и последние предложения (например, BRM и XGBOD). Результаты нашего глубокого эмпирического исследования показывают, что BRM является надежным классификатором с точки зрения достижения лучших результатов классификации, чем другие 28 современных методов для решения различных задач обнаружения аномалий. Мы также наблюдаем, что OCKRA, Isolation Forest и ocSVM обеспечивают хорошую производительность в целом AUC, но плохие результаты классификации в базах данных, где количество объектов равно или превышает 1460, все функции являются номинальными или коэффициент дисбаланса равен или превышает 39,14. .

Обнаружение аномалий: опрос

Автор: Варун Чандола, Ариндам Банерджи и Випин Кумар.

Место проведения: ACM Computing Surveys

Бумага: PDF

Абстрактный:

Обнаружение аномалий является важной проблемой, которая исследовалась в различных областях исследований и областей применения. Многие методы обнаружения аномалий были специально разработаны для определенных областей применения, в то время как другие являются более общими. В этом обзоре делается попытка предоставить структурированный и всесторонний обзор исследований по обнаружению аномалий. Мы сгруппировали существующие методы в различные категории на основе лежащего в основе подхода, принятого каждым методом. Для каждой категории мы определили ключевые допущения, которые используются в методах для различения нормального и аномального поведения. При применении данной методики к конкретной области эти допущения можно использовать в качестве рекомендаций для оценки эффективности методики в этой области. Для каждой категории мы предоставляем базовый метод обнаружения аномалий, а затем показываем, как различные существующие методы в этой категории являются вариантами основного метода. Этот шаблон обеспечивает простое и краткое понимание методов, принадлежащих к каждой категории. Кроме того, для каждой категории мы определяем преимущества и недостатки методов в этой категории. Мы также обсуждаем вычислительную сложность методов, поскольку это важный вопрос в реальных прикладных областях. Мы надеемся, что этот обзор поможет лучше понять различные направления, в которых проводились исследования по этой теме, и то, как методы, разработанные в одной области, могут быть применены в областях, для которых они изначально не предназначались.

Списки чтения за предыдущие недели:

Список чтения на неделю №11

Список чтения на неделю №10

Список чтения на неделю №9

Список чтения на неделю №8

Список чтения на неделю №7

Список чтения на неделю №6

Список чтения на неделю №5

Список чтения на неделю №4

Список чтения на неделю №3

Список чтения на неделю №2

Список чтения на неделю №1

Обо мне:

Я Дургеш Самария, доктор наук по машинному обучению 3-го года обучения. студентка FedUni, Австралия.

Подпишитесь на мою рассылку для моих еженедельных фрагментов.

В Интернете:

Следите за мной в Instagram, Kaggle, GitHub и Medium.

Спасибо, что прочитали.