На этой неделе (03.01.2021–03.07.2021) я буду читать следующие две исследовательские работы.
Алгоритмы обнаружения аномалий с полууправлением: сравнительный обзор и направления будущих исследований
Авторы: Мирьям Элизабет Вилья-Переса, Мигель А. Альварес-Кармонаб, Октавио Лойола-Гонсалес, Мигель Анхель Медина-Переса, Хуан Карлос Веласко-Россельк и Ким-Кванг Рэймонд Чуд
Место проведения: Системы, основанные на знаниях
Бумага: URL
Абстрактный:
Хотя обнаружение аномалий относительно хорошо изучено, оно остается предметом постоянного интереса и вызовов, поскольку наше общество становится все более взаимосвязанным и оцифрованным. В этой статье мы сосредоточимся на существующих подходах к обнаружению аномалий, эмпирически изучив производительность 29 полуконтролируемых алгоритмов обнаружения аномалий в 95 эталонных несбалансированных базах данных из репозитория KEEL. К ним относятся хорошо зарекомендовавшие себя и часто используемые классификаторы (например, машина опорных векторов одного класса (ocSVM) и лес изоляции) и последние предложения (например, BRM и XGBOD). Результаты нашего глубокого эмпирического исследования показывают, что BRM является надежным классификатором с точки зрения достижения лучших результатов классификации, чем другие 28 современных методов для решения различных задач обнаружения аномалий. Мы также наблюдаем, что OCKRA, Isolation Forest и ocSVM обеспечивают хорошую производительность в целом AUC, но плохие результаты классификации в базах данных, где количество объектов равно или превышает 1460, все функции являются номинальными или коэффициент дисбаланса равен или превышает 39,14. .
Обнаружение аномалий: опрос
Автор: Варун Чандола, Ариндам Банерджи и Випин Кумар.
Место проведения: ACM Computing Surveys
Бумага: PDF
Абстрактный:
Обнаружение аномалий является важной проблемой, которая исследовалась в различных областях исследований и областей применения. Многие методы обнаружения аномалий были специально разработаны для определенных областей применения, в то время как другие являются более общими. В этом обзоре делается попытка предоставить структурированный и всесторонний обзор исследований по обнаружению аномалий. Мы сгруппировали существующие методы в различные категории на основе лежащего в основе подхода, принятого каждым методом. Для каждой категории мы определили ключевые допущения, которые используются в методах для различения нормального и аномального поведения. При применении данной методики к конкретной области эти допущения можно использовать в качестве рекомендаций для оценки эффективности методики в этой области. Для каждой категории мы предоставляем базовый метод обнаружения аномалий, а затем показываем, как различные существующие методы в этой категории являются вариантами основного метода. Этот шаблон обеспечивает простое и краткое понимание методов, принадлежащих к каждой категории. Кроме того, для каждой категории мы определяем преимущества и недостатки методов в этой категории. Мы также обсуждаем вычислительную сложность методов, поскольку это важный вопрос в реальных прикладных областях. Мы надеемся, что этот обзор поможет лучше понять различные направления, в которых проводились исследования по этой теме, и то, как методы, разработанные в одной области, могут быть применены в областях, для которых они изначально не предназначались.
Списки чтения за предыдущие недели:
Обо мне:
Я Дургеш Самария, доктор наук по машинному обучению 3-го года обучения. студентка FedUni, Австралия.
Подпишитесь на мою рассылку для моих еженедельных фрагментов.
В Интернете:
Следите за мной в Instagram, Kaggle, GitHub и Medium.
Спасибо, что прочитали.