Выиграть золотую медаль на Олимпийских играх, пожалуй, самое большое достижение, которого можно достичь в спорте. Однако мы считаем, что в науке о данных есть задача еще более серьезная, чем победа в соревновании; и это проектирование привлекательного.

Несколько месяцев назад в этом году мы были заняты интеграцией поведенческих биометрических возможностей в наш продукт для анализа поведения пользователей. Чтобы обнаружить несанкционированное использование учетных записей пользователей, мы используем методы, которые анализируют динамику движений мыши и клавиш. Таким образом, даже если злоумышленники попытаются подражать владельцу взломанной ими учетной записи, они потерпят неудачу, потому что никто на самом деле не способен имитировать использование мыши и клавиатуры определенного человека.

Нам очень нравилось разрабатывать такие алгоритмы. Мы также обнаружили, что биометрическая аутентификация является активной областью исследований, проводимых профессионалами в академических кругах и в индустрии безопасности. Поделиться нашим волнением и данными с сообществом, казалось, было прекрасной возможностью для осуществления нашей мечты о разработке задачи по науке о данных. Так родилась идея Balabit Mouse Dynamics Challenge.

Мы сформулировали задачу и предоставили набор данных для ее решения. Цель испытания состояла в том, чтобы защитить группу пользователей от несанкционированного использования их учетных записей, изучив особенности того, как они используют свои мыши. С марта по май несколько команд изо всех сил пытались оценить аномальность журналов аудита тестов на основе файлов журналов, предоставленных для обучения моделей.

Наш набор данных о движении курсора и более подробное описание можно найти на странице https://github.com/balabit/Mouse-Dynamics-Challenge.

Мы надеемся, что вы получите такое же удовольствие от изучения наших данных, как и мы. Вы даже можете оценить свое решение с помощью части меток тестовых маршрутов.

Удалось ли нам решить захватывающую задачу? Мы получили положительные отзывы от конкурсантов. Нам удалось поставить задачу так, что она была требовательной, но, увидев производительность моделей, не невыполнимой. До сих пор никто не сообщал о каких-либо утечках информации, которые могли бы привести к непреднамеренному значительному улучшению производительности (что, очевидно, не означает, что их нет). В целом, мы считаем, что это достойная работа, которой мы рады поделиться. Наслаждаться!

Первоначально опубликовано на www.balabit.com 26 августа 2016 г. автором Арпадом Фюлопом.