Машинное обучение: реально ли это?

Ребята, вы заметили, какой статус у машинного обучения "раскручен"? Люди все чаще говорят о машинном обучении. Но знаете ли вы, что такое машинное обучение? Вы знакомы с его процессами?

Для тех, у кого нет: ну, вам повезло! Я сделаю все возможное, чтобы в конце этого поста вы могли хотя бы немного поболтать об ML.

Для ненормальных: Подождите, пока не уходите, потому что у меня есть для вас особая тема! (:

Несмотря на то, что все сначала представляют себе, машинное обучение имеет очень четкое определение. YEAP, вы меня правильно поняли, концепция этой штуки проста, хотя вы можете делать некоторые сложные вещи.

Начнем с определения, созданного в 1959 году Артуром Сэмюэлем:

"Машинное обучение: область исследования, которая дает компьютерам возможность обучаться без явного программирования".

Видеть? Это не так сложно, не так ли?

Есть более солидное определение, которое мне тоже нравится, его дал Адам Гейтгей:

«Машинное обучение — это идея о том, что существуют общие алгоритмы, которые могут рассказать вам что-то интересное о наборе данных без необходимости писать какой-либо специальный код, специфичный для проблемы. Вместо того, чтобы писать код, вы вводите данные в общий алгоритм, и он строит собственную логику на основе этих данных».

Я считаю, что только с этим высокоуровневым примером вы получите все процессы машинного обучения, но на всякий случай я также немного объясню.

Алгоритм ML необходимо тренировать, чтобы он мог построить модель, которая представляет собой функцию, которая помогает алгоритму делать прогнозы и начинать работать самостоятельно. Обычно прогнозы, сделанные алгоритмом ML, оцениваются, и, если они удовлетворительны, их можно использовать для повторного обучения и улучшения алгоритма.

Контролируемый и неконтролируемый подход

При машинном обучении под наблюдением вам необходимо «накормить» алгоритм информацией и действовать в качестве руководства, чтобы сказать, какие выводы он должен сделать из предоставленных данных.

Неконтролируемое машинное обучение ближе к тому, что вы можете получить из таких фильмов, как «Терминатор» и «Ex-Machina», изначально алгоритм не знает, что правильно, а что нет, но может научиться определять процессы и закономерности без чьего-либо руководства.

Если вам нравятся подобные вещи, искусственный интеллект и роботы, которые перехитрили нас, вам следует немного почитать о технологической сингулярности.

Теперь, когда вы знаете, что такое машинное обучение и как оно работает, вы должны спросить себя: Но такие вещи существовали всегда, люди всегда знали, что все это возможно, так почему же сейчас это так раскручено?

Этот ажиотаж происходит по следующим причинам:

Никогда еще у нас не было столько информации в цифровом виде.
Вычислительные мощности и объемы хранения постоянно растут, а затраты снижаются.
Исследователи модернизировали некоторые алгоритмы, и теперь, когда они повысили его производительность, люди могут использовать всю свою вычислительную мощность.

Вот 10 лучших вариантов использования машинного обучения, составленный журналом Forbes:

Безопасность данных
Личная безопасность
Финансовая торговля
Здравоохранение
Маркетинговая персонализация
Обнаружение мошенничества
Рекомендации
Он-лайн поиск
Обработка естественного языка
Умные автомобили

И вот тут начинается самое интересное, помните, я говорил вам, что у меня есть особая тема на вечер? Теперь я, наконец, могу говорить об этом. Поскольку в настоящее время меня интересует кибербезопасность, я собираюсь рассказать о 3 из 10 приведенных выше случаев: безопасность данных, личная безопасность и обнаружение мошенничества.

Хороший вопрос: Как можно применить машинное обучение к кибербезопасности?

Используя машинное обучение под наблюдением, вы сможете решать такие задачи, как:

Спам
Интернет-мошенничество
Вредоносное ПО
Вредоносные URL-адреса/домены/IP-адреса

Это простые вопросы ДА/НЕТ, и они используются годами, в этом нет ничего нового.

С помощью неконтролируемого машинного обучения вы найдете ответы на такие вопросы, как:

Есть ли значительный объем странного сетевого трафика, исходящего от определенного хоста?
Получает ли пользователь доступ к вещам, к которым он обычно не имеет доступа?
Пользователь работает в другое время, чем обычно?
Получает ли пользователь доступ или к нему обращается ненормальный объект со странным географическим местоположением?

Одним из замечательных инструментов, которые могут использовать преимущества контролируемого и неконтролируемого машинного обучения в области кибербезопасности, является система обнаружения вторжений, которая отслеживает, выявляет и уведомляет о возникновении вредоносных или несанкционированная активность, которая подвергает вашу сеть риску. IDS использует детекторы на основе сигнатур, ранее вставленных в базу данных. Хотя в настоящее время IDS эффективны при обнаружении известных эксплойтов, они не так эффективны при распознавании новых атак или даже старых атак с некоторыми изменениями. Как видите, машинное обучение может быть очень полезным ресурсом. Sopho’s подчеркнула некоторые моменты, почему это предложение можно считать верным:

Модели нейронных сетей с глубоким обучением обеспечивают лучшее обнаружение и меньшее количество ложных срабатываний.
Он искореняет код, который имеет общие характеристики с известными вредоносными программами, но чьи сходства часто ускользают от человеческого анализа.
Обнаружение на основе поведения обеспечивает обширный охват тактики и методов, используемых продвинутыми злоумышленниками.

Но, как и у любой другой технологии, у ML есть и недостатки. Вы должны быть осторожны, потому что модели полностью зависят от хороших данных, и как только вы снабдите их сомнительными/предвзятыми данными, вы получите совершенно бесполезные результаты.

Кроме того, алгоритм может принять неверное решение, например классифицировать вредоносные данные как чистые или заблокировать законный элемент. Ведь люди такие непредсказуемые, правда? Вы можете просто опоздать со своими дедлайнами и работать допоздна. Прибавляя ко всему этому тот факт, что машинное обучение еще относительно новое явление, нет никакой гарантии, что в очень ближайшем будущем машинное обучение решит все проблемы безопасности.

Как видите, машинное обучение можно применять почти во всех областях, но, поскольку данные трудно содержать в чистоте, а машинное обучение находится на первых этапах, только несколько областей могут действительно использовать преимущества этой технологии.

Машинное обучение: реально ли это?

Контролируемый и неконтролируемый подход

Использованная литература:

Вопросы по теме