Эли Дэвид, соучредитель и технический директор Deep Instinct

За последние несколько лет глубокое обучение произвело революцию почти во всех областях, в которых оно применялось, что привело к величайшему скачку производительности в истории информатики.

Из-за множества проблем, которые мы привыкли видеть небольшие, постепенные улучшения каждый год, теперь мы наблюдаем улучшения на 20–30% в течение нескольких месяцев благодаря применению глубокого обучения.

Этот успех также вызвал много шума в СМИ и PR, в результате чего в наши дни термины «искусственный интеллект», «машинное обучение» и «глубокое обучение» используются очень широко, и чаще всего неточно и запутанно.

Важно, чтобы мы попытались прояснить и демистифицировать различие между этими техническими терминами, а затем сосредоточились на их применении в области кибербезопасности.

AI

Искусственный интеллект (ИИ) - это выражение, придуманное новатором в области информатики Джоном Маккарти в 1950-х годах, является общим термином для всех методов и дисциплин, которые приводят к любой форме интеллекта, проявляемой машинами.

Это включает в себя все, что угодно, от экспертных систем 1980-х годов (в основном наборы данных с жестко закодированными знаниями) до самых передовых форм ИИ 2010-х годов.

Сегодня почти все программное обеспечение во всех отраслях использует хотя бы некоторую форму искусственного интеллекта, даже если он ограничен некоторыми базовыми процедурами, закодированными вручную.

Машинное обучение

Машинное обучение в настоящее время является ведущей областью искусственного интеллекта. Это позволяет компьютерам учиться без явного программирования.

Методы, основанные на машинном обучении, полностью доминировали в ИИ в 2000-х годах и превзошли все результаты, не основанные на машинном обучении.

Несмотря на успех, одним из основных ограничений традиционного машинного обучения является его зависимость от извлечения признаков, процесса, с помощью которого эксперты-люди определяют важные особенности (то есть свойства) каждой проблемы.

Например, при применении машинного обучения к распознаванию лиц необработанные пиксели изображения не могут быть переданы в модуль машинного обучения, но вместо этого они должны быть сначала преобразованы в такие функции, как расстояние между зрачками, пропорции лица, текстура, цвет и т. Д. и Т. Д.

Эта фаза извлечения признаков в основном приводит к тому, что большая часть необработанных данных игнорируется, а выбранные функции, какими бы хорошими они ни были, пропускают значительные нелинейности в данных.

Глубокое обучение

Глубокое обучение, также известное как «глубокие нейронные сети», является подразделом машинного обучения и черпает вдохновение в том, как работает наш мозг.

Большое концептуальное различие между глубоким обучением и традиционным машинным обучением заключается в том, что глубокое обучение является первым и в настоящее время единственным методом обучения, который может обучаться непосредственно на необработанных данных (например, пикселях в нашем примере распознавания лиц) без какой-либо необходимости. для извлечения признаков.

Кроме того, глубокое обучение хорошо масштабируется до сотен миллионов обучающих выборок и постоянно улучшается по мере того, как обучающий набор данных становится все больше и больше.

Ошеломляющий успех

За последние несколько лет глубокое обучение улучшилось на 20–30% по большинству тестов компьютерного зрения, распознавания речи и понимания текста - это величайший скачок в производительности в истории искусственного интеллекта и информатики.

Два основных фактора способствовали внезапному ошеломляющему успеху глубокого обучения.

Во-первых, улучшение алгоритмов. Еще несколько лет назад мы могли обучать мелкие нейронные сети, а более глубокие сети не могли сойтись из-за алгоритмических ограничений.

Сегодня улучшенные методы обучения позволяют успешно обучать очень глубокие нейронные сети, состоящие из многих десятков слоев и миллиардов синапсов (соединителей между нейронами).

Второй и более важный фактор - это использование графических процессоров.

В настоящее время все обучение глубокому обучению проводится на графических процессорах Nvidia, в результате чего скорость в 100 раз выше, чем у альтернативного оборудования (для сравнения, мозг глубокого обучения, обучение которого на процессорах займет более трех месяцев, можно обучить примерно за один день с использованием графических процессоров).

Несмотря на успех глубокого обучения во многих задачах, барьер для входа в глубокое обучение остается высоким, в основном из-за нехватки исследователей и ученых, занимающихся глубоким обучением, которые имеют решающее значение для его успешного применения.

ИИ и кибербезопасность

Ежедневно создается более одного миллиона новых вредоносных программ и постоянно возрастает изощренность этих вредоносных программ, поэтому задача обнаружения остается очень сложной.

Традиционные решения на основе сигнатур могут обнаруживать только известные в настоящее время вредоносные программы, а любые известные вредоносные программы могут быть легко видоизменены, что позволяет избежать их обнаружения. Чтобы справиться с этой растущей трудностью, многие решения для кибербезопасности сегодня используют ту или иную форму ИИ.

Подходы на основе эвристики предлагают ограниченное улучшение в этой области; следовательно, самые передовые решения в области кибербезопасности прибегают к машинному обучению.

Используя машинное обучение, можно обучать большие наборы данных файлов, которые могут автоматически научиться отделять вредоносные от легитимных файлов таким образом, который не под силу никаким ручным или полуавтоматическим методам.

Как избежать обнаружения

Несмотря на существенные улучшения в области кибербезопасности благодаря машинному обучению, сложным вредоносным программам по-прежнему удается относительно легко ускользать от обнаружения.

При применении традиционного машинного обучения необходимо сначала преобразовать компьютерные файлы из необработанных байтов в список функций (например, важные вызовы API и т. Д.), И только затем этот список функций вводится в модуль машинного обучения.

Даже если сотни или тысячи функций рассматриваются экспертами-людьми, они все равно представляют лишь часть необработанных данных в файлах; в результате этого файлы могут быть легко видоизменены, чтобы избежать обнаружения этими линейными высокоуровневыми функциями.

Подобно применению глубокого обучения в других областях, его применение к кибербезопасности позволяет напрямую обрабатывать содержимое файлов без извлечения каких-либо функций.

То есть входом в мозг глубокого обучения являются необработанные байтовые значения, независимо от формата файла, размера файла или даже операционной системы.

Постоянное улучшение

Кроме того, в отличие от традиционного машинного обучения, которое достигает потолка производительности по мере увеличения количества файлов, на которых оно обучается, глубокое обучение может эффективно улучшаться по мере роста наборов данных до сотен миллионов вредоносных и легитимных файлов.

Результаты тестов, которые сравнивают производительность глубокого обучения с традиционным машинным обучением в области кибербезопасности, показывают, что глубокое обучение приводит к значительно более высокому уровню обнаружения и более низкому уровню ложных срабатываний.

Эти результаты согласуются с большим приростом производительности, полученным за счет применения глубокого обучения в других областях.

Поскольку разработчики вредоносных программ используют более продвинутые методы для создания новых вредоносных программ, разрыв между уровнем обнаружения глубокого обучения и традиционного машинного обучения будет увеличиваться; и в ближайшие годы будет критически важно полагаться на глубокое обучение, чтобы иметь реальный шанс предотвратить самые изощренные атаки.

Чтобы получить дополнительную информацию о классе пионеров технологий 2017 года, посетите наш веб-сайт.

Вы читали?

Первоначально опубликовано на www.weforum.org.