Некоторые архитектуры AutoML, о которых вы должны знать

Amazon, Microsoft, Salesforce, Waymo создали одни из самых инновационных архитектур AutoML на рынке.

Недавно я начал новый информационный бюллетень, посвященный образованию в области искусственного интеллекта. TheSequence - это информационный бюллетень, ориентированный на искусственный интеллект (то есть без рекламы, без новостей и т. Д.), На чтение которого уходит 5 минут. Цель состоит в том, чтобы держать вас в курсе проектов, исследовательских работ и концепций машинного обучения. Пожалуйста, попробуйте, подписавшись ниже:

TheSequence
(основные концепции машинного обучения + новаторские исследовательские работы и основы + новости и тенденции в области ИИ) x 5 минут, 3 раза в неделю =… thesequence.substack. com

AutoML становится одной из самых популярных тем в современных приложениях для обработки данных. Часто люди рассматривают AutoML как механизм использования готовых моделей машинного обучения без необходимости в сложных знаниях в области науки о данных. Хотя теоретически этот аргумент имеет смысл, но в действительности он немного отличается. На современном этапе развития искусственного интеллекта для большинства реальных приложений требуется определенный уровень знаний в области машинного обучения. Сценарии, которые вы можете решить с помощью стандартного API, такого как Watson Developer Cloud или Microsoft Cognitive Services, очень просты и представляют лишь небольшой процент от более широкого спектра сценариев машинного обучения. Если это так, то нам следует задаться вопросом, какова реальная ценность AutoML.

Соревнование

Выбор модели - один из самых сложных аспектов создания решений для машинного обучения. По иронии судьбы, несмотря на всю науку и соответствие, заложенное в приложениях машинного обучения, выбор модели остается в высшей степени субъективной задачей, которая зависит от мнения экспертов. Для любого данного сценария количество моделей машинного обучения, которые могут его решить, невероятно велико, поэтому как мы можем действительно узнать, используем ли мы наиболее оптимальную модель для работы? Хуже того, даже если мы выбрали правильную технику машинного обучения, как мы можем быть уверены, что у нас есть правильная архитектура нейронной сети? И как только мы остановились на конкретной архитектуре, как мы можем узнать правильные конфигурации гиперпараметров? Эти вопросы преследуют специалистов по данным на протяжении всего жизненного цикла приложения машинного обучения. Кроме того, чем больше точности требуется для задачи машинного обучения, тем больше времени уходит на процесс выбора модели.

Неудивительно, что процесс выбора и построения модели машинного обучения - чрезвычайно трудоемкое занятие, которое никогда не дает точного ответа. Как ни парадоксально, это тип проблемы, в которой машинное обучение превосходит других, поэтому можем ли мы проявить творческий подход и смоделировать процесс выбора архитектуры машинного обучения как саму проблему машинного обучения?

AutoML приходит на помощь

Поиск модели - это один из вариантов использования, который, кажется, идеально подходит для AutoML. Учитывая набор данных, ряд показателей оптимизации и некоторые ограничения с точки зрения времени или ресурсов, методы AutoML должны уметь оценивать десятки тысяч архитектур нейронных сетей и давать оптимальный результат. В то время как эффективные группы специалистов по науке о данных могут оценить дюжину моделей для данной проблемы, метод AutoML может быстро выполнить поиск по десяткам тысяч архитектур за относительно приемлемое время.

Использование машинного обучения для создания более совершенных моделей машинного обучения похоже на фильм про IronMan 😉 Действительно ли это происходит в реальном мире? Абсолютно! Вот некоторые из моих любимых громких примеров использования AutoML в критически важных приложениях.

АвтоГлюон

Начнем с самого нового участника группы: AutoGluon от Amazon. Функционально AutoGluon - это библиотека с открытым исходным кодом для разработчиков, создающих приложения с использованием машинного обучения с изображениями, текстом или наборами табличных данных. AutoGluon обеспечивает простой в использовании и легко расширяемый AutoML с фокусом о глубоком обучении и реальных приложениях, охватывающих изображения, текст или табличные данные. Фреймворк предназначен как для новичков в машинном обучении, так и для продвинутых экспертов. Первая версия AutoML включает некоторые из следующих возможностей:

· Быстро создавайте прототипы решений глубокого обучения для ваших данных с помощью нескольких строк кода.

· Используйте автоматическую настройку гиперпараметров, выбор модели / поиск архитектуры и обработку данных.

· Автоматически использовать самые современные методы глубокого обучения без специальных знаний.

· Легко улучшайте существующие индивидуальные модели и конвейеры данных или настраивайте AutoGluon для вашего случая использования.

Salesforce.com TransmogrifAI: мозг Эйнштейна

Einstein от Salesforce.com - одно из наиболее широко используемых приложений машинного обучения во всем мире. В конечном итоге Эйнштейн решает серию сценариев машинного обучения, таких как прогнозирование продаж или приоритезация потенциальных клиентов, которые вездесущи в приложениях для продаж и маркетинга. Однако то, что делает Эйнштейна уникальным, заключается в том, что его модели машинного обучения могут работать в совершенно разных конфигурациях Salesforce.com в режиме самообслуживания. У каждого покупателя могут быть совершенно разные схемы продаж и маркетинга, но Эйнштейн все равно может выполнять свою работу.

Магия Эйнштейна в Salesforce основана на фреймворке с открытым исходным кодом под названием TransmogrifAI. Концептуально TransmogrifAI представляет собой платформу на основе AutoML для создания моделей машинного обучения на основе наборов структурных данных (строк и столбцов). В частности, TransmogrifAI использует AutoML - это пять основных областей рабочего процесса машинного обучения:

· Вывод функций: извлечение функций из заданных наборов данных.

· Трансмогрификация: преобразование функций в числовые значения.

· Проверка функции: уменьшите размеры, выявите потенциальную предвзятость и т. Д.

· Выбор модели: поиск среди тысяч потенциальных моделей.

· Оптимизация гиперпараметров: настройка конфигурации гиперпараметров.

Учитывая влияние Salesforce.com, TransmogrifAI можно считать одним из крупнейших приложений AutoML в мире.

Azure ML: помощь разработчикам в выборе правильной модели машинного обучения

В прошлом году Microsoft Research провела эксперимент по использованию AutoML и вероятностного программирования для автоматизации выбора модели. Результаты были отражены в очень популярной исследовательской статье и представляют собой прорыв в работе. В считанные месяцы подход AutoML, впервые предложенный исследовательской группой Microsoft, был реализован в отличительном продукте машинного обучения Microsoft: Azure ML.

В последней версии Azure ML AutoML используется для упрощения выбора модели. Платформа включает службу AutoML, которая регулярно рекомендует новые конвейеры машинного обучения для оценки конкретной проблемы. Выполнение конвейера выполняется в экземпляре машинного обучения Azure клиента, в то время как служба AutoML видит только результаты и использует их, чтобы давать более точные рекомендации.

Реализация AutoML в стеке машинного обучения Azure - одна из самых полных, которые я когда-либо видел. Текущая версия поддерживает классификацию и рекомендацию модели регрессионного машинного обучения для числовых и текстовых данных, с поддержкой автоматического создания функций (включая вменения отсутствующих значений, кодирование, нормализации и функции на основе эвристики), преобразования и выбора функций. Разработчики могут использовать AutoML через Python SDK или через Jupyter Notebooks.

Waymo: автоматический выбор модели для беспилотных автомобилей

Беспилотный автомобиль - это что-то вроде большой группы моделей машинного обучения на четырех колесах 😊. Машинное обучение включает в себя все интеллектуальные функции беспилотных транспортных средств, такие как помощь машинам в том, чтобы увидеть свое окружение, разобраться в мире, предсказать, как поведут себя другие, и решить, как им лучше всего двигаться. Waymo, дочерняя компания Alphabet, находится в авангарде технологий беспилотных автомобилей и, как следствие, постоянно вводит новшества в области машинного обучения.

Недавно команда инженеров Waymo опубликовала подробный пост в блоге о том, как они используют AutoML для автоматизации выбора модели в различных приложениях машинного обучения. В частности, команда Waymo использует технику AutoML, известную как ячейки NAS, которая оказалась очень эффективной в алгоритмах анализа изображений.

В Waymo AutoML используется для изучения сотен различных комбинаций ячеек NAS в рамках сверточной сетевой архитектуры (CNN), обучения и оценки моделей для задачи сегментации LiDAR компании Waymo. В ходе эксперимента были созданы архитектуры CNN, которые работают с меньшей задержкой на 20–30% и частотой ошибок на 8–10% ниже, чем модели, созданные вручную.

Как видно из этих примеров, AutoML становится одним из важных элементов высокомасштабируемых архитектур машинного обучения. Выход Amazon на рынок, безусловно, является еще одним толчком к тому, чтобы сделать AutoML одним из ключевых компонентов архитектур машинного обучения. AutoGluon - еще один пример того, что инструменты и платформы для использования AutoML при поиске моделей становятся лучше и становятся доступными для основных разработчиков. Хотя есть и другие отличные варианты использования AutoML, выбор модели остается одним из основных преимуществ в контексте реальных приложений машинного обучения.