С выпуском AutoGluon AWS теперь предлагает как управляемое, так и автоматизированное машинное обучение на своей облачной платформе.

AWS отреагировала на разработки своих конкурентов в области глубокого обучения AutoML, внедрив AutoGluon во все свои облачные сервисы машинного обучения. Фреймворк основан на существующих фреймворках, чтобы обеспечить сфокусированное модульное решение для изучения того, как каждый цифровой мозг формируется для конкретной учебной задачи. Однако при аналогичных разработках в этой сфере возникает главный вопрос. Играют ли они за команду разработчиков открытого исходного кода или просто хотят заставить всех использовать программное обеспечение, которое они контролируют?

В любом случае, давайте рассмотрим происхождение Автоглюона, чтобы полностью понять его положение в пространстве.

MXNet

MXNet, еще один проект Apache, является выбранной платформой архитектуры глубокого обучения для Amazon. Хотя существует несколько других подобных фреймворков, Amazon заслуживает похвалы за пожертвование проекта Apache Software Foundation. Это согласуется с некоторыми основными целями сотрудничества с открытым исходным кодом, которые заключаются в стандартизации и снижении планки для аналогичных усилий.

Глюон

Gluon, обязательная программная среда для моделей глубокого обучения, запущенная в 2017 году AWS и Microsoft, направлена ​​на то, чтобы навести порядок в хаосе множества похожих, но разных программных библиотек для машинного обучения.

Кроме того, Apache-природа проекта Gluon привела к созданию фантастических учебных материалов. Его главный веб-сайт содержит постоянно растущее количество уроков и примеров от классического машинного обучения до стандартного глубокого обучения и байесовского глубокого обучения. У авторов довольно интригующая цель:

Насколько нам известно, не существует источника, который преподавал бы либо (1) всю широту концепций современного глубокого обучения, либо (2) чередовал бы увлекательный учебник с исполняемым кодом. К концу этого предприятия мы выясним, существует ли эта пустота по уважительной причине.

АвтоГлюон

AutoGluon теперь накладывается поверх MXNet и Gluon, предлагая автоматическое обучение нейронных сетей для заданного текста, изображения или табличных данных. Библиотека включает несколько современных алгоритмов для поиска нейронной архитектуры (NAS), как для традиционных архитектур глубокого обучения, так и для агентов обучения с подкреплением. Если вас интересуют основные принципы этого подхода, см. Статью Хесуса Родригеса о Medium.

Работаем вместе, но по отдельности?

Естественно, AWS также упростила использование AutoGluon в своей платформе машинного обучения Sagemaker. Однако, несмотря на сотрудничество AWS и Microsoft над Gluon, они, в частности, создали свои собственные библиотеки NAS. Буквально в прошлом месяце Microsoft открыла исходный код Project Petridish, библиотеки прямого поиска по архитектуре. Что наиболее важно, хотя в конечном итоге они могут улучшить совместимость между облаками, обе библиотеки в настоящее время тесно связаны со своими соответствующими облаками.

На приведенном выше рисунке показано, как крупные компании развертывают все больше программных библиотек, надеясь, что разработчики будут придерживаться своей. Кроме того, существует явный недостаток прямой попытки совместимости между ними. Это не столько «привет всем, давайте все поделимся этим», сколько «привет всем, используйте наши, а не их». Это напоминает мне битву между телефонными операторами. Скольким из вас нравились попытки синхронизировать телефон Android с чем-то на основе iCloud или наоборот?

Запачкать руки

Готовы попробовать библиотеку? Независимо от того, выполняете ли вы развертывание локально или в облаке, вот несколько вариантов, в которые можно погрузиться:

Предварительно обученные модели

Возьмите с полки одну из предварительно обученных моделей и примените ее к своей задаче! Поддерживающий код для повторного обучения той же модели также предоставляется для воспроизводимости.

Kaggle

Kaggle решает большинство проблем с машинным обучением на практике. Платформа предлагает способы учиться, сотрудничать и соревноваться с другими с помощью открытых наборов данных, общих рабочих мест и официальных соревнований. В документации AutoGluon есть несколько фрагментов для быстрого применения AutoGluon в рабочих пространствах Kaggle.

Sagemaker

Платформа Sagemaker значительно улучшилась в 2019 году, предлагая то, что, по заявлению AWS, является первой настоящей IDE для машинного обучения в Sagemaker Studio. Пока еще рано говорить окончательно, но эта платформа подает большие надежды.

Я просто пытаюсь не отставать

Для тех, кто хочет просто идти в ногу с разработками в области поиска по нейронной архитектуре, automl.org очень хорошо справляется с развитием событий.

Первоначально опубликовано на https://lifewithdata.org 25 января 2020 г.