Что такое AutoML? [Часть 1]

За последнее десятилетие быстрый рост машинного обучения (МО) и его потенциально высокая окупаемость инвестиций (ROI) привели к проникновению приложений на основе МО в различные отрасли и вызвали значительный спрос. для экспертных ресурсов машинного обучения среди всех технических областей.

1) сложность этих моделей машинного обучения, 2) длительные процессы разработки и развертывания моделей и 3) требуемые дорогостоящие инвестиции в человеческие ресурсы (в качестве специалистов по данным и инженеров машинного обучения) вызвали противоречия по поводу потенциального уровень ROI, полученный в результате приложений ML. Автоматизированное машинное обучение (AutoML) решает эти противоречия, автоматизируя сквозные процессы машинного обучения.

Что такое AutoML?

Обычные процессы машинного обучения состоят из трех основных компонентов: обработка данных, разработка модели и развертывание модели. Обработка данных относится к процессам очистки и нормализации данных, а также к выбору правильных функций для ввода в модель. Разработка модели состоит из выбора семейства алгоритмов, ввода обучающих данных в модель, настройки параметров и, наконец, оценки модели.

Обработка данных и разработка моделей — это итерационные процессы с 1) различными алгоритмами, 2) различными наборами функций и 3) различными параметрами для поиска наиболее оптимальной модели. В результате они чрезвычайно трудоемки и ресурсоемки.

Чтобы улучшить эти два процесса, в AutoML есть:

1) представил автоматизацию сквозных итерационных процессов от обработки данных (очистка/нормализация и выбор признаков) до поиска/разработки модели (выбор модели, настройка гиперпараметров и оценка модели).

Эта автоматизация обеспечивает параллельную разработку/оценку моделей с различными алгоритмами, функциями и параметрами в автоматическом режиме. И, следовательно, он позволяет оценивать модели наиболее эффективным способом, без необходимости ручного изучения данных учеными/инженерами по машинному обучению.

Применительно к глубокому обучению AutoML/DL позволит автоматически находить правильную архитектуру глубокой нейронной сети. Это включает в себя несколько итераций для изучения нужного количества слоев и нейронов без необходимости ручного исследования специалистами по обработке данных/инженерами машинного обучения.

2) упростил весь процесс, чтобы уменьшить потребность в глубоких технических экспертах, сохраняя при этом высокую точность модели.

Каковы преимущества AutoML?

В дополнение к эффективности, которую они создают, AutoML направлен на создание простых для понимания и использования платформ, позволяющих пользователям, отличным от специалистов по данным и инженеров ML, разрабатывать и развертывать модели ML. К этим персонам относятся менеджеры по продуктам, аналитики данных, инженеры-программисты и бизнес-аналитики, которые стремятся решить деловую/техническую проблему с помощью машинного обучения.

Таким образом, AutoML создает следующие значения:

  1. Ускорение выхода на рынок (TTM): за счет автоматизации сквозных процессов.
  2. Экономия средств: за счет устранения необходимости в дорогостоящих технических ресурсах.
  3. Сокращение ошибок: удаление ручных итераций при разработке и оценке.

Каковы популярные примеры AutoML?

Одним из первых пакетов AutoML, с которым я познакомился, был AutoWEKA (поскольку его можно было комбинировать с WEKA). Другими популярными пакетами являются TIPOT, разработанный на основе scikit-learn, и MLBox, разработанный в Массачусетском технологическом институте. Два популярных решения для глубокого обучения — Auto-PyTorch, распространяемый по лицензии Apache, и AutoKeras, разработанный в Texas M&A.

В последние годы крупные корпорации, такие как Amazon, Google и Microsoft, также вложили значительные средства в AutoML. В следующей статье я хотел бы представить решения AutoML от этих корпораций.

Первоначально опубликовано наhttps://www.linkedin.com/pulse/what-automl-part-1-niousha-zadeh/.