Подпишитесь на Квантификаторы для статей по финансам и аналитике

Что такое AutoML?

Автоматизированное машинное обучение (AutoML) — это метод, с помощью которого мы можем обучать высококачественные модели машинного обучения, даже не имея опыта в области машинного обучения.

Зачем нам нужен AutoML?

  • Найти подходящую модель машинного обучения может быть непросто. Это может стать еще более сложным, когда есть конкретный бизнес-сценарий.
  • Все коммерческие предприятия могут не быть экспертами в области машинного обучения, а использование сторонних услуг или наем инженеров по обработке данных может быть дорогостоящим.

Как AutoML решает эти проблемы?

- AutoML позволяет каждому создавать модели машинного обучения, устраняя пробелы в навыках.

- Используя AutoML, мы можем уменьшить количество ошибок, вызванных ручной работой.

- Это позволяет автоматизировать несколько задач.

Какие существуют популярные способы поиска в AutoML Frameworks?

У нас есть два различных фреймворка

  1. Для поиска возможных моделей из традиционных алгоритмов ML
  2. Чтобы выполнить поиск нейронной сети

Как использовать AutoML?

Результаты, полученные с помощью AutoML, могут дать представление о моделях, которые можно использовать, или о наборе важных функций. Однако брать модель в производство напрямую не рекомендуется.

Параметры, которые необходимо указать при поиске модели с помощью AutoML

Максимальное время выполнения — указывает время, необходимое для эксперимента.

Максимальная модель — указывает максимальное количество моделей, которые должны быть построены.

Остановка метрик и допусков — здесь мы указываем критерии допусков и такие метрики, как RMSE, ROC.

Показатели сортировки. Они помогают определить метод, с помощью которого мы можем сортировать таблицу лидеров, содержащую информацию о подходящих моделях.

Исключить алгоритмы — мы можем решить, какие алгоритмы мы хотим исключить во время поиска модели. Например — мы можем исключить модели глубокого обучения

Включить алгоритмы. Мы можем решить, какие алгоритмы мы хотим включить во время поиска модели. Например — мы можем включить дерево решений и XGBoost

Предварительная обработка. Мы можем упомянуть шаги, которые мы хотим выполнить при предварительной обработке данных. Это может быть одно горячее кодирование, масштабирование и т.д.