Подпишитесь на Квантификаторы для статей по финансам и аналитике
Что такое AutoML?
Автоматизированное машинное обучение (AutoML) — это метод, с помощью которого мы можем обучать высококачественные модели машинного обучения, даже не имея опыта в области машинного обучения.
Зачем нам нужен AutoML?
- Найти подходящую модель машинного обучения может быть непросто. Это может стать еще более сложным, когда есть конкретный бизнес-сценарий.
- Все коммерческие предприятия могут не быть экспертами в области машинного обучения, а использование сторонних услуг или наем инженеров по обработке данных может быть дорогостоящим.
Как AutoML решает эти проблемы?
- AutoML позволяет каждому создавать модели машинного обучения, устраняя пробелы в навыках.
- Используя AutoML, мы можем уменьшить количество ошибок, вызванных ручной работой.
- Это позволяет автоматизировать несколько задач.
Какие существуют популярные способы поиска в AutoML Frameworks?
У нас есть два различных фреймворка
- Для поиска возможных моделей из традиционных алгоритмов ML
- Чтобы выполнить поиск нейронной сети
Как использовать AutoML?
Результаты, полученные с помощью AutoML, могут дать представление о моделях, которые можно использовать, или о наборе важных функций. Однако брать модель в производство напрямую не рекомендуется.
Параметры, которые необходимо указать при поиске модели с помощью AutoML
Максимальное время выполнения — указывает время, необходимое для эксперимента.
Максимальная модель — указывает максимальное количество моделей, которые должны быть построены.
Остановка метрик и допусков — здесь мы указываем критерии допусков и такие метрики, как RMSE, ROC.
Показатели сортировки. Они помогают определить метод, с помощью которого мы можем сортировать таблицу лидеров, содержащую информацию о подходящих моделях.
Исключить алгоритмы — мы можем решить, какие алгоритмы мы хотим исключить во время поиска модели. Например — мы можем исключить модели глубокого обучения
Включить алгоритмы. Мы можем решить, какие алгоритмы мы хотим включить во время поиска модели. Например — мы можем включить дерево решений и XGBoost
Предварительная обработка. Мы можем упомянуть шаги, которые мы хотим выполнить при предварительной обработке данных. Это может быть одно горячее кодирование, масштабирование и т.д.