MLOps обещает обеспечить управляемость всего процесса машинного обучения для производственных сценариев использования благодаря передовым методам разработки программного обеспечения.
Проблем в MLOps много:
- Различные роли сотрудничают для создания варианта использования ML. Например, домен SME, инженер данных, специалисты по данным, операционная группа, служба безопасности и так далее.
- Понимание и последующая совместная работа над большим количеством источников данных, часто посредством сложного процесса подготовки большого объема наборов данных.
- Отслеживание исходных данных, функций, экспериментов ML, версий модели, гиперпараметров, характеристик модели
- При запуске моделей в производство также возникает множество проблем, таких как производительность модели, мониторинг, масштабирование, развертывание версий A/B, управление дрейфом и т. д.
- Сложность среды, например, библиотеки, контроль доступа и безопасность, также не является тривиальной.
Ниже представлено схематическое изображение элементов MLOps.
Почему сложно внедрить MLOps?
MLOps трудно внедрить с окончательным представлением, потому что текущие платформы машинного обучения и варианты инструментов все еще развиваются быстрыми темпами. Ни одна платформа или инструмент не способны одинаково решать все задачи на протяжении всего жизненного цикла машинного обучения и для различных вариантов использования машинного обучения, которые существуют сегодня. Процесс разработки вариантов использования машинного обучения и процессы обработки данных сегодня чрезвычайно разнообразны. Потребности в стоимости и производительности производственной среды часто требуют еще одного подхода для развертывания и эксплуатации моделей в масштабе. Принятие соответствующего подхода MLOps для организации должно учитывать различные элементы людей, процессов, инструментов, затрат и согласования с бизнесом.