MLOps обещает обеспечить управляемость всего процесса машинного обучения для производственных сценариев использования благодаря передовым методам разработки программного обеспечения.

Проблем в MLOps много:

  • Различные роли сотрудничают для создания варианта использования ML. Например, домен SME, инженер данных, специалисты по данным, операционная группа, служба безопасности и так далее.
  • Понимание и последующая совместная работа над большим количеством источников данных, часто посредством сложного процесса подготовки большого объема наборов данных.
  • Отслеживание исходных данных, функций, экспериментов ML, версий модели, гиперпараметров, характеристик модели
  • При запуске моделей в производство также возникает множество проблем, таких как производительность модели, мониторинг, масштабирование, развертывание версий A/B, управление дрейфом и т. д.
  • Сложность среды, например, библиотеки, контроль доступа и безопасность, также не является тривиальной.

Ниже представлено схематическое изображение элементов MLOps.

Почему сложно внедрить MLOps?

MLOps трудно внедрить с окончательным представлением, потому что текущие платформы машинного обучения и варианты инструментов все еще развиваются быстрыми темпами. Ни одна платформа или инструмент не способны одинаково решать все задачи на протяжении всего жизненного цикла машинного обучения и для различных вариантов использования машинного обучения, которые существуют сегодня. Процесс разработки вариантов использования машинного обучения и процессы обработки данных сегодня чрезвычайно разнообразны. Потребности в стоимости и производительности производственной среды часто требуют еще одного подхода для развертывания и эксплуатации моделей в масштабе. Принятие соответствующего подхода MLOps для организации должно учитывать различные элементы людей, процессов, инструментов, затрат и согласования с бизнесом.