В проекте MLOps не имеет значения, насколько высока точность, пока модель не работает в реальной среде. Работа специалиста по данным не ограничивается только разработкой моделей. Даже 80 % фазы разработки модели тратится на работу с данными, и, несмотря на это, некоторые компании могут запрашивать обработку данных, анализ данных, количество операций и обработку данных у одного человека.

После разработки модели пришло время развернуть модель. Есть три известных способа сделать это. Это; Онлайн, потоковые и пакетные методы.

  • Онлайн
    1. API
    а. FastAPI
    б. Колба
  • Потоковая передача
    а. Кафка + Spark Стриминг
  • Пакет
    а. Пакетные прогнозы для Excel, csv или DB.

Только 22% разработанных моделей используются и 4% используемых моделей могут быть перенесены в производственную среду. Только 22% разработанных моделей используются и 4% используемых моделей могут быть перенесены в живую среду. Причины этого провала кроются не только в технической, но и в организационной культуре, организационной структуре, низком уровне осведомленности и знаний, если предположить, что все закончилось развертыванием модели.

MLOps на самом деле является концепцией, полученной из DevOps. MLOps не относится к какому-либо инструменту или программному обеспечению. Он объединяет лучшие практики машинного обучения, DevOps и Data Engineering.

  • Строить
  • Автоматизировать
  • Тест
  • Монитор

Мы делаем эти четыре операции следующим образом;

  • CI = непрерывная интеграция. Когда какой-либо разработчик вносит малейшее изменение, если эта интеграция автоматически отражается в производственной среде, это называется CI.
  • CD = непрерывная доставка. Он охватывает часть от репозитория до среды продукта.
  • Часть, в которой MLOps отличается от DevOps, — это части непрерывного обучения и непрерывного тестирования. В части DevOps нет необходимости в постоянном обучении модели. Поскольку нет модели машинного обучения, нет такого понятия, как переобучение модели, а программное обеспечение работает детерминированным образом. В тестовой части необходимо проверить, работает модель или нет. Поэтому требуется постоянное тестирование.

Подводя итог, проекты DevOps для машинного обучения называются MLOps.

Кто будет выполнять работу MLOps?

Инженеры машинного обучения выполняют работу DevOps в части машинного обучения. Конечно, они варьируются в зависимости от пожеланий компаний. Инженер машинного обучения — это тот, кто компетентен в разработке, создании, тестировании и обслуживании производственных программных приложений, которые интегрируют службы ИИ и включают модель науки о данных.

Конвейеры машинного обучения

MLOps ориентирован на конвейер. Разверните конвейер, а не модель.

Значения этих терминов, упомянутых выше, следующие;

CI (непрерывная интеграция): проверка данных, а не только кода и модели.

CD (непрерывная доставка): часть конвейера доставки.

CT (непрерывное обучение): модели автоматически переобучаются и контролируются.

MLOps имеет уровень зрелости. Уровень автоматизации в основном определяет уровень зрелости.

  • Уровень 0
  • Уровень 1
  • Уровень 2 (полная автоматизация)

Уровень 0 (без операций):

Рабочих мест на уровне 0 почти нет. Мы также можем говорить об уровне 0 следующим образом;

  • Data Scientist передает модель как артефакт.
  • Использование статического автономного набора данных, ручной сбор данных.
  • Развертывание модели вручную или иногда с помощью сценариев.
  • Нет частых новинок.
  • No CI/CD
  • Есть только сервис прогнозов.
  • Нет мониторинга производительности, нет тестирования.

Уровень 1 (автоматическое обучение):

Если это немного более автоматизировано;

  • Существует рабочий конвейер для сбора данных.
  • Data Scientist не работает изолированно, как член команды.
  • Исходный код модульный. Никаких тетрадей.

Уровень 2 (полная автоматизация):

  • CI, конвейер CD
  • Выполняется проверка данных

Вот как можно кратко рассказать о MLOps. Приятного чтения.

С наилучшими пожеланиями

Источники;

https://bootcamp.veribilimiokulu.com/bootcamp-programlari/mlops-bootcamp/