В этой статье мы опишем блок схемы, посвященный инициации проекта или инициализации проекта.

Всю схему, описывающую ключевые процессы MLOps, вы найдете здесь. Основными частями схемы являются горизонтальные блоки, внутри которых описаны процедурные аспекты MLOps. Каждый из них предназначен для решения конкретных задач в рамках обеспечения бесперебойной работы ML-сервисов компании.

Учитывая все вышесказанное, получается, что команда ML:

  • формирует наборы данных,
  • проводит с ними эксперименты над моделями ML,
  • разрабатывает новые функции для расширения наборов данных и улучшения производительности моделей,
  • сохраняет лучшие модели в Реестре моделей для дальнейшего повторного использования,
  • настраивает процессы обслуживания и развертывания моделей,
  • настраивает мониторинг моделей на производстве и автоматические процессы переобучения текущих или создания новых моделей.

Это выглядит очень дорого и не всегда оправдано. Поэтому в схеме есть отдельный Блок MLOps Project Initiation (A), отвечающий за рациональное целеполагание.

Он имеет пять этапов:

  1. анализ бизнес-проблем,
  2. проектирование архитектуры и технологий, которые будут использоваться,
  3. определение проблем ML из бизнес-целей,
  4. понимание необходимых данных для решения проблем,
  5. подключение к необработанным данным для первоначального анализа данных. (изображение)

Мыслительный процесс здесь можно продемонстрировать на примере ИТ-директора компании. К нему приходит вдохновленный менеджер проекта и просит новую установку платформы для построения ML-системы. Если оба действуют в интересах компании, ИТ-директор задаст уточняющие вопросы:

  • Какую бизнес-проблему вы пытаетесь решить с помощью новой системы машинного обучения?
  • Почему вы решили, что эту проблему нужно решить с помощью новой системы ML? Возможно, было бы проще и дешевле изменить процессы или нанять больше людей для технической поддержки.
  • Где можно увидеть сравнительный анализ компонентов системы ML, на основании которого вы выбрали текущий набор?
  • Как выбранная архитектура системы ML поможет решить бизнес-задачу?
  • Вы уверены, что ML обладает необходимым математическим аппаратом для решения заявленной задачи? Какова постановка задачи для решения?
  • Знаете ли вы, где возьмете данные для обучения модели? Знаете ли вы, какие данные вам нужны для обучения модели?
  • Вы уже изучили имеющиеся данные? Достаточно ли качества данных для решения модельной задачи?

ИТ-директор будет задавать вопросы, как профессор в колледже, но это сэкономит компании деньги. Если на все вопросы даны ответы, значит, существует реальная потребность в системе ML.

Следующий вопрос: Стоит ли в нем делать MLOps?

Это зависит от задачи. Если вам нужно найти разовое решение, например Proof of Concept (PoC), то MLOps не нужен. Если важно обработать большое количество входящих запросов, то нужен MLOps. По сути, этот подход аналогичен оптимизации любого корпоративного процесса.

Чтобы обосновать необходимость МЛОпса перед руководством, нужно подготовить ответы на вопросы:

  • Что улучшится?
  • Сколько денег мы сэкономим?
  • Нужно ли расширять штат?
  • Что нам нужно купить?
  • Где мы можем получить экспертизу?

А затем снова сдать экзамен на ИТ-директора.

Но на этом трудности не заканчиваются, поскольку команду также необходимо убедить в необходимости изменений процессов и стека технологий. Иногда это сложнее, чем просить у руководства бюджет.

Чтобы убедить команду, подготовьте ответы на вопросы:

  • Почему мы не можем продолжать работать как раньше?
  • Какова цель изменений?
  • Каким будет стек технологий?
  • Чему и кому нам нужно научиться?
  • Как компания поможет во внедрении изменений?
  • В какие сроки нам необходимо внести изменения в подход ML?
  • Что будет с теми, у кого нет времени?

Заключение

Кажется, на этом мы закончили подробно изучать схему MLOps. Однако это лишь теоретические аспекты. Практическая реализация всегда выявляет дополнительные детали, которые могут многое изменить. Некоторые проблемы внедрения может решить готовая платформа MLOps — заранее настроенная инфраструктура для обучения и развертывания моделей ML.

💡 Вас также может заинтересовать наша статья Ключевые процессы MLOps (часть 4): обслуживание и мониторинг моделей машинного обученияhttps://hystax.com/key-mlops-processes-part-4-serving-and-monitoring -модели машинного обучения.

✔️ OptScale, платформа с открытым исходным кодом FinOps и MLOps, которая помогает компаниям оптимизировать затраты на облако и обеспечить большую прозрачность использования облака, полностью доступна под Apache 2.0 на GitHub → https://github.com/hystax/optscale.