млн операций в 2022 г.

Машинное обучение и наука о данных Операционный процесс

  • Поскольку область науки о данных растет, а новые инновации расширяют процесс
  • Новый процесс для объяснения и просмотра того, что делает модель
  • Проверка на предвзятость и справедливость в модели
  • Отслеживайте и поддерживайте дрейф данных и дрейф производительности модели
  • Новые инструменты и автоматизация
  • Конфиденциальность, управление и безопасность
  • Это просто новая текущая версия по состоянию на 2022 год, которая может измениться с изменением технологий.

процесс Млопс

Объяснение процесса

  • Наука о данных была успешной, когда мы использовали подход, основанный на прецедентах.
  • Каждый вариант использования будет сообщать нам, какие данные необходимы и из каких источников данных.
  • Поскольку данные поступают из различных источников данных, хорошо создать озеро данных для получения данных.
  • После того, как данные попали в озеро данных, пришло время заняться проектированием данных или проектированием функций.
  • разработка признаков — это способ организовать функции, необходимые для моделирования.
  • функции могут быть источниками из нескольких источников
  • функция может быть создана на основе варианта использования
  • функции могут быть объединены в зависимости от варианта использования
  • После того, как функции собраны и обработаны, следующее моделирование
  • Моделирование — это процесс разделения данных на две части.
  • В основном 70, 30 или 80, 20 процентов.
  • Как только данные разделены, запустите алгоритм
  • Это итеративный процесс, либо характеристики могут быть изменены, либо алгоритм
  • в зависимости от типа машинного обучения (классификация, регрессия или временные ряды) могут применяться различные алгоритмы.
  • Проверьте модель с новым набором данных и проанализируйте производительность
  • Здесь мы также углубимся в модель и объясним, что она делает.
  • Объяснимость
  • Справедливость
  • Анализ ошибок
  • Неверные факты
  • Причинно-следственный анализ
  • Обозреватель данных
  • Конфиденциальность
  • Применяйте ответственный ИИ, чтобы убедиться, что модель справедлива и обеспечивает наилучшие результаты.
  • Для продвижения вперед выбирается модель, обеспечивающая наилучшую точность.
  • Убедитесь, что метрика и точность модели сохранены
  • в некоторых случаях диаграмма RUC или другие визуальные элементы также сохраняются для дальнейшего анализа.
  • Когда мы готовы к развертыванию, нам нужно оценить, лучше ли новая модель, чем предыдущая для уже созданной модели.
  • Если новая модель или существующая модель с изменением количества функций, мы можем пропустить проверку оценки.
  • Как только он пройдет, зарегистрируйте модель
  • При регистрации модели мы также регистрируем хранилище функций для использования другими
  • Показатели модели, такие как точность и другие показатели, сохраняются для отслеживания производительности модели.
  • При желании мы можем зарегистрировать модель как торговую площадку для использования другими сотрудниками организации.
  • Следующий потенциальный ответственный ИИ
  • Этот раздел новый
  • Здесь мы также углубимся в модель и объясним, что она делает.
  • Объяснить способность
  • Справедливость
  • Анализ ошибок
  • Неверные факты
  • Причинно-следственный анализ
  • Обозреватель данных
  • Конфиденциальность
  • Все вышеперечисленное можно рассчитать и сохранить для модели.
  • На этапе разработки это можно применить к каждой модели, чтобы выяснить, какая модель обеспечивает наилучшие результаты.
  • Затем разверните свою модель в качестве конечных точек в реальном времени или в пакетном режиме.
  • Также сохраните метрику вывода модели
  • Дополнительные функции, такие как дрейф данных и дрейф модели, можно отслеживать, чтобы переобучить модель, если производительность ухудшится.
  • Весь процесс построен с учетом безопасности
  • Управление также построено с мониторингом для управления процессом
  • Дополнительное происхождение и каталогизация также применяются как для обучения, так и для вывода.

Samples2022/mlops.md на главной · балакрешнан/Samples2022 (github.com)