Процесс Data Science и ML Ops

млн операций в 2022 г.

Машинное обучение и наука о данных Операционный процесс

Поскольку область науки о данных растет, а новые инновации расширяют процесс
Новый процесс для объяснения и просмотра того, что делает модель
Проверка на предвзятость и справедливость в модели
Отслеживайте и поддерживайте дрейф данных и дрейф производительности модели
Новые инструменты и автоматизация
Конфиденциальность, управление и безопасность
Это просто новая текущая версия по состоянию на 2022 год, которая может измениться с изменением технологий.

процесс Млопс

Объяснение процесса

Наука о данных была успешной, когда мы использовали подход, основанный на прецедентах.
Каждый вариант использования будет сообщать нам, какие данные необходимы и из каких источников данных.
Поскольку данные поступают из различных источников данных, хорошо создать озеро данных для получения данных.
После того, как данные попали в озеро данных, пришло время заняться проектированием данных или проектированием функций.
разработка признаков — это способ организовать функции, необходимые для моделирования.
функции могут быть источниками из нескольких источников
функция может быть создана на основе варианта использования
функции могут быть объединены в зависимости от варианта использования
После того, как функции собраны и обработаны, следующее моделирование
Моделирование — это процесс разделения данных на две части.
В основном 70, 30 или 80, 20 процентов.
Как только данные разделены, запустите алгоритм
Это итеративный процесс, либо характеристики могут быть изменены, либо алгоритм
в зависимости от типа машинного обучения (классификация, регрессия или временные ряды) могут применяться различные алгоритмы.
Проверьте модель с новым набором данных и проанализируйте производительность
Здесь мы также углубимся в модель и объясним, что она делает.
Объяснимость
Справедливость
Анализ ошибок
Неверные факты
Причинно-следственный анализ
Обозреватель данных
Конфиденциальность
Применяйте ответственный ИИ, чтобы убедиться, что модель справедлива и обеспечивает наилучшие результаты.
Для продвижения вперед выбирается модель, обеспечивающая наилучшую точность.
Убедитесь, что метрика и точность модели сохранены
в некоторых случаях диаграмма RUC или другие визуальные элементы также сохраняются для дальнейшего анализа.
Когда мы готовы к развертыванию, нам нужно оценить, лучше ли новая модель, чем предыдущая для уже созданной модели.
Если новая модель или существующая модель с изменением количества функций, мы можем пропустить проверку оценки.
Как только он пройдет, зарегистрируйте модель
При регистрации модели мы также регистрируем хранилище функций для использования другими
Показатели модели, такие как точность и другие показатели, сохраняются для отслеживания производительности модели.
При желании мы можем зарегистрировать модель как торговую площадку для использования другими сотрудниками организации.
Следующий потенциальный ответственный ИИ
Этот раздел новый
Здесь мы также углубимся в модель и объясним, что она делает.
Объяснить способность
Справедливость
Анализ ошибок
Неверные факты
Причинно-следственный анализ
Обозреватель данных
Конфиденциальность
Все вышеперечисленное можно рассчитать и сохранить для модели.
На этапе разработки это можно применить к каждой модели, чтобы выяснить, какая модель обеспечивает наилучшие результаты.
Затем разверните свою модель в качестве конечных точек в реальном времени или в пакетном режиме.
Также сохраните метрику вывода модели
Дополнительные функции, такие как дрейф данных и дрейф модели, можно отслеживать, чтобы переобучить модель, если производительность ухудшится.
Весь процесс построен с учетом безопасности
Управление также построено с мониторингом для управления процессом
Дополнительное происхождение и каталогизация также применяются как для обучения, так и для вывода.

Samples2022/mlops.md на главной · балакрешнан/Samples2022 (github.com)

Предложения по подаче заявок на Mlearning.ai
Как стать писателем на Mlearning.aimedium.com

Процесс Data Science и ML Ops

млн операций в 2022 г.

Машинное обучение и наука о данных Операционный процесс

процесс Млопс

Объяснение процесса

Вопросы по теме