6 уровней внедрения машинного обучения

Али Арсанджани,
Отредактировано на основе транскрипции и краткого изложения недавнего выступления в сотрудничестве с Джоэлом Милагом, Wow AI и командой

На этом содержательном заседании д-р Али Арсанджани, директор по разработке облачных партнеров в Google Cloud, обсудил с аудиторией, как использовать AI/ML на протяжении всего жизненного цикла, чтобы повысить организационную зрелость в использовании ML и как в результате повысить ценность бизнеса. .

Смотрите его выступление на нашем сайте и на YouTube-канале.

6 уровней организационной зрелости AI/ML

Али предложил ответить на несколько вопросов, чтобы измерить достижение более высоких уровней организационной зрелости при внедрении, использовании и активации ИИ/МО для достижения ценности бизнеса на протяжении всего жизненного цикла МО:

Уровень 1. Определены ли цели науки о данных и машинного обучения для явно проясненных вариантов использования с точки зрения кластеризации, классификации, регрессии, прогнозирования и рекомендации ИИ?

Уровень 2. Ваша команда последовательно применяет весь жизненный цикл машинного обучения наряду с различными этапами очистки данных, хранения функций, выбора алгоритма и обучения, оценки результатов, объяснимости и перехода к оптимизации гиперпараметров. развертывание на конечной точке, мониторинг конечной точки, наличие конвейера и выполнение всего этого снова и снова?

Уровень 3. Есть ли у вас документированная ссылка на действия в рамках жизненного цикла машинного обучения?

Уровень 4. Удалось ли вам автоматизировать некоторые, если не большинство задач?

Уровень 5. Измеряете ли вы, отслеживаете действия и ретроспективно выявляете узкие места?

Уровень 6. Постоянно ли команда использует данные и новые знания для улучшения процесса машинного обучения?

Это вопросы, которые вы должны периодически задавать себе, своим поставщикам и своим командам, чтобы измерять и оценивать процесс.

Решение 4 скрытых технических проблем в системах машинного обучения

Далее доктор Арсанджани сослался на статью 2017 года, опубликованную его коллегами, под названием «Скрытый технический долг в системах машинного обучения». Он особо выделил следующие области технологического долга, которые часто упускают из виду в пользу более общего технологического долга.

Данные тестирования долга

Если данные заменяют код в ML, и код должен быть протестирован, то некоторый объем тестирования входных данных имеет решающее значение для хорошо функционирующей системы.

Воспроизводимость долга

Обычно после получения хороших результатов мы двигаемся дальше, но повторные эксперименты с разными типами данных для получения аналогичных результатов чрезвычайно важны.

Задолженность по управлению процессами

Существует проблема с безопасным и автоматическим обновлением конфигураций для похожих моделей, а также с тем, как управлять и назначать ресурсы между моделями с этими разными бизнес-приоритетами, чтобы вы могли визуализировать и обнаруживать блокираторы в операциях, выполняемых на протяжении жизненного цикла MLOps с использованием конвейеров.

Культурный долг

Одним из наиболее важных факторов является создание командной культуры, которая вознаграждает рационализацию, сокращение функций, общее снижение общей сложности, улучшение воспроизводимости и масштабируемости, а также мониторинг в той же степени, что и повышение точности.

Али считал, что эти менее заметные/менее широко рассматриваемые элементы скрытого технического долга жизненно важны для улучшения и ускорения вашей зрелости на протяжении всего жизненного цикла AI/ML.

6 компонентов внедрения машинного обучения

Затем он резюмировал шесть компонентов, которые являются ключевыми для принятия ML.

Активация данных требует приема данных из озер данных и возможности подготовки данных через конвейер подготовки данных.
Данные для ИИ требует подготовки данных, маркировки и характеристики.
Модели подразумевают рассмотрение экспериментов и объяснимости как первоклассных конструкций.
Модели требуют обучения и оптимизации и, в конечном итоге, внесения метаданных экспериментов в реестр.
Модели обслуживаются, но их необходимо отслеживать на предмет различных типов дрейфа или перекоса.
весь жизненный цикл машинного обучения должен поддерживаться данными, обучением и логическими выводами (развертывание и мониторинг) конвейерами.

Ключевые компоненты пути машинного обучения более подробно

Компонент 1: данные и озеро данных

BigLake — это безопасное и управляемое озеро данных, которое собирает данные из разных облаков, а также обеспечивает самостоятельную аналитику, а также взаимодействие между ИИ и этой аналитикой. BigLake в основном расширяет BigQuery и позволяет учитывать Spark, TensorFlow, Presto или другие наборы возможностей.

Несколько новых возможностей BigLake также позволяют создавать дифференцированные платформы данных, такие как Analytics Hub, поддержка BigQuery ML, BigQuery Omni и предстоящая поддержка профилирования Cloud Data Loss Prevention, а также маскирование данных и ведение журналов аудита.

Компонент 2: Магазин функций

Совместное использование функций используется в разных случаях использования. Чтобы использовать одну функцию, вы должны вставить ее в хранилище функций после ее очистки и подготовки, чтобы каждый мог ее использовать. В этой ситуации пригодится магазин функций Vertex AI, рекомендованный доктором Али Арсанджани. Это позволяет непрерывное обучение, экспериментирование, интеграцию с CI/CD, а также обслуживание и мониторинг.

Компонент 3 и 4: эксперименты и модельный реестр

По словам Али, компании хотели бы иметь возможность управлять происхождением данных, деталями обучения, гиперпараметрами, используемыми в каждом эксперименте, путем компиляции этих метаданных и помещения их в модельный реестр, такой как Vertex AI Registry.

Если серьезность данных является ключевым требованием, и вы не хотите перемещать табличные и/или неструктурированные данные, которые могут уже находиться, скажем, в BigQuery, BigQuery ML можно использовать для запуска разнообразных алгоритмов классификации, регрессии, моделирования. операций и временных рядов прямо из хранилища данных BigQuery. Результаты могут быть интегрированы в Vertex AI Registry.

Если вы хотите или не против переместить данные, вы можете использовать все возможности предварительно обученного, AutoML или пользовательского обучения, которые предлагает Vertex AI. Вы можете использовать Vertex AI Workbench для проведения экспериментов по науке о данных в python, которые помогут вам обогатить данные и поместить их в место, где вы сможете использовать, обучать, оптимизировать и развертывать модели.

Компонент 5: конвейер MLOps

Экспериментирование, переобучение, развертывание моделей и непрерывный мониторинг интегрированы в структуру управления для достижения сквозных возможностей MLOps с конвейерами Vertex AI. Али также подчеркнул важность XAI: наличие объяснимости, интегрированной в данные, построение модели, логические выводы всего жизненного цикла AI/ML.

Скриншот из презентации Али Арсанджани

Доктор Арсанджани закончил свое выступление, оставив аудитории мысль о том, что зрелость, способность реализовать бизнес-преимущества ИИ/МО, развивается по мере того, как организация может использовать каждую часть жизненного цикла и проходить через цифровые инновации ИИ/МО. спектр растет. Выбрав наиболее подходящий инструмент для той части жизненного цикла, на которой в настоящее время сосредоточена ваша организация, вы сможете развивать, развивать, масштабировать и внедрять возможности AI/ML, вы сможете интегрировать эти возможности не по отдельности, а как непрерывный процесс. весь спектр цифровых инноваций, который различные команды в вашей организации могут использовать и извлекать выгоду для бизнеса.