Авторы Яир Шифф и Рафал Бигай

Трагическая история из греческой мифологии: Сизиф, только что получивший степень магистра наук о данных, слишком много раз обманул богов. В наказание они приговорили его к вечности повторяющихся задач. Каждый месяц Сизифу приходилось переобучать, сравнивать и развертывать новую модель машинного обучения на обновленных данных его компании. Если бы только у него был доступ к бета-версии IBM Watson® Studio Pipelines, он мог бы избавить себя от бесконечности ручного повторения задач жизненного цикла ИИ и навсегда изменить ход греческой мифологии.

Команда IBM Watson Machine Learning и IBM Research, хотя и не была доставлена ​​вовремя для бедного Sisyphus, с гордостью объявляет о нашем новейшем инструменте, помогающем клиентам управлять жизненным циклом ИИ, - Watson Studio Pipelines. Это новое предложение позволяет пользователям создавать повторяемые и запланированные потоки, которые автоматизируют конвейеры записных книжек, обработки данных и машинного обучения: от приема данных до обучения модели, тестирования и развертывания. Благодаря интуитивно понятному пользовательскому интерфейсу Watson Studio Pipelines предоставляет все современные инструменты анализа данных, доступные в Watson Studio, и позволяет пользователям объединять их в потоки автоматизации, создавая конвейеры непрерывной интеграции / непрерывной разработки для ИИ.

Конвейеры Watson Studio построены на конвейерах Kubeflow в среде выполнения Tekton и полностью интегрированы в платформу Watson Studio, что позволяет пользователям комбинировать инструменты, в том числе:

  • Ноутбуки
  • Потоки Data Refinery
  • AutoAI эксперименты
  • Веб-сервис / онлайн-развертывания
  • Пакетное развертывание
  • Импорт и экспорт активов Project / Space

в повторяемые и автоматизированные конвейеры.

Зарегистрируйтесь, чтобы получить доступ к бета-версии Watson Studio Pipelines и ощутить на себе всю мощь автоматизации жизненного цикла ИИ.

Автоматизация в действии

Чтобы лучше понять преимущества Watson Studio Pipelines, мы рассмотрим пример, который подчеркивает наиболее важные особенности этого нового предложения.

Давайте поставим себя на место специалиста по обработке данных, работающего в банке. Чтобы действительно вникнуть в роль, вы можете прочитать больше об используемом ниже наборе данных и найти инструкции для загрузки. Как часть группы специалистов по анализу данных банка, перед нами стояла задача определить наиболее эффективные маркетинговые методы для стимулирования различных клиентов к открытию депозитных счетов.

После нескольких недель кропотливого проектирования и поздних ночей наша модель наконец готова и упакована в ноутбук. На следующее утро, представляя нашу работу, коллега спрашивает, использовали ли мы когда-нибудь IBM Watson AutoAI. Мы открываем Watson Studio и удивляемся тому, что после нескольких щелчков мышью по единому пользовательскому интерфейсу у нас есть другая модель, которая основана на совершенно другом алгоритме, чем тот, который мы использовали, но обеспечивает аналогичную точность. (Если вы новичок в AutoAI, узнайте больше, посмотрев наши демонстрации и опробуйте продукт на себе в нашей практической лаборатории.)

Мы представляем обе модели менеджерам по маркетингу под громкие аплодисменты! Перенесемся в следующий месяц, когда мы получим электронное письмо с вопросом о том, как точность обновленной модели соотносится с новым набором данных, который только что стал доступным. Итак, мы промываем и повторяем, выполняя все ручные этапы подготовки данных, обучения модели, оценки и, наконец, развертывания. В этот момент вы, вероятно, думаете, что ваш старый концерт, посвященный рок-н-роллу, был не таким уж плохим.

Или, может быть, есть лучший способ: войти в Watson Studio Pipelines! С этим последним предложением у вас есть возможность настроить и автоматизировать весь этот процесс.

Пользовательский интерфейс Watson Studio Pipelines построен на узлах, которые представляют важные действия в жизненном цикле ИИ. Начнем с добавления узла для подключения к нашему набору данных.

Указание этого узла актива «Копировать» на расположение в облачном хранилище объектов позволяет нам автоматически использовать обновленный набор данных, который отдел маркетинга делает доступным каждый месяц.

Затем мы добавляем узел выполнения, который будет запускать записную книжку с нашим настраиваемым конвейером для обучения модели. Впечатленные производительностью AutoAI в отношении наших данных, мы также даем ему взлом и новые данные.

Настроив узел «Запустить записную книжку», мы можем передать переменные среды, которые будут использоваться для применения нашего кода к новому набору данных. Мы можем либо вручную определить эти переменные, либо установить их для ссылки на выходные данные от вышестоящих узлов.

Затем мы добавляем еще один узел выполнения записной книжки, который выбирает между нашим конвейером и конвейером, созданным AutoAI: пусть победит лучшая модель!

Наша последняя задача - развернуть лучшую модель в виде веб-сервиса, где наши коллеги смогут протестировать ее на себе. К счастью, поскольку Watson Studio Pipelines полностью интегрирован в Watson Studio, у нас есть доступ ко всем последним и лучшим предложениям по развертыванию, и мы можем легко представить нашу модель как REST API, который будет оценивать полезные нагрузки онлайн.

Мы также экспортируем модель-победитель из набора данных за этот месяц в хранилище облачных объектов, где ее могут забрать и развернуть в производственной среде наши операционные группы¹.

Все, что осталось сделать, - это запланировать запуск нашего конвейера на ежемесячный запуск новых данных. Следующая остановка: станция автоматики!

В этом примере использования мы показали, как с помощью всего нескольких простых щелчков мышью и настройки через интуитивно понятный пользовательский интерфейс можно создать полностью автоматизированный конвейер непрерывной разработки AI. Чтобы испытать эту автоматизацию жизненного цикла ИИ на себе, зарегистрируйтесь в списке доступа к бета-версии Watson Studio Pipelines.

Удачного моделирования!

[1] Подробнее о том, как производственная группа может получить выгоду от автоматизации жизненного цикла.