На прошлой неделе мы провели первый БЕСПЛАТНЫЙ курс из серии тренингов и сертификаций Введение в Kubeflow. Этот начальный курс был посвящен основам Kubeflow. В этом сообщении блога мы подведем некоторые итоги занятия, а также дадим краткое изложение вопросов и ответов. Ок, покопаемся.

Поздравляем Ласю Систию!

Первым человеком, получившим сертификат Основы, была Ласья Систиа, студентка информатики Технологического института Нитте Минакши. Отличная работа!

Какие темы были затронуты на курсе?

Этот начальный курс был направлен на то, чтобы познакомить ученых с данными и инженеров DevOps с небольшим опытом или без него с основами работы Kubeflow.

  • Kubeflow-архитектура
  • Обзор рабочих процессов машинного обучения
  • Компоненты Kubeflow
  • Инструменты и надстройки (Kale, Rok, Istio и т. д.)
  • Распределения
  • Установка Kubeflow на AWS
  • Обзор сообщества

Что я пропустил?

Вот короткий тизер из 90-минутного тренинга. В этом видео мы демонстрируем три вещи, связанные с Katib (это компонент, который обеспечивает AutoML, настройку гиперпараметров и другие функции для Kubeflow):

  • Как просмотреть эксперимент
  • Как ставить эксперименты
  • Как определить лучший пробег

Пропустили тренировку 11 ноября?

Если вы не смогли присоединиться к нам на прошлой неделе, но все же хотели бы посетить будущий тренинг, следующий тренинг Основы Kubeflow состоится 16 декабря 2021 г. Вы можете зарегистрироваться прямо в Zoom здесь.

Дополнительные БЕСПЛАТНЫЕ предстоящие тренировки

Вышел следующий курс из серии Основы Jupyter Notebook. Вы можете зарегистрироваться прямо на Zoom здесь.

В этом курсе мы рассмотрим следующие темы:

Анонс Академии Аррикто

Я также должен отметить, что курсы Основы Kubeflow являются источником более продвинутых предложений Arrikto Academy, новой образовательной инициативы Arrikto Kubeflow, основанной на навыках. Если вы хотите изучить дополнительные варианты обучения, предназначенные для пользователей Kubeflow среднего и продвинутого уровня, загляните в Академию Аррикто! (Вы также можете прочитать анонс блога здесь.)
Фактически, недавно мы выпустили наши первые два курса — Кале 101 и Катиб 101, оба из которых сосредоточены на необходимых основах первого дня. что все специалисты по данным должны быть успешными в экосистеме Kubeflow. Курсы завершаются лабораторными работами с самостоятельной оценкой, чтобы гарантировать развитие и сохранение навыков.

Вопросы и ответы с тренинга

Ниже приводится краткое изложение некоторых вопросов, которые возникали в поле вопросов и ответов во время курса. [Отредактировано для удобства чтения и краткости.]

Работает ли MiniKF на Kubernetes или Minikube?

MiniKF (самый простой способ начать работу с Kubeflow) — это пакет все-в-одном одним щелчком мыши, предварительно упакованный с Minikube и Kubeflow. Он также включает Kale (инструмент для преобразования Jupyter Notebook общего назначения в рабочие процессы Kubeflow Pipelines) и Rok (программное обеспечение для управления данными для управления версиями и воспроизводимости данных).

Меня часто смущает разница между Kubeflow Pipelines и экспериментами AutoML. Какая разница?

Очень разумно запутаться! Это связано с тем, что Kubeflow традиционно называл две разные вещи термином «Эксперимент». В контексте конвейеров Kubeflow эксперимент — это просто логическая группа запусков конвейера. В контексте Katib под экспериментом подразумевались все испытания, которые будут выполняться заданием по настройке гиперпараметров. В настоящее время в сообществе Kubeflow ведутся дискуссии о переименовании одного из двух, чтобы они не конфликтовали.

В чем разница между использованием TFServing и KFServing?

(TensorFlow) TFServing и (Kubeflow) KFServing имеют возможность развертывать модели в Kubeflow. Они предоставляют пользователям более простой способ обслуживания своих моделей, что является ничем иным, как предоставлением доступа к модели другим пользователям или службам, обычно в форме API или веб-службы.

KFServing — это абстракция поверх логического вывода, а не замена. Он направлен на упрощение, делая клиентов логического вывода независимыми от того, что сервер логического вывода делает за кулисами, например TFServing, Triton или Seldon. KFServing достигает этого путем координации с поставщиками серверов логических выводов по спецификациям плоскости данных, что, в свою очередь, позволяет сделать дополнительные компоненты, включая преобразования и пояснения, более подключаемыми.

Несколько дополнительных замечаний:

  • TFServing может работать в Kubeflow или автономно.
  • KFServing поддерживает несколько фреймворков, включая PyTorch, TensorFlow, MXNet и т. д.

В крайних случаях можно ли использовать MiniKF в производстве для возможностей его обслуживающего компонента (KServe)?

MiniKF не следует рассматривать как производственный дистрибутив. Хотя его легко установить и он имеет почти все функции, необходимые для работы в производственной среде, он работает на одном узле Minikube, который может быть ограничен в ресурсах и не обеспечивает высокой доступности. В нем отсутствуют некоторые основные функции, такие как многопользовательские возможности, поддержка RBAC и т. д., которые могут оказаться критически важными в производственной среде. Кроме того, в настоящее время он не поддерживает Azure, что может быть важно или не важно для вашего варианта использования. Я бы рекомендовал проверить EKF для производства: https://www.arrikto.com/enterprise-kubeflow/

Обеспечивает ли Enterprise Kubeflow подключения для аутентификации и авторизации к Active Directory или LDAP?

Да, вы можете интегрироваться с различными поставщиками OIDC, включая LDAP и AD. Интеграция с некоторыми проверенными провайдерами OIDC, такими как GitLab, Google, Okta и PingID, задокументирована здесь.

Отличный курс! Какой следующий в серии?

Вы можете записаться на следующий курс из этой серии Основы Jupyter Notebook прямо в Zoom здесь.

Первоначально опубликовано на https://www.arrikto.com 16 ноября 2021 г.