После успешного прохождения последней сертификации Google - Сертифицированный профессиональный инженер по машинному обучению Google, многие люди недавно обратились ко мне через мой LinkedIn за советами по подготовке к экзамену. Поэтому я подумал, почему бы не опубликовать руководство по всему, что я делал, чтобы сдать экзамен.

Говоря о моем профессиональном опыте, я работаю архитектором / инженером по машинному обучению более 5 лет и создал множество корпоративных приложений на основе машинного обучения на различных платформах. Так что более или менее работа со стеком Tensorflow / GCP является частью моей еженедельной учебной программы.

Если говорить конкретно об экзамене, то экзамен GCP Professional ML Engineer фокусируется в основном на трех основных областях:

  1. Знание концепций машинного обучения и связанных с ними инструментов - Tensorflow, Keras, XGB.
  2. Знание сервисов GCP ML - AI Platform, ML API, BQML
  3. Знание MLOps и сопутствующих инструментов - TFX, Kubeflow, Лучшие практики

Экзамен состоит из 60 вопросов:

  1. 35 довольно прямолинейный и охватывает только 1 область
  2. 15 вопросов охватывают 2 области
  3. 10 сложных, которые охватывают все три или даже больше

На это у меня ушло около 8 дней, 4 года опыта в GCP ML и 5+ лет опыта в ML. Ниже приводится полное описание того, как следует подготовиться к экзамену. Продолжительность подготовки может составлять от 8 дней до 2+ месяцев в зависимости от вашего опыта в трех основных областях.

Следует запланировать изучение этих тем в порядке упоминания:

  1. Ускоренный курс ML от Google - https://developers.google.com/machine-learning/crash-course/
  2. Обучение GCP AutoML - https://cloud.google.com/automl/docs
  3. API-интерфейсы GCP ML - API-интерфейс естественного языка, API-интерфейс Vision, API-интерфейс аудио
  4. Обучение платформе AI - https://cloud.google.com/ai-platform/training/docs
  5. Встроенные алгоритмы платформы AI - https://cloud.google.com/ai-platform/training/docs/algorithms
  6. Прогнозирование платформы AI - https://cloud.google.com/ai-platform/prediction/docs
  7. Контейнеры DL платформы AI - https://cloud.google.com/ai-platform/deep-learning-containers/docs
  8. Объяснение платформы AI - https://cloud.google.com/ai-platform/prediction/docs/ai-explanations/overview
  9. Непрерывная оценка - https://cloud.google.com/ai-platform/prediction/docs/continuous-evaluation
  10. TF Profiler - https://www.tensorflow.org/guide/profiler
  11. Распределенный TF - https://www.tensorflow.org/guide/distributed_training
  12. Конвейеры и компоненты TFX - https://www.tensorflow.org/tfx/guide/understanding_tfx_pipelines
  13. Конвейеры платформы AI - https://cloud.google.com/ai-platform/pipelines/docs
  14. Синтаксисы BQML и типы алгоритмов - https://cloud.google.com/bigquery-ml/docs/tutorials
  15. Основы не-ML-сервисов: Dataflow, Dataproc, PubSub, DataFusion
  16. Различные типы показателей точности машинного обучения

Несколько советов к экзамену и специальные темы:

  1. Всегда помните, что каждое решение машинного обучения должно осуществляться в следующем порядке: начать с API-интерфейсов GCP ML, чтобы проверить любой существующий API, который можно использовать - ›Другое обучение AutoML -› Встроенный алгоритм Else AI Platform - ›Пользовательское обучение Else AI Platform по TF -› Индивидуальное обучение Else AI Platform по контейнерам
  2. Должен быть знаком с конвейерами SKLearn, последовательными моделями Keras.
  3. Синтаксис JSON для API прогнозирования платформы AI
  4. Сравнение модели Edge с общей моделью и высокой точностью
  5. Методы атрибуции для объяснения модели изображения
  6. Контейнерное обучение / Контейнерное прогнозирование
  7. Пользовательские процедуры прогнозирования на платформе AI
  8. Методы оптимизации набора данных TF
  9. Прочтите о различных параметрах в обслуживании модели Tensorflow
  10. Изучение проектирования систем потоковой передачи данных с помощью DataFlow и PubSub
  11. Должен знать разницу между CNN и RNN
  12. Разница между точностью и отзывом для двоичной классификации

Этой информации более чем достаточно для прохождения сертификационного экзамена, я бы предложил как минимум 2 изменения всего содержания. Во-первых, с намерением запомнить, а во-вторых, с намерением ускориться.

Всего наилучшего для сертификации!