После успешного прохождения последней сертификации Google - Сертифицированный профессиональный инженер по машинному обучению Google, многие люди недавно обратились ко мне через мой LinkedIn за советами по подготовке к экзамену. Поэтому я подумал, почему бы не опубликовать руководство по всему, что я делал, чтобы сдать экзамен.
Говоря о моем профессиональном опыте, я работаю архитектором / инженером по машинному обучению более 5 лет и создал множество корпоративных приложений на основе машинного обучения на различных платформах. Так что более или менее работа со стеком Tensorflow / GCP является частью моей еженедельной учебной программы.
Если говорить конкретно об экзамене, то экзамен GCP Professional ML Engineer фокусируется в основном на трех основных областях:
- Знание концепций машинного обучения и связанных с ними инструментов - Tensorflow, Keras, XGB.
- Знание сервисов GCP ML - AI Platform, ML API, BQML
- Знание MLOps и сопутствующих инструментов - TFX, Kubeflow, Лучшие практики
Экзамен состоит из 60 вопросов:
- 35 довольно прямолинейный и охватывает только 1 область
- 15 вопросов охватывают 2 области
- 10 сложных, которые охватывают все три или даже больше
На это у меня ушло около 8 дней, 4 года опыта в GCP ML и 5+ лет опыта в ML. Ниже приводится полное описание того, как следует подготовиться к экзамену. Продолжительность подготовки может составлять от 8 дней до 2+ месяцев в зависимости от вашего опыта в трех основных областях.
Следует запланировать изучение этих тем в порядке упоминания:
- Ускоренный курс ML от Google - https://developers.google.com/machine-learning/crash-course/
- Обучение GCP AutoML - https://cloud.google.com/automl/docs
- API-интерфейсы GCP ML - API-интерфейс естественного языка, API-интерфейс Vision, API-интерфейс аудио
- Обучение платформе AI - https://cloud.google.com/ai-platform/training/docs
- Встроенные алгоритмы платформы AI - https://cloud.google.com/ai-platform/training/docs/algorithms
- Прогнозирование платформы AI - https://cloud.google.com/ai-platform/prediction/docs
- Контейнеры DL платформы AI - https://cloud.google.com/ai-platform/deep-learning-containers/docs
- Объяснение платформы AI - https://cloud.google.com/ai-platform/prediction/docs/ai-explanations/overview
- Непрерывная оценка - https://cloud.google.com/ai-platform/prediction/docs/continuous-evaluation
- TF Profiler - https://www.tensorflow.org/guide/profiler
- Распределенный TF - https://www.tensorflow.org/guide/distributed_training
- Конвейеры и компоненты TFX - https://www.tensorflow.org/tfx/guide/understanding_tfx_pipelines
- Конвейеры платформы AI - https://cloud.google.com/ai-platform/pipelines/docs
- Синтаксисы BQML и типы алгоритмов - https://cloud.google.com/bigquery-ml/docs/tutorials
- Основы не-ML-сервисов: Dataflow, Dataproc, PubSub, DataFusion
- Различные типы показателей точности машинного обучения
Несколько советов к экзамену и специальные темы:
- Всегда помните, что каждое решение машинного обучения должно осуществляться в следующем порядке: начать с API-интерфейсов GCP ML, чтобы проверить любой существующий API, который можно использовать - ›Другое обучение AutoML -› Встроенный алгоритм Else AI Platform - ›Пользовательское обучение Else AI Platform по TF -› Индивидуальное обучение Else AI Platform по контейнерам
- Должен быть знаком с конвейерами SKLearn, последовательными моделями Keras.
- Синтаксис JSON для API прогнозирования платформы AI
- Сравнение модели Edge с общей моделью и высокой точностью
- Методы атрибуции для объяснения модели изображения
- Контейнерное обучение / Контейнерное прогнозирование
- Пользовательские процедуры прогнозирования на платформе AI
- Методы оптимизации набора данных TF
- Прочтите о различных параметрах в обслуживании модели Tensorflow
- Изучение проектирования систем потоковой передачи данных с помощью DataFlow и PubSub
- Должен знать разницу между CNN и RNN
- Разница между точностью и отзывом для двоичной классификации
Этой информации более чем достаточно для прохождения сертификационного экзамена, я бы предложил как минимум 2 изменения всего содержания. Во-первых, с намерением запомнить, а во-вторых, с намерением ускориться.
Всего наилучшего для сертификации!