Vertex AI — это управляемая платформа машинного обучения (ML) от Google, которая помогает вам создавать, обучать, развертывать и масштабировать модели ML. Он предлагает унифицированный опыт управления всем жизненным циклом машинного обучения, от подготовки данных до мониторинга моделей.

В этом руководстве мы узнаем, как использовать Vertex AI для обучения, оценки и развертывания табличной модели AutoML. Мы будем использовать набор данных банка, чтобы предсказать, подпишется ли клиент на срочный депозит.

Шаг 1. Обучение табличной модели AutoML

Создать облачный проект Google

Во-первых, давайте создадим новый проект Google Cloud (My-Vertex-AI-Project), где мы будем обучать, оценивать и развертывать нашу модель.

Включить все API

После создания нового проекта перейдите в Vertex AI и включите все необходимые API. После включения вы должны увидеть что-то вроде этого —

Создать набор данных

Vertex AI предлагает различные модели AutoML в зависимости от типа данных и цели, которую вы хотите достичь с помощью своей модели. Когда вы создаете набор данных, вы выбираете начальную цель, но после создания набора данных вы можете использовать его для обучения моделей с другими целями.

В этом руководстве мы будем использовать табличные (структурированные) данные для обучения модели классификации.

В меню навигации слева выберите Datasets:

Источник ваших данных.Источник и подготовка ваших данных имеют решающее значение для обеспечения точной модели машинного обучения. В этом руководстве мы будем использовать общедоступный набор банковских данных, размещенный в облачном хранилище.

На следующем шаге в разделе Путь к файлу импорта введите следующее: cloud-ml-tables-data/bank-marketing.csv

Примечание! Этот набор данных, предоставленный Google, был очищен и отформатирован для обучения AutoML, но для большинства данных потребуется некоторая обработка, прежде чем они будут готовы к использованию. Качество ваших обучающих данных влияет на эффективность создаваемых вами моделей.

(Необязательно) Создать статистику

Вы можете щелкнуть ссылку Generate Statistics, чтобы просмотреть подробную статистику по каждому столбцу.

А затем нажмите на любой столбец, чтобы увидеть подробную статистику.

Обучите новую модель ML с этим набором данных:

Выберите параметр AutoML, чтобы машина выбрала лучшую модель для этого набора данных.

Выберите столбец Deposit в качестве цели.

Начать обучение

Нажмите Start Training после выбора параметра Бюджет в размере 1 узла в час.

В моем случае на это ушло чуть больше 2 часов. После этого модель будет доступна под model registry для вашего использования.

Нажав на эту модель, вы сможете увидеть различные матрицы. Эта оценочная страница поможет вам понять, как модель работала по сравнению с набором тестов.

Краткое объяснение различных матриц

Матрица путаницы показывает, как прогноз сравнивается с тестовым набором (основная правда).

Важность функции показывает, как каждая функция повлияла на обучение модели: чем выше значение, тем больше влияние.

Показатели оценки.Наведите указатель мыши на значки ?, чтобы узнать о каждом показателе оценки.

Шаг 2. Оцените и разверните модель

Разверните модель

Перейдите на вкладку Deploy & Test и нажмите «Развернуть на конечной точке», чтобы развернуть модель.

Шаг 3. Протестируйте модель

Отправка запросов прогнозов

Вместо отправки запроса через API или GCloud мы можем протестировать нашу модель через пользовательский интерфейс GCloud.

В разделе Test your model вкладки Deploy & Test заполните несколько тестовых значений (или используйте те, которые предварительно заполнены по умолчанию).

Заключение

Надеюсь, вы нашли этот блог полезным! Дайте мне знать, что вы думаете об этом, если у вас есть какие-либо предложения по теме, которую вы хотели бы видеть здесь, свяжитесь с нами.

Если вам понравились статьи, ставьте лайки 👏, чтобы порекомендовать эту статью другим людям.