Обучение и тестирование моделей классификации текста с помощью Google Cloud Vertex AI

Используя функцию Google AutoML, модели классификации можно создавать практически без технических усилий.

Для начала несколько общих замечаний:

Есть много элементов Vertex AI в целом и AutoML в частности, что напоминает мне HuggingFace🤗 autoTRAIN.
AutoML позволяет быстро создавать прототипы и исследовать наборы данных, используя подход без кодовой студии.
Vertex AI имеет два варианта классификации текста: классификацию с одной или несколькими метками. Создание иерархий классов или таксономий невозможно.
Время обучения модели относительно велико. Традиционные модели NLU добились больших успехов с точки зрения дополнительного обучения. Инкрементное обучение — это понятие добавления новых данных к существующей модели. Вдобавок к этому значительно сократилось время обучения традиционных моделей NLU.

Несмотря на то, что AutoML предназначен для упрощения процесса создания модели ML, двумя элементами, которые легко настраиваются, являются разделение данных и наборы аннотаций.

Разделение данных. По умолчанию AutoML случайным образом назначает каждый элемент в вашем наборе данных обучающим, проверочным и тестовым наборам в соотношении 80/10/10 соответственно. Вы можете изменить это соотношение или даже вручную назначить каждый элемент данных набору.

Наборы аннотаций. В наборах аннотаций хранятся аннотации, поэтому вы можете использовать тот же набор данных для других моделей и целей. Например, вы можете использовать тот же самый набор данных «счастье» для обучения модели классификации с несколькими метками вместо модели с одной меткой.

Но я спешу упомянуть, что Vertex AI не хватает восходящего, ориентированного на данные подхода к сбору и структурированию обучающих данных.

⭐️ Подпишитесь на меня в LinkedIn, чтобы быть в курсе обновлений разговорного ИИ ⭐️

В предыдущем посте я прошел через процесс создания набора данных и обучения модели машинного обучения.

На изображении ниже видна панель инструментов Vertex AI, в разделе последние модели новая модель указана со средней точностью.

После доступа к модели в верхней части страницы появляется полоса прогресса. Здесь вновь созданную модель можно оценить, развернуть, протестировать и т. д.

На изображении ниже вы можете видеть, что модель можно протестировать с более длинным вводом. Справа от изображения видны ярлыки с отмеченным ярлыком enjoy_the_moment.

Вернувшись на вкладку оценки, вы увидите, что для каждой модели доступно несколько графических индикаторов быстрого просмотра.

Ниже вы видите матрицу путаницы:

А ниже виден компромисс между точностью и отзывом при разных порогах достоверности.

➡️ более низкий порог приводит к более высокому отзыву, но обычно ниже точность.

➡️ более высокий порог приводит к более низкому отзыву, но обычно более высокому точность.

Подробнее о пороге, точности и отзыве читайте здесь.

В заключение

В следующей статье я хочу рассмотреть производственное развертывание моделей Vertex.

⭐️ Подпишитесь на меня в LinkedIn, чтобы быть в курсе обновлений разговорного ИИ ⭐️

В настоящее время я являюсь главным евангелистом @ HumanFirst. Я исследую и пишу обо всем на стыке ИИ и языка; начиная от LLM, чат-ботов, голосовых роботов, платформ разработки, скрытых пространств, ориентированных на данные и т. д.

Инструменты проектирования NLU
«Конструктор диалогов, розничная торговля, более 10 000 сотрудников. Инструмент, который превратил дизайнеров диалогов в дизайнеров NLU ★★★★★…www.humanfirst .ai»

Получать электронное письмо каждый раз, когда Cobus Greyling публикует.
Получать электронное письмо, когда Cobus Greyling публикует. Зарегистрировавшись, вы создадите учетную запись Medium, если вы еще этого не сделали…cobusgreyling.medium.com

Cobus Quadrant™ дизайна NLU
Дизайн NLU жизненно важен для планирования и постоянного улучшения диалогового ИИ.cobusgreyling.medium.com

Возможности проектирования разговоров Cobus Quadrant™
∗ Это первая часть серии из двух частей. Пожалуйста, ознакомьтесь также со второй частью, Cobus Quadrant of NLU Design.cobusgreyling.medium.com

Большие языковые модели, генеративный ИИ и Google Cloud Vertex AI
Google запустила Vertex AI 18 мая 2021 года на конференции Google I/O, и, похоже, продукт показал себя хорошо, учитывая все …cobusgreyling.medium.com

Создание обучающих данных для классификации текста в Google Cloud Vertex AI
В следующих постах я подробно расскажу о Google Vertex AI. Этот пост посвящен инженерии данных и…cobusgreyling.medium.com

Основной ландшафт технологий диалогового ИИ
И быстрое расширение поддержки модели большого языка (LLM).cobusgreyling.medium.com

Основная модель большого языка (LLM) и набор инструментов
Существует постоянно растущий список приложений для генеративного ИИ, которые можно разделить на восемь широких категорий.cobusgreyling.medium.com

Большие языковые модели вынуждают диалоговые фреймворки ИИ смотреть вовне
Поскольку фреймворкам навязывается фрагментация, становится все труднее быть автономным. Я также рассматриваю…cobusgreyling.medium.com

Вершинный ИИ | Google Cloud
Отправить отзыв Создавайте, развертывайте и масштабируйте модели машинного обучения (ML) быстрее с помощью полностью управляемых инструментов ML для любого использования…cloud.google.com

HappyDB
Сборник из 100 000 собранных с помощью краудсорсинга счастливых моментовwww.kaggle.com

Обучение и тестирование моделей классификации текста с помощью Google Cloud Vertex AI