Обучение и тестирование моделей классификации текста с помощью Google Cloud Vertex AI
Используя функцию Google AutoML, модели классификации можно создавать практически без технических усилий.
Для начала несколько общих замечаний:
- Есть много элементов Vertex AI в целом и AutoML в частности, что напоминает мне HuggingFace🤗 autoTRAIN.
- AutoML позволяет быстро создавать прототипы и исследовать наборы данных, используя подход без кодовой студии.
- Vertex AI имеет два варианта классификации текста: классификацию с одной или несколькими метками. Создание иерархий классов или таксономий невозможно.
- Время обучения модели относительно велико. Традиционные модели NLU добились больших успехов с точки зрения дополнительного обучения. Инкрементное обучение — это понятие добавления новых данных к существующей модели. Вдобавок к этому значительно сократилось время обучения традиционных моделей NLU.
Несмотря на то, что AutoML предназначен для упрощения процесса создания модели ML, двумя элементами, которые легко настраиваются, являются разделение данных и наборы аннотаций.
Разделение данных. По умолчанию AutoML случайным образом назначает каждый элемент в вашем наборе данных обучающим, проверочным и тестовым наборам в соотношении 80/10/10 соответственно. Вы можете изменить это соотношение или даже вручную назначить каждый элемент данных набору.
Наборы аннотаций. В наборах аннотаций хранятся аннотации, поэтому вы можете использовать тот же набор данных для других моделей и целей. Например, вы можете использовать тот же самый набор данных «счастье» для обучения модели классификации с несколькими метками вместо модели с одной меткой.
Но я спешу упомянуть, что Vertex AI не хватает восходящего, ориентированного на данные подхода к сбору и структурированию обучающих данных.
⭐️ Подпишитесь на меня в LinkedIn, чтобы быть в курсе обновлений разговорного ИИ ⭐️
В предыдущем посте я прошел через процесс создания набора данных и обучения модели машинного обучения.
На изображении ниже видна панель инструментов Vertex AI, в разделе последние модели новая модель указана со средней точностью.
После доступа к модели в верхней части страницы появляется полоса прогресса. Здесь вновь созданную модель можно оценить, развернуть, протестировать и т. д.
На изображении ниже вы можете видеть, что модель можно протестировать с более длинным вводом. Справа от изображения видны ярлыки с отмеченным ярлыком enjoy_the_moment.
Вернувшись на вкладку оценки, вы увидите, что для каждой модели доступно несколько графических индикаторов быстрого просмотра.
Ниже вы видите матрицу путаницы:
А ниже виден компромисс между точностью и отзывом при разных порогах достоверности.
➡️ более низкий порог приводит к более высокому отзыву, но обычно ниже точность.
➡️ более высокий порог приводит к более низкому отзыву, но обычно более высокому точность.
Подробнее о пороге, точности и отзыве читайте здесь.
В заключение
В следующей статье я хочу рассмотреть производственное развертывание моделей Vertex.
⭐️ Подпишитесь на меня в LinkedIn, чтобы быть в курсе обновлений разговорного ИИ ⭐️
В настоящее время я являюсь главным евангелистом @ HumanFirst. Я исследую и пишу обо всем на стыке ИИ и языка; начиная от LLM, чат-ботов, голосовых роботов, платформ разработки, скрытых пространств, ориентированных на данные и т. д.
Инструменты проектирования NLU
«Конструктор диалогов, розничная торговля, более 10 000 сотрудников. Инструмент, который превратил дизайнеров диалогов в дизайнеров NLU ★★★★★…www.humanfirst .ai»