Объяснение генеративных моделей искусственного интеллекта (генеративный ИИ)

В этой статье объясняется, что такое генеративные модели и чем отличается их подход к решению задач машинного обучения.

Одним из самых больших достижений искусственного интеллекта является его способность создавать новые вещи. До недавнего времени большинство моделей машинного обучения, лежащих в основе приложений ИИ, использовали дискриминационные модели.

Что такое дискриминационные модели? спросите вы, а чем они отличаются от генеративных моделей?

Дискриминационная модель — это просто условная модель, эти модели, как правило, отвечают на вопрос «как модель может лучше всего классифицировать некоторые данные» или «как модель может лучше всего предсказать значение».

С другой стороны, генеративная модель описывает, насколько хорошо могут быть сгенерированы данные.

Давайте воспользуемся примером, чтобы лучше понять эту концепцию.

Скажем, у нас есть задача определить, направлена ли камера на жирафа (это задача классификации бинарных изображений) как определить проблемы машинного обучения

Наиболее популярным подходом было бы обучение модели набору изображений (некоторые из которых должны быть жирафами, а другие — нет). Затем модель должна находить закономерности в тренировочных изображениях и делать прогнозы относительно того, направлена ли камера на жирафа или нет. Это дискриминационный подход.

С другой стороны, генеративная модель будет учиться на входных данных (изображения жирафа и отсутствие жирафа) и пытаться определить, больше ли изображение с пометкой «Жираф» напоминает данные, которые она видела раньше, чем изображение с пометкой «Жираф отсутствует». Это не останавливается на достигнутом, генеративные модели могут развиваться и поддерживать другой вариант использования. Шаблоны, изученные в генеративной модели, можно использовать для генерирования новых данных, которые будут похожи на данные, которые он видел раньше. Итак, новые изображения жирафа.

Таким образом, дискриминационные модели проводят границы в пространстве данных, в то время как генеративные модели пытаются «моделировать», как данные размещаются в пространстве данных.

Со статистической точки зрения дискриминантная модель — это модель условной вероятности.

Генеративная модель представляет собой совместное распределение вероятностей.

Теперь мы можем взглянуть на 3 популярных типа моделей генеративного ИИ и на то, что они делают.

Генеративно-состязательные сети (GAN)
Общие авторегрессионные модели
Модели на базе трансформера

Генеративно-состязательные сети (сети GAN)

***состязательный, означает участие двух людей или сторон, противостоящих друг другу***

Этот подход к машинному обучению включает в себя сопоставление двух сетей друг с другом для создания нового контента.

Алгоритм обучения переключается между обучением a:

i) Генераторная сеть — производит новые данные

ii) Сеть дискриминатора — измеряет, насколько близко данные сети генератора представляют обучающие данные.

Авторегрессивные модели

Эти модели используются для изучения систем, которые развиваются с течением времени, и предполагают вероятность появления некоторых данных. Однако этот прогноз зависит исключительно от исторических данных.

Такие модели отлично подходят для решения регрессивных задач, таких как предсказание погоды и предсказание фондового рынка.

Трансформаторные модели

Эти модели используются для изучения данных, которые встречаются в последовательной структуре. Например, последовательность слов в предложении. Поэтому они обычно используются при моделировании современного языка в области обработки естественного языка (NLP) и моделирования изображений Computer Vision (CN).

Алгоритмы генеративного ИИ можно классифицировать как алгоритмы машинного обучения без учителя и полуучителя. Уже одно это делает их достаточно разнообразными и позволяет генерировать новые данные в пространстве данных.

Я имею в виду, вы пробовали приложение Lensa, которое используют все? да, это Генеративный ИИ круто правда?

Объяснение генеративных моделей искусственного интеллекта (генеративный ИИ)

Генеративно-состязательные сети (сети GAN)

Авторегрессивные модели

Трансформаторные модели

Вопросы по теме