В этой статье объясняется, что такое генеративные модели и чем отличается их подход к решению задач машинного обучения.

Одним из самых больших достижений искусственного интеллекта является его способность создавать новые вещи. До недавнего времени большинство моделей машинного обучения, лежащих в основе приложений ИИ, использовали дискриминационные модели.

Что такое дискриминационные модели? спросите вы, а чем они отличаются от генеративных моделей?

Дискриминационная модель — это просто условная модель, эти модели, как правило, отвечают на вопрос «как модель может лучше всего классифицировать некоторые данные» или «как модель может лучше всего предсказать значение».

С другой стороны, генеративная модель описывает, насколько хорошо могут быть сгенерированы данные.

Давайте воспользуемся примером, чтобы лучше понять эту концепцию.

Скажем, у нас есть задача определить, направлена ​​ли камера на жирафа (это задача классификации бинарных изображений) как определить проблемы машинного обучения

Наиболее популярным подходом было бы обучение модели набору изображений (некоторые из которых должны быть жирафами, а другие — нет). Затем модель должна находить закономерности в тренировочных изображениях и делать прогнозы относительно того, направлена ​​ли камера на жирафа или нет. Это дискриминационный подход.

С другой стороны, генеративная модель будет учиться на входных данных (изображения жирафа и отсутствие жирафа) и пытаться определить, больше ли изображение с пометкой «Жираф» напоминает данные, которые она видела раньше, чем изображение с пометкой «Жираф отсутствует». Это не останавливается на достигнутом, генеративные модели могут развиваться и поддерживать другой вариант использования. Шаблоны, изученные в генеративной модели, можно использовать для генерирования новых данных, которые будут похожи на данные, которые он видел раньше. Итак, новые изображения жирафа.

Таким образом, дискриминационные модели проводят границы в пространстве данных, в то время как генеративные модели пытаются «моделировать», как данные размещаются в пространстве данных.

Со статистической точки зрения дискриминантная модель — это модель условной вероятности.

Генеративная модель представляет собой совместное распределение вероятностей.

Теперь мы можем взглянуть на 3 популярных типа моделей генеративного ИИ и на то, что они делают.

  1. Генеративно-состязательные сети (GAN)
  2. Общие авторегрессионные модели
  3. Модели на базе трансформера

Генеративно-состязательные сети (сети GAN)

***состязательный, означает участие двух людей или сторон, противостоящих друг другу***

Этот подход к машинному обучению включает в себя сопоставление двух сетей друг с другом для создания нового контента.

Алгоритм обучения переключается между обучением a:

i) Генераторная сеть — производит новые данные

ii) Сеть дискриминатора — измеряет, насколько близко данные сети генератора представляют обучающие данные.

Авторегрессивные модели

Эти модели используются для изучения систем, которые развиваются с течением времени, и предполагают вероятность появления некоторых данных. Однако этот прогноз зависит исключительно от исторических данных.

Такие модели отлично подходят для решения регрессивных задач, таких как предсказание погоды и предсказание фондового рынка.

Трансформаторные модели

Эти модели используются для изучения данных, которые встречаются в последовательной структуре. Например, последовательность слов в предложении. Поэтому они обычно используются при моделировании современного языка в области обработки естественного языка (NLP) и моделирования изображений Computer Vision (CN).

Алгоритмы генеративного ИИ можно классифицировать как алгоритмы машинного обучения без учителя и полуучителя. Уже одно это делает их достаточно разнообразными и позволяет генерировать новые данные в пространстве данных.

Я имею в виду, вы пробовали приложение Lensa, которое используют все? да, это Генеративный ИИ круто правда?