Imagen — одна из базовых моделей Google, модель преобразования текста в изображение, разработанная Google AI.

Новая базовая модель Google, Imagen, призвана воплотить ваши мечты в жизнь. Вы когда-нибудь задумывались, как бы выглядели ваши мечтательные описания пончиков в реальной жизни? Или фантазировал о том, чтобы быть пиратом с попугаем на плече? (Арр, Мати! 🦜)

Загляните в мир создания изображений. Только не вините меня, если вам вдруг захочется пончиков. 🍩

Imagen способен понимать нюансы человеческого языка, чтобы создавать реалистичные и креативные изображения. Это мощный новый инструмент, который может революционизировать то, как мы создаем изображения и взаимодействуем с ними. Существует большой потенциал для использования в самых разных приложениях.

Перейти прямо к блокноту

Весь код для этой статьи готов к использованию в блокноте Google Colab. Если у вас есть вопросы, свяжитесь со мной в LinkedIn. Хотя для этого конкретного случая использования и особенно во время быстрых экспериментов я настоятельно рекомендую пользовательский интерфейс Generative AI Studio от Google.

Очевидно, что если вы хотите запустить его в производство, используйте API.



Функции

Google Vertex AI Imagen предлагает 4 различные функции.

Генерация изображения

Генерировать изображения на основе подсказки (текстовое описание). Я попробовал это с изображением кучи разноцветных пончиков.

Я пробовал различные варианты использования, и он хорошо работает для реалистичных и творческих вариантов использования.

Кое-где есть признаки и небольшие странные проблемы и недостатки в изображениях, которые все еще показывают, что необходимы дополнительные улучшения.

Как в этом примере, где один из пончиков содержит глаз.