Публикации по теме 'text-to-image-generation'


Обучение стабильной диффузии с обниманием лица за 5 минут
Простой способ создавать модные изображения, быстро и бесплатно. Введение Hugging Face — поставщик технологий машинного обучения с открытым исходным кодом и платформой. Hugging Face был запущен в 2016 году и имеет штаб-квартиру в Нью-Йорке. Мы посетили его стенд на AI Hardware Summit and Edge AI Summit 2022 . Это удивительное сообщество ИИ, которое создает, обучает и развертывает современные модели, основанные на использовании открытого исходного кода в машинном обучении. Он..

Углубленный взгляд на стабильную диффузию
Мы все слышали о Stable Diffusion, инструменте генеративного ИИ, который создает изображения из текста (и может делать гораздо больше), но как он на самом деле работает? Понимание моделей распространения: Диффузионная модель обучается путем добавления шума, сгенерированного планировщиком шума, к изображению (или «сжатому» представлению изображения, как мы увидим позже) и заставляя модель постепенно обращать этот процесс вспять в течение многих шагов. Давайте Во-первых, гауссовский..

Как настроить SDXL 0.9
Скачать с https://huggingface.co/stabilityai/stable-diffusion-xl-base-0.9 . Вы можете заполнить форму чем угодно. Загрузите ComfyUI с https://github.com/comfyanonymous/ComfyUI . Разархивируйте ComfyUI. Скопируйте загруженный sd_xl_base_0.9.safetensors в \ComfyUI_windows_portable\ComfyUI\models\checkpoints. Запустите run_nvidia_gpu.bat. Измените ширину и высоту в разделе «Пустое скрытое изображение» на 1024. В Ksampler измените имя сэмплера на dpmpp_2s_ancestral. Введите..

Как настроить стабильную диффузию с помощью LoRA
Персонализированные сгенерированные изображения с пользовательскими наборами данных Ранее я рассматривал следующие статьи о тонкой настройке модели стабильной диффузии для создания персонализированных изображений: Как настроить стабильную диффузию с помощью текстовой инверсии Как настроить стабильную диффузию с помощью Dreambooth Руководство для начинающих …

DALL-E может подружиться с Flamingo
Введение Любой, кто раньше работал с DALL-E 2, вероятно, знаком с тем, как, когда вы вводите ему текст, он возвращает несколько различных возможных генераций изображения для этого текста. Это связано с тем, как модель генерирует изображения из случайно инициализированного шума и делает это несколько раз с различным шумом, чтобы дать вам, пользователю, некоторое разнообразие. Но со многими изображениями, соответствующими одному текстовому вводу, можно спросить: «Какое изображение лучше..

DreamShaper: улучшенная версия стабильной диффузии
Введение Стабильная диффузия — это популярный алгоритм, который использовался в различных задачах машинного обучения, таких как сегментация изображений, шумоподавление и закрашивание. Однако у исходного алгоритма есть некоторые ограничения, такие как медленная сходимость и сложность обработки многомерных данных. Для решения этих проблем исследователи предложили доработанную версию Stable Diffusion под названием DreamShaper. В этом сообщении блога мы обсудим ключевые функции и..