В этой статье мы углубимся в мир логотипов, созданных искусственным интеллектом с помощью Stable Diffusion. Мы рассмотрим рабочий процесс, который использует ControlNet для создания высококачественных логотипов с нуля. В этой статье рассказывается об основах генерации изображений с использованием Stable Diffusion версии 1.5: существует множество различных механизмов управления, которые используются для изменения базовой нейронной сети, которые хорошо документированы и слишком обширны, чтобы их можно было охватить здесь.

Шаг 1. Установка Stable Diffusion

Первым шагом является установка Stable Diffusion на ваш компьютер. Подробную инструкцию о том, как это сделать, вы можете найти здесь: Руководство по установке.

Из-за интенсивного использования памяти и обработки диффузионных моделей для их производительности и возможностей требуется довольно современный графический процессор Radeon или NVidia с не менее 8 ГБ свободной видеопамяти и 10–20 ГБ свободного места на локальном диске, предпочтительно SSD. .

Шаг 2. Настройка среды

После установки Stable Diffusion вам необходимо настроить среду. Сюда входит установка Python и настройка виртуальной среды. Подробные инструкции можно найти в официальной документации: Настройка среды.

Шаг 3. Создание изображений

Теперь, когда ваша среда настроена, вы можете приступить к созданию изображений. Для этого вы воспользуетесь инструментом командной строки Stable-Diffusion. Основной синтаксис следующий:

stable-diffusion generate 
  --seed 42 
  --n_iter 20 
  --n_samples 1 
  --scale 1
  --noise_scale 0.5 
  --text "a lineart style professional logo, a cat sitting under a tree." 
  -- output_file "my_image.png"

Замените «my_image.png» именем файла, в который вы хотите сохранить изображение.

Значение –seed — это просто случайное число, которое используется для создания начального гауссова шума, который используется для уточнения конечного изображения. Изменение этого значения приведет к генерации существенно отличающихся результатов.

Шаг 3.1. Использование предварительно обученных контрольных точек, отличных от стандартных

Стабильное распространение поставляется с генеративной моделью искусственного интеллекта, которая используется в качестве базовой контрольной точки. В этой демонстрации мы используем популярную стабильную контрольную точку диффузии 1.5, однако существует множество тонко настроенных контрольных точек, которые были усовершенствованы сообществом открытого исходного кода для создания изображений, которые отличаются по стилю и часто по конкретным возможностям.

Например, если базовая модель SD 1.5 не создает качественных изображений ткани, пользователь может точно настроить модель, используя сотни или тысячи изображений тканей, снабженных метаданными, что позволяет получать на выходе изображения, способные создавать более реалистичные и более изменчивые ткани. Или, если конкретный художник отсутствует в исходном наборе обучающих данных, пользователь может предоставить многочисленные примеры работ этого художника, что позволит модели генерировать выходные данные, похожие по стилю на этого художника.

Для этого существует ряд различных механизмов, но два механизма являются наиболее популярными для изменения базовой нейронной модели и приводят к возможности смешивать и генерировать варианты, которые не были обнаружены в обучающих данных. Эти два стиля используют предварительно обученные контрольные точки, которые заменяют модель SD1.5, и модели LORA, которые загружаются как дополнение к предварительно обученной контрольной точке.

Следует отметить, что LORA специфична для контрольной точки, поскольку она изменяет веса модели базовой контрольной точки в определенной точке генеративного конвейера. Например, если LORA был создан с использованием контрольной точки «35-миллиметровая черно-белая пленка со сверхвысоким разрешением», он может не работать должным образом на базовой модели SD1.5 (но поэкспериментируйте и посмотрите, какие уникальные и непредвиденные выдаёт результат!)

Шаг 4. Использование ControlNet

ControlNet — это инструмент, который позволяет вам контролировать процесс генерации, предоставляя эскиз или схему того, что вы хотите, чтобы сгенерировал ИИ. Чтобы использовать ControlNet, вам необходимо установить его отдельно. Инструкции о том, как это сделать, вы можете найти здесь: Установка ControlNet.

После установки вы можете использовать ControlNet, указав флаг —guide при запуске команды стабильной диффузии. Например:

stable-diffusion generate 
  --seed 42 
  --n_iter 20 
  --n_samples 1 
  --scale 1
  --noise_scale 0.5
  --guidance 
  --guidance_image <path_to_my_guide_image/Image.png> 
  --model canny
  --text "a lineart style professional logo, a cat sitting under a tree." 
  --output_file "my_image.png"

Если вы хотите дополнительно уточнить стиль сгенерированного изображения, вы можете использовать модель LORA. Для этого вам нужно запустить команду стабильной диффузии с помощью –loras ‹path_to_LORA_file>

Например, если бы LORA назывался «LOGO-Style», это была бы команда:

stable-diffusion generate 
  --seed 42 
  --n_iter 20 
  --n_samples 1 
  --scale 1
  --noise_scale 0.5
  --guidance 
  --guidance_image <path_to_my_guide_image/Image.png> 
  --model canny
  --loras <path_to_my_LORA/Logo-style>
  --text "a lineart style professional logo, a cat sitting under a tree." 
  --output_file "my_image.png"

Обратите внимание, что значения:«‹path_to_my_guide_image/Image.png›» и «‹path_to_my_LORA/Logo-style›» должны быть заменены фактическим путем к файлам.

Шаг 5. Точная настройка логотипа

После создания логотипа вы можете настроить его так, чтобы он выглядел именно так, как вам нужно. Это можно сделать, отрегулировав параметры в команде стабильной диффузии. Например, увеличение значения the — n_iter увеличит количество итераций, используемых моделью для создания изображения, что может привести к более подробным результатам.

Шаг 6. Сохранение и экспорт вашего логотипа

Наконец, когда вы будете довольны своим логотипом, вам нужно будет сохранить его и экспортировать в формат, который можно будет использовать для вашего веб-сайта или в материалах для брендинга. Stable Diffusion по умолчанию сохраняет изображения в формате PNG, но вы также можете экспортировать их в файлы SVG для масштабируемой векторной графики, используя флаг –format svg:

stable-diffusion generate 
  --seed 42 
  --n_iter 20 
  --n_samples 1 
  --scale 1
  --noise_scale 0.5
  --guidance 
  --guidance_image <path_to_my_guide_image/Image.png> 
  --model canny
  --loras <path_to_my_LORA/Logo-style>
  --text "a lineart style professional logo, a cat sitting under a tree." 
  --output_file "my_image.svg"
  --format svg

Вот и все! С помощью этого рабочего процесса вы можете создавать уникальные и профессионально выглядящие логотипы с помощью Stable Diffusion и ControlNet.

Приложение:

Ресурсы ControlNet:

Проверочные точки HuggingFace:

https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main

-Для этой демонстрации скачайте:

https://huggingface.co/lllyasviel/ControlNet-v1-1/blob/main/control_v11p_sd15_canny.pth

и;

https://huggingface.co/lllyasviel/ControlNet-v1-1/blob/main/control_v11p_sd15_canny.yaml

Репозиторий Github:

https://github.com/lllyasviel/ControlNet-v1-1-nightly

Проверочные точки стабильного распространения:

В целом хорошая настройка контрольной точки SD1.5:

https://civitai.com/models/4823/deliberate

Проверочные точки LORA для логотипов:

https://civitai.com/search/models?sortBy=models_v2&query=logo

Большой архив моделей SD:

https://88stacks.com/models/tags

На заметку:

Существует МНОГО моделей, специально разработанных для создания контента NSFW, поэтому при просмотре этих архивов обращайте внимание на свое окружение.

Примеры логотипов:

Вот несколько примеров логотипов, которые мне удалось быстро создать с помощью SD 1.5 и нескольких различных настроек LORA. В качестве подсказки: если вы ищете более сложный и стилистический логотип, я считаю, что архитектурный LORA дает отличные результаты.

В зависимости от вашего оборудования вы можете создать тысячи различных вариаций за час или два.

Исходные изображения Control Net:

Следующие изображения представляют собой несколько примеров различных логотипов и стилей, которые были созданы за пару дней: