Перейти к содержанию

Как писать правильные промты для нейросети Stable Diffusion


Рекомендуемые сообщения

  • Модератор

Давайте подробно разберем тему: "Как писать правильные промты для нейросети Stable Diffusion". Промт для нейросети Stable Diffusion, или запрос, представляет собой текстовое описание людей и объектов, которые вы хотите увидеть в качестве изображений. Эти запросы можно условно классифицировать на базовые и более сложные. В данной статье будут подробно рассмотрены те и другие.

image.png

Базовые промты могут выглядеть так: "женщина с зонтом в парке", "средневековый замок" и подобные. Вы можете формулировать такие запросы и без дополнительных деталей, но в этом случае результаты могут оказаться не совсем удовлетворительными и придется обращаться к более сложным запросам. Поэтому подробно рассмотрим способы управления результатами генерации в @yes_ai_bot.

Когда вы работаете с нейросетью Stable Diffusion в @yes_ai_bot, есть возможность вводить текстовые запросы на любом языке. Здесь приведены примеры на русском языке


Основные рекомендации, которые стоит учитывать при формулировании промптов:

  • В начале запроса следует указать главный объект (или объекты), которые необходимо изобразить, например, "слон".

  • Далее добавляются дополнительные характеристики, такие как одежда, окружение, другие персонажи и так далее. Разделяем их запятыми. Например, "слон в золотых доспехах, на фоне летающих птиц".

  • Если искусственный интеллект не учел какой-либо из упомянутых объектов, то фраза, описывающая этот объект, может быть выделена круглыми скобками, чтобы подчеркнуть ее значимость. Например, "слон с (большими ушами), на фоне (птиц), которые летают".

В этом примере фраза "большими ушами" и слово "птицы" заключены в скобки, чтобы обозначить их увеличенную значимость на 10% по сравнению с другими элементами текста. Это помогает нейросети осознать, что данные слова имеют более важное значение. Альтернативный метод увеличения значимости может выглядеть так: "слон с (большими ушами:1.2), на фоне неба летают (((птицы)))".

Здесь мы повысили важность фразы "большими ушами" на 20%, а слова "птицы" на 30%. Каждая пара круглых скобок увеличивает значимость на 10%, в то время как значения от "1.1" до "1.7" представляют собой коэффициенты от 10% до 70%. При указании более высокого значения значимости существует высокая вероятность того, что нейросеть создаст шум вместо ожидаемого изображения.

Цитата

Внимание! Не рекомендуется применять более пяти круглых скобок для увеличения значимости каждого отдельного словосочетания.

Весовые коэффициенты находятся в пределах от 0.1 до 1.7, однако на практике не должны превышать 1.4.

Чрезмерно высокий весовой коэффициент может привести к искажению результатов генерации.


Правила использования знаков препинания при создании промтов для Stable Diffusion

  • Рекомендуется использовать только запятые в качестве разделителей фраз и избегать других знаков препинания.

  • Не стоит применять переносы строк, точки, многоточия и подобные символы.

  • Не стоит создавать слишком длинные запросы, так как это может негативно сказаться на результате.

  • Вот пример запроса подходящей длины: "лето, ((fullbody)), летняя фея, невероятно красивая, изящная и притягательная, окруженная цветами, бабочками и зеленой травой, наслаждаясь прекрасной погодой, искусство, кинематографическое освещение, мягкие тени".

  • Квадратные скобки применяются при "смешивании" или "скрещивании". Например, "[слон:шерсть:0.4]". В этом подходе нейросеть будет изображать слона на протяжении 40% от общего числа шагов сэмплинга, в то время как оставшиеся 60% будут посвящены добавлению шерсти к слону. Количество шагов сэмплинга можно настроить в основных параметрах SD: "24 шага" или "35 шагов".

Кроме того, аналогичным образом можно создавать мутации объектов, например, "[кот:пчела:0.3] сидит на скамейке". Сначала нейросеть будет рисовать кота на 30%, а затем попытается трансформировать его в пчелу на 70%. В итоге получится мутант, который будет находиться на скамейке.

Если вам нужно внести изменения в изображение, такие как добавление новых элементов или исправление ошибок, вместо того чтобы увеличивать запрос, лучше использовать функцию INPAINT. В одной из следующих статей мы подробно обсудим эту функцию и ее возможности.

!!! Как корректно формулировать промты для Stable Diffusion, объясняется здесь

image.png.9d5b4205072e7e483a6f7d59aebe58e3.pngimage.pngimage.png.401b8a419d2091e7d0b7f9d60646a724.png

Ссылка на комментарий
Поделиться на другие сайты

  • admin закрепил тема
Краткий анализ публикации: В статье рассматривается процесс создания правильных промтов (текстовых запросов) для нейросети Stable Diffusion, которая генерирует изображения на основе введенных описаний. Описаны базовые и более сложные способы формулирования запросов, включая использование знаков препинания и скобок для управления значимостью элементов описания. Приведены рекомендации по оптимальной длине запроса и применению функции INPAINT для внесения изменений в изображения.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...