Jump to content

Как писать правильные промты для нейросети Stable Diffusion


Recommended Posts

Давайте подробно разберем тему: "Как писать правильные промты для нейросети Stable Diffusion". Промт, или, по-другому, запрос для Stable Diffusion, представляет собой текстовое описание людей и объектов, которые вы хотите увидеть в виде изображений. Эти запросы можно условно классифицировать на базовые и более сложные. В данной статье мы подробно рассмотрим все аспекты.

7ed3f5f2-6b03-4c70-a313-6f43e1b2c8fe.png

Базовые промты (запросы) могут выглядеть так: "женщина с зонтом в парке", "средневековый замок" и подобные. Тем не менее, вы можете формулировать такие запросы и без дополнительных деталей, но в этом случае результаты могут оказаться не совсем удовлетворительными. Поэтому давайте более подробно рассмотрим способы управления результатами генерации в @yes_ai_bot.

Когда вы работаете с нейросетью Stable Diffusion в @yes_ai_bot, у вас есть возможность вводить текстовые запросы на любом языке. В этой статье мы приведем примеры на русском языке.


Правила использования знаков препинания в контексте создания промптов для Stable Diffusion

Рассмотрим несколько основных рекомендаций, которые стоит учитывать при формулировании промптов.

В начале запроса следует указать главный объект (или объекты), которые необходимо изобразить, например, "слон".

Далее добавляются дополнительные характеристики, такие как одежда, окружение, другие персонажи и так далее, разделяя их запятыми. Например, "слон в золотых доспехах, на фоне летающих птиц".

Если искусственный интеллект не учел какой-либо из упомянутых объектов, то фраза, описывающая этот объект, может быть выделена круглыми скобками (), чтобы подчеркнуть ее значимость. Например, "слон с (большими ушами), на фоне (птиц), которые летают".

В этом примере фраза "большими ушами" и слово "птицы" заключены в скобки, чтобы обозначить их увеличенную значимость на 10% по сравнению с другими элементами текста. Это помогает нейросети осознать, что эти термины имеют более важное значение. Альтернативный метод увеличения значимости может выглядеть так: "слон с (большими ушами:1.2), на фоне неба летают (((птицы)))".

Здесь мы повысили важность фразы "большими ушами" на 20%, а слова "птицы" на 30%. Каждая пара круглых скобок увеличивает значимость на 10%, в то время как значения от "1.1" до "1.7" представляют собой коэффициенты от 10% до 70%. При указании более высокого значения значимости существует высокая вероятность того, что нейросеть создаст шум вместо ожидаемого изображения.

Цитата

Внимание! Не рекомендуется применять более пяти круглых скобок для увеличения значимости каждого отдельного словосочетания.

Аналогично, весовые коэффициенты должны находиться в пределах от 0.1 до 1.7; однако на практике оптимально не превышать 1.4.

Чрезмерно высокий весовой коэффициент может привести к искажению результатов генерации.


Когда применяются квадратные скобки?

Существует несколько ситуаций, давайте начнем с "смешивания" или "скрещивания". Например, "[слон:шерсть:0.4]". В этом подходе нейросеть будет изображать слона на протяжении 40% от общего числа шагов сэмплинга, в то время как оставшиеся 60% будут посвящены добавлению шерсти к слону. Количество шагов сэмплинга можно настроить в основных параметрах SD: "24 шага" или "35 шагов".

Кроме того, аналогичным образом можно создавать мутации объектов, например, "[кот:пчела:0.3] сидит на скамейке". Сначала нейросеть будет рисовать кота на 30%, а затем попытается трансформировать его в пчелу на 70%. В итоге получится мутант, который будет находиться на скамейке.

Рекомендуется использовать только запятые в качестве разделителей фраз и избегать других знаков препинания. Не стоит применять переносы строк, точки, многоточия и подобные символы.

Не стоит создавать слишком длинные запросы, так как это может негативно сказаться на результате. Вот пример запроса подходящей длины: "лето, ((fullbody)), летняя фея, невероятно красивая, изящная и притягательная, окруженная цветами, бабочками и зеленой травой, наслаждаясь прекрасной погодой, искусство, кинематографическое освещение, мягкие тени".

Если вам нужно внести изменения в изображение, такие как добавление новых элементов или исправление ошибок, вместо того чтобы увеличивать запрос, лучше использовать функцию INPAINT. В одной из следующих статей мы подробно обсудим эту функцию и ее возможности.

Посмотрите ролик, в котором подробно объясняется, как корректно формулировать промпты для Stable Diffusion.

  • Like 2
  • Like 1

image.png.9d5b4205072e7e483a6f7d59aebe58e3.pngimage.pngimage.png.401b8a419d2091e7d0b7f9d60646a724.png

Link to comment
Share on other sites

  • admin pinned this topic
Краткий анализ публикации: В статье рассматривается процесс создания правильных промтов (текстовых запросов) для нейросети Stable Diffusion, которая генерирует изображения на основе введенных описаний. Описаны базовые и более сложные способы формулирования запросов, включая использование знаков препинания и скобок для управления значимостью элементов описания. Приведены рекомендации по оптимальной длине запроса и применению функции INPAINT для внесения изменений в изображения.
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...