Jump to content

Нейросеть Stable Diffusion создает изображение с ошибкой: вместо одного человека генерируется несколько фигур. Как это решить?


Recommended Posts

В этой статье разберем частые случаи, когда нейросеть Stable Diffusion создает изображение с ошибкой: вместо одного человека генерируется несколько фигур. В процессе создания изображения пользователи часто полагают, что следуют правильным процедурам, но сталкиваются с разочарованием, поскольку «тупой» ИИ, похоже, неправильно интерпретирует их инструкции. Тем не менее, основные причины этих проблем, как правило, более обыденны.

 

3cf82f88-0afa-4d07-afcf-b2e84993cd8f.png

Первая причина

Проблема может возникнуть при попытке создать изображение со значительно большей шириной по сравнению с его высотой, например изображение размером 768x512 пикселей. Аналогично это осложнение может проявиться, когда высота значительно превышает ширину.

В чем причина этого явления?

Современные модели искусственного интеллекта для обработки изображений в основном обучаются с использованием квадратных изображений, то есть они работают оптимально при работе с соотношением сторон 1:1. Отклонение от этих пропорций может привести к искажению результатов, например:

  • когда изображение больше в ширину, чем в высоту, часто возникает проблема с появлением повторяющихся фигур;
  • и наоборот, когда изображение больше в высоту, чем в ширину, возникает тенденция к неестественному удлинению частей тела, таких как конечности и головы.

Решение 1: Создайте несколько генераций и четко укажите количество людей в промте, например «1woman» или «1cat».

Решение 2: Если ширина (или высота) сгенерированного изображения значительно превышает его высоту (или ширину), рассмотрите возможность его уменьшения.

Решение 3: Укажите близость объекта (например, человека), включив в свой запрос конкретные показатели (термины или выражения):

  • для ближней перспективы используйте слово «closeup»
  • для полного просмотра с головы до ног используйте «fullbody» (обратите внимание, что это может привести к увеличению вероятности дублирования)

Решение 4: Использование <lora:114460:Х>, уникально разработанного для регулировки близости между камерой и создаваемым объектом. Подробный обзор этой конкретной LoRa можно найти по ссылке в нашей группе в Telegram — https://t.me/yes_ai_chat/10/4294

Вторая причина

В описании промта для нейронной сети могут возникать ошибки. Непреднамеренно вы могли сослаться на нескольких человек.

Решение: Удалите из промта любые предложения, предполагающие необходимость проиллюстрировать несколько персонажей или объектов. Например, вы можете начать подсказку со слов «1woman» и гарантировать, что если позднее будет упомянуто полное имя или псевдоним известного человека, будет ясно, что должен быть изображен только один объект, чтобы избежать путаницы для нейронной сети.

Такая ошибка встречается редко, поскольку по этой причине ИИ обычно не создает дубликаты.

Рекомендуем ознакомиться с рекомендациями по составлению промтов для «Stable Diffusion».

 

 

Третья причина

Включение текстовых инверсий (embeddings) и указание таких объектов, как отдельные лица и объекты.

Решение: Если ваши промты предполагают включение человека, скажем, «1woman», одновременно с текстовой инверсией, которая побуждает создать человеческую фигуру, ИИ может попытаться визуализировать оба элемента. В таких случаях рассмотрите возможность исключения слова (токена) на человека или текстовой инверсии в ваших промтах. Случаи этой ошибки встречаются редко, поскольку ИИ обычно не создает дубликаты по этой причине.

 

Узнайте больше об Yes Ai, просмотрев нашу краткую видеопрезентацию:

 

  • Like 2

image.png.9d5b4205072e7e483a6f7d59aebe58e3.pngimage.png.401b8a419d2091e7d0b7f9d60646a724.png

Link to comment
Share on other sites

Описание ключевых аспектов статьи: Статья посвящена проблеме генерации изображений с дубликатами людей нейросетью Stable Diffusion. Автор рассматривает три основные причины возникновения этой ошибки:

1. **Несоответствие пропорций изображения:** Модели искусственного интеллекта, используемые для обработки изображений, в основном обучены на квадратных изображениях (соотношение сторон 1:1). Отклонение от этих пропорций может привести к искажениям, например, при широких изображениях могут появляться повторяющиеся фигуры. Решением проблемы является создание нескольких генераций, четкое указание количества людей в промте, изменение пропорций изображения, использование термина «closeup» для ближней перспективы или «fullbody» для полного обзора, а также применение LoRa для регулировки расстояния между камерой и объектом.

2. **Ошибки в описании промта:** Непреднамеренное указание на нескольких людей в промте может привести к генерации дубликатов. Решение — удаление из промта любых предложений, предполагающих необходимость проиллюстрировать несколько персонажей.

3. **Включение текстовых инверсий:** Совместное использование промта с текстовой инверсией, которая побуждает создать человеческую фигуру, может привести к генерации дубликатов. Решением является исключение слова (токена) на человека или текстовой инверсии в ваших промтах.
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...