Перейти к содержанию

Нейросеть Stable Diffusion создает изображение с ошибкой: вместо одного человека генерируется несколько фигур. Как это решить?


Рекомендуемые сообщения

В этой статье разберем частые случаи, когда нейросеть Stable Diffusion создает изображение с ошибкой: вместо одного человека генерируется несколько фигур. В процессе создания изображения пользователи часто полагают, что следуют правильным процедурам, но сталкиваются с разочарованием, поскольку «тупой» ИИ, похоже, неправильно интерпретирует их инструкции. Тем не менее, основные причины этих проблем, как правило, более обыденны.

 

3cf82f88-0afa-4d07-afcf-b2e84993cd8f.png

Первая причина

Проблема может возникнуть при попытке создать изображение со значительно большей шириной по сравнению с его высотой, например изображение размером 768x512 пикселей. Аналогично это осложнение может проявиться, когда высота значительно превышает ширину.

В чем причина этого явления?

Современные модели искусственного интеллекта для обработки изображений в основном обучаются с использованием квадратных изображений, то есть они работают оптимально при работе с соотношением сторон 1:1. Отклонение от этих пропорций может привести к искажению результатов, например:

  • когда изображение больше в ширину, чем в высоту, часто возникает проблема с появлением повторяющихся фигур;
  • и наоборот, когда изображение больше в высоту, чем в ширину, возникает тенденция к неестественному удлинению частей тела, таких как конечности и головы.

Решение 1: Создайте несколько генераций и четко укажите количество людей в промте, например «1woman» или «1cat».

Решение 2: Если ширина (или высота) сгенерированного изображения значительно превышает его высоту (или ширину), рассмотрите возможность его уменьшения.

Решение 3: Укажите близость объекта (например, человека), включив в свой запрос конкретные показатели (термины или выражения):

  • для ближней перспективы используйте слово «closeup»
  • для полного просмотра с головы до ног используйте «fullbody» (обратите внимание, что это может привести к увеличению вероятности дублирования)

Решение 4: Использование <lora:114460:Х>, уникально разработанного для регулировки близости между камерой и создаваемым объектом. Подробный обзор этой конкретной LoRa можно найти по ссылке в нашей группе в Telegram — https://t.me/yes_ai_chat/10/4294

Вторая причина

В описании промта для нейронной сети могут возникать ошибки. Непреднамеренно вы могли сослаться на нескольких человек.

Решение: Удалите из промта любые предложения, предполагающие необходимость проиллюстрировать несколько персонажей или объектов. Например, вы можете начать подсказку со слов «1woman» и гарантировать, что если позднее будет упомянуто полное имя или псевдоним известного человека, будет ясно, что должен быть изображен только один объект, чтобы избежать путаницы для нейронной сети.

Такая ошибка встречается редко, поскольку по этой причине ИИ обычно не создает дубликаты.

Рекомендуем ознакомиться с рекомендациями по составлению промтов для «Stable Diffusion».

 

 

Третья причина

Включение текстовых инверсий (embeddings) и указание таких объектов, как отдельные лица и объекты.

Решение: Если ваши промты предполагают включение человека, скажем, «1woman», одновременно с текстовой инверсией, которая побуждает создать человеческую фигуру, ИИ может попытаться визуализировать оба элемента. В таких случаях рассмотрите возможность исключения слова (токена) на человека или текстовой инверсии в ваших промтах. Случаи этой ошибки встречаются редко, поскольку ИИ обычно не создает дубликаты по этой причине.

 

Узнайте больше об Yes Ai, просмотрев нашу краткую видеопрезентацию:

👀 Зеркало ссылка на запись в RuTube - https://rutube.ru/video/d6d59948e5a190251e6afed0cd080188

 

image.png.9d5b4205072e7e483a6f7d59aebe58e3.pngimage.png.401b8a419d2091e7d0b7f9d60646a724.png

Ссылка на комментарий
Поделиться на другие сайты

Описание ключевых аспектов статьи: Статья посвящена проблеме генерации изображений с дубликатами людей нейросетью Stable Diffusion. Автор рассматривает три основные причины возникновения этой ошибки:

1. **Несоответствие пропорций изображения:** Модели искусственного интеллекта, используемые для обработки изображений, в основном обучены на квадратных изображениях (соотношение сторон 1:1). Отклонение от этих пропорций может привести к искажениям, например, при широких изображениях могут появляться повторяющиеся фигуры. Решением проблемы является создание нескольких генераций, четкое указание количества людей в промте, изменение пропорций изображения, использование термина «closeup» для ближней перспективы или «fullbody» для полного обзора, а также применение LoRa для регулировки расстояния между камерой и объектом.

2. **Ошибки в описании промта:** Непреднамеренное указание на нескольких людей в промте может привести к генерации дубликатов. Решение — удаление из промта любых предложений, предполагающих необходимость проиллюстрировать несколько персонажей.

3. **Включение текстовых инверсий:** Совместное использование промта с текстовой инверсией, которая побуждает создать человеческую фигуру, может привести к генерации дубликатов. Решением является исключение слова (токена) на человека или текстовой инверсии в ваших промтах.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...