статья Нейросеть Stable Diffusion создает изображение с ошибкой: вместо одного человека генерируется несколько фигур. Как это решить?

**Baki** · 5 июля, 2024

В этой статье разберем частые случаи, когда нейросеть Stable Diffusion создает изображение с ошибкой: вместо одного человека генерируется несколько фигур. В процессе создания изображения пользователи часто полагают, что следуют правильным процедурам, но сталкиваются с разочарованием, поскольку «тупой» ИИ, похоже, неправильно интерпретирует их инструкции. Тем не менее, основные причины этих проблем, как правило, более обыденны.

Первая причина

Проблема может возникнуть при попытке создать изображение со значительно большей шириной по сравнению с его высотой, например изображение размером 768x512 пикселей. Аналогично это осложнение может проявиться, когда высота значительно превышает ширину.

В чем причина этого явления?

Современные модели искусственного интеллекта для обработки изображений в основном обучаются с использованием квадратных изображений, то есть они работают оптимально при работе с соотношением сторон 1:1. Отклонение от этих пропорций может привести к искажению результатов, например:

когда изображение больше в ширину, чем в высоту, часто возникает проблема с появлением повторяющихся фигур;
и наоборот, когда изображение больше в высоту, чем в ширину, возникает тенденция к неестественному удлинению частей тела, таких как конечности и головы.

Решение 1: Создайте несколько генераций и четко укажите количество людей в промте, например «1woman» или «1cat».

Решение 2: Если ширина (или высота) сгенерированного изображения значительно превышает его высоту (или ширину), рассмотрите возможность его уменьшения.

Решение 3: Укажите близость объекта (например, человека), включив в свой запрос конкретные показатели (термины или выражения):

для ближней перспективы используйте слово «closeup»
для полного просмотра с головы до ног используйте «fullbody» (обратите внимание, что это может привести к увеличению вероятности дублирования)

Решение 4: Использование <lora:114460:Х>, уникально разработанного для регулировки близости между камерой и создаваемым объектом. Подробный обзор этой конкретной LoRa можно найти по ссылке в нашей группе в Telegram — https://t.me/yes_ai_chat/10/4294

Вторая причина

В описании промта для нейронной сети могут возникать ошибки. Непреднамеренно вы могли сослаться на нескольких человек.

Решение: Удалите из промта любые предложения, предполагающие необходимость проиллюстрировать несколько персонажей или объектов. Например, вы можете начать подсказку со слов «1woman» и гарантировать, что если позднее будет упомянуто полное имя или псевдоним известного человека, будет ясно, что должен быть изображен только один объект, чтобы избежать путаницы для нейронной сети.

Такая ошибка встречается редко, поскольку по этой причине ИИ обычно не создает дубликаты.

Рекомендуем ознакомиться с рекомендациями по составлению промтов для «Stable Diffusion».

Третья причина

Включение текстовых инверсий (embeddings) и указание таких объектов, как отдельные лица и объекты.

Решение: Если ваши промты предполагают включение человека, скажем, «1woman», одновременно с текстовой инверсией, которая побуждает создать человеческую фигуру, ИИ может попытаться визуализировать оба элемента. В таких случаях рассмотрите возможность исключения слова (токена) на человека или текстовой инверсии в ваших промтах. Случаи этой ошибки встречаются редко, поскольку ИИ обычно не создает дубликаты по этой причине.

Узнайте больше об Yes Ai, просмотрев нашу краткую видеопрезентацию:

**Ardi** · 5 июля, 2024

Спасибо. Очень полезная информация

**Yes_Ai** · 6 июля, 2024

Описание ключевых аспектов статьи: Статья посвящена проблеме генерации изображений с дубликатами людей нейросетью Stable Diffusion. Автор рассматривает три основные причины возникновения этой ошибки:

1. **Несоответствие пропорций изображения:** Модели искусственного интеллекта, используемые для обработки изображений, в основном обучены на квадратных изображениях (соотношение сторон 1:1). Отклонение от этих пропорций может привести к искажениям, например, при широких изображениях могут появляться повторяющиеся фигуры. Решением проблемы является создание нескольких генераций, четкое указание количества людей в промте, изменение пропорций изображения, использование термина «closeup» для ближней перспективы или «fullbody» для полного обзора, а также применение LoRa для регулировки расстояния между камерой и объектом.

2. **Ошибки в описании промта:** Непреднамеренное указание на нескольких людей в промте может привести к генерации дубликатов. Решение — удаление из промта любых предложений, предполагающих необходимость проиллюстрировать несколько персонажей.

3. **Включение текстовых инверсий:** Совместное использование промта с текстовой инверсией, которая побуждает создать человеческую фигуру, может привести к генерации дубликатов. Решением является исключение слова (токена) на человека или текстовой инверсии в ваших промтах.

Войти

статья Нейросеть Stable Diffusion создает изображение с ошибкой: вместо одного человека генерируется несколько фигур. Как это решить?

Рекомендуемые сообщения

Baki

Первая причина

Вторая причина

Третья причина

Ссылка на комментарий

Поделиться на другие сайты

Ardi

Ссылка на комментарий

Поделиться на другие сайты

Yes_Ai

Ссылка на комментарий

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Объявления

Похожий контент

Популярно сейчас

Галерея