Перейти к содержанию

Stable Diffusion 3 Medium по словам пользователей не справляется с генерацией людей


Рекомендуемые сообщения

  • Модератор

Компания Stability AI выпустила новую модель синтеза изображений Stable Diffusion 3 Medium, которая превращает текстовые подсказки в изображения, созданные ИИ. Однако, релиз вызвал насмешки в интернете из-за проблем с анатомией людей, особенно рук и ног.

Пользователи Reddit отмечают, что модель генерирует визуально неправильные изображения, что является шагом назад по сравнению с другими современными моделями, такими как Midjourney или DALL-E 3. Основной причиной называют фильтрацию контента для взрослых из обучающих данных, что негативно сказалось на способности модели точно воспроизводить человеческую анатомию. Проблемы с изображением людей также наблюдались в предыдущих версиях, таких как Stable Diffusion 2.0, но были частично решены в SD 2.1 и SD XL.

Пользователи также связывают неудачи с внутренними проблемами компании, включая отставку основателя и генерального директора Эмада Мостака и увольнения ключевых инженеров. Несмотря на это, модель доступна для бесплатного использования под некоммерческой лицензией на платформе Hugging Face и Stability Platform.

 

image.thumb.jpeg.7f05fef2c70ad1ceed8af0201e070ff6.jpegimage.thumb.jpeg.d7bee4cc28099effc9c477522d20ed58.jpegimage.thumb.jpeg.24042111227b95447fc5ca3c52d56dbb.jpeg

ИСТОЧНИК

 

image.png.9d5b4205072e7e483a6f7d59aebe58e3.pngimage.pngimage.png.401b8a419d2091e7d0b7f9d60646a724.png

Ссылка на комментарий
Поделиться на другие сайты

  • Модератор
1 минуту назад, Ardi сказал:

Ужас какой😂

Это я еще не все примеры генераций вставил в статью)) пожалел психику форумчан и желудки)

image.png.9d5b4205072e7e483a6f7d59aebe58e3.pngimage.pngimage.png.401b8a419d2091e7d0b7f9d60646a724.png

Ссылка на комментарий
Поделиться на другие сайты

  • Модератор
8 минут назад, Baki сказал:

Это я еще не все примеры генераций вставил в статью)) пожалел психику форумчан и желудки)

Спасибо что бережёшь наши нервы😂

image.png.709fa648fb16fab154ca5b930a46ce4d.pngimage.png.61b96eadecbfb2dfdeaa0ea1baa5f908.png

Ссылка на комментарий
Поделиться на другие сайты

  • Администратор
Только что, Cosmosvetik сказал:

Зато теперь Кандинский может смело называть себя прямым конкурентом Стейбла

Ну XL то он не победил...

image.png.bbc007783bfd77866c40d333bcf7acb0.pngimage.png.34ece97900fdaa0a096e6e0fa4f78094.png

Ссылка на комментарий
Поделиться на другие сайты

  • Пользователь
Цитата

Наглядный пример сравнения версий SDXL и SD v.3

Эта генерация была сделана полгода назад в модели SDXL 63 со следующим промптом:

Цитата

 

 ✏️ Prompt: Diabolic female, NSFW, ((art by Alex Cherry)), crimson and shadow lighting, moonlight, sultry atmosphere, provocative pose, ((demonic seduction)), high contrast, oil painting style, ((blood red lips)), ((piercing eyes)), ((fire lit background)), ((satin fabric)), ((fine details)), ((sinister essence)), ((masterful brush strokes))

🎭 Styles: No style

🧩 Model: SDXL x63 💠

🔧 Sampler: UniPC

 

IMG_20240613_164547_281.thumb.jpg.c4dcdcc716407d6bbf291b472d3ce4af.jpg

А теперь сравним ее с генерации из новейшей версии SD v.3, правда уже с совершенно другим промптом:

Цитата

Lila Inferna, the Devil's Vessel, long raven black hair, glossy waves, silky straight hair, 5'6', fiery crimson eyes with gold flecks, smooth porcelain-like skin, unsettling allure, full lips, fiery gaze, embers in hair when agitated, dark form-fitting clothes with flame and demonic symbols, metallic accessories and black choker


IMG_20240613_164544_317.jpg

 

Отсюда возникает закономерный вопрос, а ЧТО изменилось то, кроме улучшенного понимания естественного языка, которое, к слову, было уже и в моделях SDXL 

 

 

Ссылка на комментарий
Поделиться на другие сайты

  • Пользователь
53 минуты назад, Baki сказал:

Компания Stability AI выпустила новую модель синтеза изображений Stable Diffusion 3 Medium, которая превращает текстовые подсказки в изображения, созданные ИИ. Однако, релиз вызвал насмешки в интернете из-за проблем с анатомией людей, особенно рук и ног.

Пользователи Reddit отмечают, что модель генерирует визуально неправильные изображения, что является шагом назад по сравнению с другими современными моделями, такими как Midjourney или DALL-E 3. Основной причиной называют фильтрацию контента для взрослых из обучающих данных, что негативно сказалось на способности модели точно воспроизводить человеческую анатомию. Проблемы с изображением людей также наблюдались в предыдущих версиях, таких как Stable Diffusion 2.0, но были частично решены в SD 2.1 и SD XL.

Пользователи также связывают неудачи с внутренними проблемами компании, включая отставку основателя и генерального директора Эмада Мостака и увольнения ключевых инженеров. Несмотря на это, модель доступна для бесплатного использования под некоммерческой лицензией на платформе Hugging Face и Stability Platform.

 

image.thumb.jpeg.7f05fef2c70ad1ceed8af0201e070ff6.jpegimage.thumb.jpeg.d7bee4cc28099effc9c477522d20ed58.jpegimage.thumb.jpeg.24042111227b95447fc5ca3c52d56dbb.jpeg

ИСТОЧНИК

 

Очень смешно генерирует))) 

Ссылка на комментарий
Поделиться на другие сайты

Аннотация публикации: Модель синтеза изображений Stable Diffusion 3 Medium компании Stability AI преобразует текстовые подсказки в созданные ИИ картинки, но ее релиз вызвал насмешки из-за ошибок в анатомии людей, особенно рук и ног. Пользователи отмечают, что модель генерирует неправильные изображения, что является шагом назад по сравнению с другими моделями. Проблема связана с фильтрацией контента для взрослых из обучающих данных, что негативно сказалось на моделирование человеческой анатомии. Это не первый случай ошибок в изображении людей у компании, но модель доступна для бесплатного использования под некоммерческой лицензией.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...