Jump to content

Stable Diffusion 3 Medium по словам пользователей не справляется с генерацией людей


Recommended Posts

Компания Stability AI выпустила новую модель синтеза изображений Stable Diffusion 3 Medium, которая превращает текстовые подсказки в изображения, созданные ИИ. Однако, релиз вызвал насмешки в интернете из-за проблем с анатомией людей, особенно рук и ног.

Пользователи Reddit отмечают, что модель генерирует визуально неправильные изображения, что является шагом назад по сравнению с другими современными моделями, такими как Midjourney или DALL-E 3. Основной причиной называют фильтрацию контента для взрослых из обучающих данных, что негативно сказалось на способности модели точно воспроизводить человеческую анатомию. Проблемы с изображением людей также наблюдались в предыдущих версиях, таких как Stable Diffusion 2.0, но были частично решены в SD 2.1 и SD XL.

Пользователи также связывают неудачи с внутренними проблемами компании, включая отставку основателя и генерального директора Эмада Мостака и увольнения ключевых инженеров. Несмотря на это, модель доступна для бесплатного использования под некоммерческой лицензией на платформе Hugging Face и Stability Platform.

 

image.thumb.jpeg.7f05fef2c70ad1ceed8af0201e070ff6.jpegimage.thumb.jpeg.d7bee4cc28099effc9c477522d20ed58.jpegimage.thumb.jpeg.24042111227b95447fc5ca3c52d56dbb.jpeg

ИСТОЧНИК

 

  • Haha 5

image.png.9d5b4205072e7e483a6f7d59aebe58e3.pngimage.png.401b8a419d2091e7d0b7f9d60646a724.png

Link to comment
Share on other sites

1 минуту назад, Ardi сказал:

Ужас какой😂

Это я еще не все примеры генераций вставил в статью)) пожалел психику форумчан и желудки)

image.png.9d5b4205072e7e483a6f7d59aebe58e3.pngimage.png.401b8a419d2091e7d0b7f9d60646a724.png

Link to comment
Share on other sites

8 минут назад, Baki сказал:

Это я еще не все примеры генераций вставил в статью)) пожалел психику форумчан и желудки)

Спасибо что бережёшь наши нервы😂

  • Haha 1

image.png.709fa648fb16fab154ca5b930a46ce4d.pngimage.png.61b96eadecbfb2dfdeaa0ea1baa5f908.png

Link to comment
Share on other sites

2 минуты назад, Ardi сказал:

Спасибо что бережёшь наши нервы😂

я уже попросил его выложить еще )

  • Like 1
  • Haha 1

image.png.bbc007783bfd77866c40d333bcf7acb0.pngimage.png.34ece97900fdaa0a096e6e0fa4f78094.png

Link to comment
Share on other sites

Только что, Cosmosvetik сказал:

Зато теперь Кандинский может смело называть себя прямым конкурентом Стейбла

Ну XL то он не победил...

image.png.bbc007783bfd77866c40d333bcf7acb0.pngimage.png.34ece97900fdaa0a096e6e0fa4f78094.png

Link to comment
Share on other sites

Цитата

Наглядный пример сравнения версий SDXL и SD v.3

Эта генерация была сделана полгода назад в модели SDXL 63 со следующим промптом:

Цитата

 

 ✏️ Prompt: Diabolic female, NSFW, ((art by Alex Cherry)), crimson and shadow lighting, moonlight, sultry atmosphere, provocative pose, ((demonic seduction)), high contrast, oil painting style, ((blood red lips)), ((piercing eyes)), ((fire lit background)), ((satin fabric)), ((fine details)), ((sinister essence)), ((masterful brush strokes))

🎭 Styles: No style

🧩 Model: SDXL x63 💠

🔧 Sampler: UniPC

 

IMG_20240613_164547_281.thumb.jpg.c4dcdcc716407d6bbf291b472d3ce4af.jpg

А теперь сравним ее с генерации из новейшей версии SD v.3, правда уже с совершенно другим промптом:

Цитата

Lila Inferna, the Devil's Vessel, long raven black hair, glossy waves, silky straight hair, 5'6', fiery crimson eyes with gold flecks, smooth porcelain-like skin, unsettling allure, full lips, fiery gaze, embers in hair when agitated, dark form-fitting clothes with flame and demonic symbols, metallic accessories and black choker


IMG_20240613_164544_317.jpg

 

Отсюда возникает закономерный вопрос, а ЧТО изменилось то, кроме улучшенного понимания естественного языка, которое, к слову, было уже и в моделях SDXL 

 

 

  • Like 2
Link to comment
Share on other sites

53 минуты назад, Baki сказал:

Компания Stability AI выпустила новую модель синтеза изображений Stable Diffusion 3 Medium, которая превращает текстовые подсказки в изображения, созданные ИИ. Однако, релиз вызвал насмешки в интернете из-за проблем с анатомией людей, особенно рук и ног.

Пользователи Reddit отмечают, что модель генерирует визуально неправильные изображения, что является шагом назад по сравнению с другими современными моделями, такими как Midjourney или DALL-E 3. Основной причиной называют фильтрацию контента для взрослых из обучающих данных, что негативно сказалось на способности модели точно воспроизводить человеческую анатомию. Проблемы с изображением людей также наблюдались в предыдущих версиях, таких как Stable Diffusion 2.0, но были частично решены в SD 2.1 и SD XL.

Пользователи также связывают неудачи с внутренними проблемами компании, включая отставку основателя и генерального директора Эмада Мостака и увольнения ключевых инженеров. Несмотря на это, модель доступна для бесплатного использования под некоммерческой лицензией на платформе Hugging Face и Stability Platform.

 

image.thumb.jpeg.7f05fef2c70ad1ceed8af0201e070ff6.jpegimage.thumb.jpeg.d7bee4cc28099effc9c477522d20ed58.jpegimage.thumb.jpeg.24042111227b95447fc5ca3c52d56dbb.jpeg

ИСТОЧНИК

 

Очень смешно генерирует))) 

Link to comment
Share on other sites

Аннотация публикации: Модель синтеза изображений Stable Diffusion 3 Medium компании Stability AI преобразует текстовые подсказки в созданные ИИ картинки, но ее релиз вызвал насмешки из-за ошибок в анатомии людей, особенно рук и ног. Пользователи отмечают, что модель генерирует неправильные изображения, что является шагом назад по сравнению с другими моделями. Проблема связана с фильтрацией контента для взрослых из обучающих данных, что негативно сказалось на моделирование человеческой анатомии. Это не первый случай ошибок в изображении людей у компании, но модель доступна для бесплатного использования под некоммерческой лицензией.
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...