новость Stable Diffusion 3 Medium по словам пользователей не справляется с генерацией людей

**Baki** · 13 июня, 2024

Компания Stability AI выпустила новую модель синтеза изображений Stable Diffusion 3 Medium, которая превращает текстовые подсказки в изображения, созданные ИИ. Однако, релиз вызвал насмешки в интернете из-за проблем с анатомией людей, особенно рук и ног.

Пользователи Reddit отмечают, что модель генерирует визуально неправильные изображения, что является шагом назад по сравнению с другими современными моделями, такими как Midjourney или DALL-E 3. Основной причиной называют фильтрацию контента для взрослых из обучающих данных, что негативно сказалось на способности модели точно воспроизводить человеческую анатомию. Проблемы с изображением людей также наблюдались в предыдущих версиях, таких как Stable Diffusion 2.0, но были частично решены в SD 2.1 и SD XL.

Пользователи также связывают неудачи с внутренними проблемами компании, включая отставку основателя и генерального директора Эмада Мостака и увольнения ключевых инженеров. Несмотря на это, модель доступна для бесплатного использования под некоммерческой лицензией на платформе Hugging Face и Stability Platform.

ИСТОЧНИК

**Ardi** · 13 июня, 2024

Ужас какой😂

**Baki** · 13 июня, 2024

1 минуту назад, Ardi сказал:

Ужас какой😂

Это я еще не все примеры генераций вставил в статью)) пожалел психику форумчан и желудки)

**Ardi** · 13 июня, 2024

8 минут назад, Baki сказал:

Это я еще не все примеры генераций вставил в статью)) пожалел психику форумчан и желудки)

Спасибо что бережёшь наши нервы😂

**admin** · 13 июня, 2024

2 минуты назад, Ardi сказал:

Спасибо что бережёшь наши нервы😂

я уже попросил его выложить еще )

**Ardi** · 13 июня, 2024

5 минут назад, admin сказал:

я уже попросил его выложить еще )

😁

Makentosh · 13 июня, 2024

Невероятно, но факт!

Cosmosvetik · 13 июня, 2024

Зато теперь Кандинский может смело называть себя прямым конкурентом Стейбла

**admin** · 13 июня, 2024

Только что, Cosmosvetik сказал:

Зато теперь Кандинский может смело называть себя прямым конкурентом Стейбла

Ну XL то он не победил...

Marsy · 13 июня, 2024

Цитата

Наглядный пример сравнения версий SDXL и SD v.3

Эта генерация была сделана полгода назад в модели SDXL 63 со следующим промптом:

Цитата

✏️ Prompt: Diabolic female, NSFW, ((art by Alex Cherry)), crimson and shadow lighting, moonlight, sultry atmosphere, provocative pose, ((demonic seduction)), high contrast, oil painting style, ((blood red lips)), ((piercing eyes)), ((fire lit background)), ((satin fabric)), ((fine details)), ((sinister essence)), ((masterful brush strokes))

🎭 Styles: No style

🧩 Model: SDXL x63 💠

🔧 Sampler: UniPC

А теперь сравним ее с генерации из новейшей версии SD v.3, правда уже с совершенно другим промптом:

Цитата

Lila Inferna, the Devil's Vessel, long raven black hair, glossy waves, silky straight hair, 5'6', fiery crimson eyes with gold flecks, smooth porcelain-like skin, unsettling allure, full lips, fiery gaze, embers in hair when agitated, dark form-fitting clothes with flame and demonic symbols, metallic accessories and black choker

Отсюда возникает закономерный вопрос, а ЧТО изменилось то, кроме улучшенного понимания естественного языка, которое, к слову, было уже и в моделях SDXL

Cosmosvetik · 13 июня, 2024

10 минут назад, admin сказал:

Ну XL то он не победил...

Ну то XL) какие его годы))

Оксана · 13 июня, 2024

53 минуты назад, Baki сказал:

Компания Stability AI выпустила новую модель синтеза изображений Stable Diffusion 3 Medium, которая превращает текстовые подсказки в изображения, созданные ИИ. Однако, релиз вызвал насмешки в интернете из-за проблем с анатомией людей, особенно рук и ног.

Пользователи Reddit отмечают, что модель генерирует визуально неправильные изображения, что является шагом назад по сравнению с другими современными моделями, такими как Midjourney или DALL-E 3. Основной причиной называют фильтрацию контента для взрослых из обучающих данных, что негативно сказалось на способности модели точно воспроизводить человеческую анатомию. Проблемы с изображением людей также наблюдались в предыдущих версиях, таких как Stable Diffusion 2.0, но были частично решены в SD 2.1 и SD XL.

Пользователи также связывают неудачи с внутренними проблемами компании, включая отставку основателя и генерального директора Эмада Мостака и увольнения ключевых инженеров. Несмотря на это, модель доступна для бесплатного использования под некоммерческой лицензией на платформе Hugging Face и Stability Platform.

ИСТОЧНИК

Очень смешно генерирует)))

**Yes_Ai** · 14 июня, 2024

Аннотация публикации: Модель синтеза изображений Stable Diffusion 3 Medium компании Stability AI преобразует текстовые подсказки в созданные ИИ картинки, но ее релиз вызвал насмешки из-за ошибок в анатомии людей, особенно рук и ног. Пользователи отмечают, что модель генерирует неправильные изображения, что является шагом назад по сравнению с другими моделями. Проблема связана с фильтрацией контента для взрослых из обучающих данных, что негативно сказалось на моделирование человеческой анатомии. Это не первый случай ошибок в изображении людей у компании, но модель доступна для бесплатного использования под некоммерческой лицензией.

Войти

новость Stable Diffusion 3 Medium по словам пользователей не справляется с генерацией людей

Рекомендуемые сообщения

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Ссылка на комментарий

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Объявления

Похожий контент

Популярно сейчас