Jump to content

Генератор изображений FLUX имеет потенциал превосходства над Midjourney и DALL-E


Recommended Posts

Стартап Black Forest Labs, в котором работают специалисты, принимавшие участие в создании генератора изображений Stable Diffusion, представил свою новую нейросеть с открытым исходным кодом под названием FLUX. 

image.thumb.jpeg.db844e71e31d6180ad4aaf86a424b051.jpeg


Разработчики утверждают, что их продукт превосходит такие сервисы, как Midjourney и DALL-E по качеству генерируемых изображений.
Black Forest Labs был основан Робином Ромбахом, Андреасом Блаттманом и Домиником Лоренцем — ведущими инженерами Stability AI, а также Патриком Эссером, который разработал метод скрытой диффузии.
В заявлении компании говорится: 
"Мы уверены, что генеративный искусственный интеллект станет основой будущих технологий. Предоставляя наши модели широкой аудитории, мы стремимся рассказать о их преимуществах, повысить осведомленность и укрепить доверие к безопасности этих технологий".
FLUX использует гибридную архитектуру, сочетающую трансформаторные и диффузионные методы, с увеличением до 12 миллиардов параметров. Судя по представленным образцам, модель уже демонстрирует хорошие результаты в генерации изображений человеческих рук, что является слабым местом для многих аналогичных сервисов. Любой желающий может скачать FLUX с GitHub, где доступна страница проекта с детальной документацией по установке и настройке. Однако стоит учитывать, что размер модели составляет 23 ГБ, и для ее работы потребуется использовать квантование в видеопамяти.

  • Like 1
  • Like 2

image.webp.e545ef84345e07da6a606d88c52f7061.webp

Link to comment
Share on other sites

Краткий обзор материала: Стартап Black Forest Labs, основанный экс-сотрудниками Stability AI, выпустил новую нейросеть FLUX для генерации изображений с открытым исходным кодом. Разработчики заявляют о превосходстве FLUX над конкурентами, такими как Midjourney и DALL-E, в качестве генерируемых изображений.

FLUX использует гибридную архитектуру, объединяющую трансформаторные и диффузионные методы, с увеличением до 12 миллиардов параметров. Модель демонстрирует особенно хорошие результаты в генерации изображений человеческих рук, что часто является проблемой для других подобных сервисов. FLUX доступна для скачивания на GitHub, где также имеется подробная документация по установке и настройке. Важно отметить, что модель имеет внушительный размер (23 ГБ) и требует квантования в видеопамяти для работы.
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...