Перейти к содержанию

Генератор изображений FLUX имеет потенциал превосходства над Midjourney и DALL-E


Рекомендуемые сообщения

Стартап Black Forest Labs, в котором работают специалисты, принимавшие участие в создании генератора изображений Stable Diffusion, представил свою новую нейросеть с открытым исходным кодом под названием FLUX. 

image.thumb.jpeg.db844e71e31d6180ad4aaf86a424b051.jpeg


Разработчики утверждают, что их продукт превосходит такие сервисы, как Midjourney и DALL-E по качеству генерируемых изображений.
Black Forest Labs был основан Робином Ромбахом, Андреасом Блаттманом и Домиником Лоренцем — ведущими инженерами Stability AI, а также Патриком Эссером, который разработал метод скрытой диффузии.
В заявлении компании говорится: 
"Мы уверены, что генеративный искусственный интеллект станет основой будущих технологий. Предоставляя наши модели широкой аудитории, мы стремимся рассказать о их преимуществах, повысить осведомленность и укрепить доверие к безопасности этих технологий".
FLUX использует гибридную архитектуру, сочетающую трансформаторные и диффузионные методы, с увеличением до 12 миллиардов параметров. Судя по представленным образцам, модель уже демонстрирует хорошие результаты в генерации изображений человеческих рук, что является слабым местом для многих аналогичных сервисов. Любой желающий может скачать FLUX с GitHub, где доступна страница проекта с детальной документацией по установке и настройке. Однако стоит учитывать, что размер модели составляет 23 ГБ, и для ее работы потребуется использовать квантование в видеопамяти.

image.webp.e545ef84345e07da6a606d88c52f7061.webp

Ссылка на комментарий
Поделиться на другие сайты

Краткий обзор материала: Стартап Black Forest Labs, основанный экс-сотрудниками Stability AI, выпустил новую нейросеть FLUX для генерации изображений с открытым исходным кодом. Разработчики заявляют о превосходстве FLUX над конкурентами, такими как Midjourney и DALL-E, в качестве генерируемых изображений.

FLUX использует гибридную архитектуру, объединяющую трансформаторные и диффузионные методы, с увеличением до 12 миллиардов параметров. Модель демонстрирует особенно хорошие результаты в генерации изображений человеческих рук, что часто является проблемой для других подобных сервисов. FLUX доступна для скачивания на GitHub, где также имеется подробная документация по установке и настройке. Важно отметить, что модель имеет внушительный размер (23 ГБ) и требует квантования в видеопамяти для работы.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...