Перейти к содержанию

Как создать картинку с текстом при помощи нейросети FLUX в Telegram


Рекомендуемые сообщения

Вы узнаете как создать картинку с текстом в нейросети FLUX без установки сторонних приложений в Telegram-боте. Научитесь использовать LoRA FLUX. Рассмотрим основные правила составления текстовых запросов (промптов) на русском языке, а также преимущества и недостатки FLUX.

image.thumb.png.ac6c4d6634e2dec915bbbcd679aa2760.png

Одним из самых значительных достижений последних месяцев стало появление нейросети FLUX, разработанной стартапом Black Forest Labs. Эта нейросеть обещает поднять качество генерации изображений на совершенно новый уровень, превосходя таких гигантов, как Midjourney и DALL-E.

Предыстория FLUX уходит корнями в Stability AI и к ключевым инженерам Робину Ромбаху, Андреасу Блаттману и Доминику Лоренцу, а также к Патрику Эссеру, создателю метода латентной диффузии. Эти умы объединились для создания чего-то уникального, и так родилась FLUX.

Эта нейросеть уже сейчас успешно справляется с генерацией человеческих рук, которые традиционно являются сложной задачей для подобных сервисов. Имеет значительно меньше мутаций и высокое качество картинки. Умеет классно работать с текстом. На примерах вы сможете во всем в этом убедиться.

Для того чтобы пользоваться FLUX, вам не потребуется установка сторонних приложений и мощная видеокарта. Чтобы начать создание картинок в нейросети FLUX, вы можете воспользоваться Telegram-ботом, который поддерживает составления текстовых запросов на русском языке. Однако следует учитывать, что на данный момент текст, создаваемый на изображениях, будет доступен исключительно на английском языке.

Прежде чем создать картинки, рассмотрим основные правила составления текстовых запросов (промптов). Это очень важный момент, который не стоит пропускать.

Правила составления промптов для Flux

Правила составления запросов для Flux в целом аналогичны тем, что используются при взаимодействии с другими нейросетями, такими как Midjourney. Но Flux демонстрирует более высокую точность в интерпретации запросов.

Детализация

Для достижения наилучших результатов при использовании Flux, важно предоставлять четкие и детализированные запросы. Вместо простого слова «кошка» лучше сформулировать запрос так: «рыжая кошка с ярко-зелеными глазами, уютно устроившаяся на подоконнике, за которым раскинулся осенний пейзаж с золотыми листьями и серым небом».

Структура

Рекомендуется придерживаться структуры «объект + детали + фон + стиль», дополнительно использовать технические детали. Это позволит нейросети более точно уловить ваши пожелания. Указывайте все ключевые моменты: кто или что должно быть в фокусе, какие детали необходимо включить, каковы характеристики одежды и аксессуаров, какие эмоции должны проявляться на лицах персонажей, а также временные и пространственные рамки событий.

Например:

1. Основной объект — котенок британской породы.

2. Детали — любопытно исследует комнату, на нем маленький синий ошейник, а рядом лежит игрушка в виде мышки.

3. Фон и окружение — вокруг уютная обстановка с мягким диваном и книжными полками, на окне светит яркое утреннее солнце, создавая теплые блики на полу.

4. Стиль и тон — реалистичный стиль, с элементами уюта и игривости.

Итоговый промпт:

«Котенок британской породы, любопытно исследует комнату, на нем маленький синий ошейник, а рядом лежит игрушка в виде мышки, вокруг уютная обстановка с мягким диваном и книжными полками, в окно светит яркое утреннее солнце, создавая теплые блики на полу, реалистичный стиль, с элементами уюта и игривости».

5. Технические деталиХотя их использование не является обязательным, но с Flux и его точным следованием промпту это будет значительно повышать ваш уровень создания изображений. Можно включить в запрос модель камеры, угол съемки, объектив, глубину резкости, фокус и многое другое.

Например:

  • камера — Canon EOS 5D Mark IV, Nikon D850, Sony A7R IV, Fujifilm X-T4, Panasonic Lumix GH5;

  • угол съемки — уровень глаз, низкий угол, высокий угол, вид с высоты птичьего полета, вид с земли, наклонный угол;

  • объектив широкоугольный, телеобъектив, макрообъектив, рыбий глаз, фиксированный объектив;

  • диафрагма — f/1,4, f/2,8, f/5,6, f/8;

  • iso — iso 100, iso 400, iso 1600, iso 3200;

  • глубина резкости — малая глубина резкости, большая глубина резкости;

  • скорость затвора — 1/1000 sec, 1/250 sec, 1/30 sec.

Попробуйте использовать разнообразные ракурсы и перспективы для создания более интересных картинок. Вот несколько примеров подобных текстовых запросов:

- Сцена, снятая с высоты птичьего полета, где на переднем плане виден цветущий сад, а вдалеке простирается город с его крышами и улицами.

image.thumb.jpeg.360a7ce4e21d894fefc27b88e551f1bd.jpeg

- Кадр, сделанный от первого лица, где руки держат камеру, а перед глазами открывается захватывающий вид на горный пейзаж.

image.thumb.jpeg.3a91b79df0c74773af4bcfdd176de000.jpeg

- Съемка с низкого угла, где на переднем плане расположены игрушки, а вдалеке виден спящий ребенок на диване.

image.thumb.jpeg.53d564a8769ef3e5c5f1f3b2489bb59a.jpeg

- Обзорная съемка с балкона, где виден вечерний город с огнями, создающими атмосферу уюта и жизни.

image.thumb.jpeg.138537d500147cb18b424948a03f9071.jpeg

- Съемка домашнего участка через забор, создающая интересный эффект и добавляющая текстуру к изображению.

image.thumb.jpeg.8df3741e989ffdd814a4931fa53b865a.jpeg

- Взгляд из-за собаки на горный пейзаж, создающий ощущение, что зритель вместе с ним исследует окружающий мир.

image.thumb.jpeg.faef5938a62de1173743429848c79173.jpeg

- Съемка изнутри кафе, где виден столик с чашкой кофе, а за окном проходит дождь, создавая атмосферу уюта.

image.thumb.jpeg.947c5511403014259d175af3387384fe.jpeg

Не бойтесь экспериментировать. Порой требуется несколько попыток, чтобы найти именно тот подход, который даст желаемый результат. Начинайте с простых запросов и постепенно добавляйте детали, чтобы понять, как они влияют на конечное изображение. А теперь давайте непосредственно приступим к практике.

Как создать картинку с текстом в нейросети FLUX

  • Шаг 1. Перейдите в Telegram-бота и запустите его

  • Шаг 2. Активируйте нейросеть FLUX

image.png.76c8a6d2270513e6b1f74d3ff1e1a230.png

  • Шаг 3. Установите необходимые настройки сверху вниз: модель, сэмплер, количество шагов и соотношение сторон. Для примера установим следующие настройки:  Flux.1 – Euler a - 24 steps - 1600x1600

image.thumb.png.2aa3f20e2323405876eb4f032f75ae68.png

Шаг 4. Выберите стиль. Для текущего примера пропустим этот шаг.

Шаг 5. Введите свой текстовый запрос (промпт) согласно правилам, указанным ранее. 

Например:

«Фотография энергичного молодого человека в свободном спортивном костюме, стоящего на фоне яркого граффити в городском парке. Он держит в руках плакат с надписью "I ❤️ YES AI BOT", контрастное освящение, Canon EOS 5D Mark IV DSLR, f/8, 1/250s, 80mm lens, ISO 240»

Вот такой результат получился:

image.thumb.jpeg.c2db99d07c48f72cab322d042a0a97fb.jpeg

Как видите, ничего сложного. Главное — больше практики. Пробуйте изменять настройки для одного и того же промпта, чтобы выделить важные особенности для себя в будущем. По такому принципу вы можете создавать необычные картинки в нейросети FLUX. 

Когда вы исчерпаете текущие возможности предустановленных моделей, вам может потребоваться использование LoRA (Low-Rank Adaptation). Это базы дополнительных моделей, которые могут быть встроены в нейросеть FLUX. Они улучшают способность нейросети "обучаться" и производить элементы, ранее неизвестные в предустановленных моделях. В данном Telegram-боте каждый пользователь может использовать уже имеющуюся галерею LoRA или расширить её, добавив новую модель в коллекцию. Рассмотрим оба варианта.

Как создать картинку с текстом в нейросети FLUX, используя LoRA

Прежде чем начать, необходимо найти подходящую LoRa для FLUX, которая вам понравится в Галерее или на civitai.com. Это может быть модель, которая умеет воспроизводить персонажа, другие объекты или стиль.

Как воспользоваться галереей:

  • Нажмите на кнопку «Стили», затем на «Галерея LoRA»

image.thumb.png.81178c8a923f9e87a69d70e1914dd9e8.png

  • С помощью кнопки «Вперед» или «Случайно» можете поискать понравившуюся LoRA

image.thumb.png.202bcdfa0a353c834196a98869be12a0.png

Под картинкой размещен код - <lora:xxxxxx:1>, в котором xxxxxx — это уникальный идентификатор LoRA на civitai.com, а 1 — вес влияния этой LoRA на конечный результат. Он может колебаться до отрицательных значений, поэтому всегда читайте описание от автора. Чтобы ознакомиться с описанием модели, нажмите на «Имя», чтобы углубить понимание принципов её работы.

Важно! Обращайте внимание на версию основной модели, которая в настоящее время поддерживается в боте — Flux.1 D. Если автор использует триггеры, то их использование обязательно, чтобы повторить то, что хотел донести автор. Если триггеров несколько вы можете добавлять не все сразу, а посмотреть как будет меняться результат добавляя тот или иной триггер.

Как добавить LoRA в галерею:

  • Откройте сайт https://civitai.com/
  • Выберите в меню Models и установите фильтр, как на скриншоте, затем нажмите на пустом месте.

image.thumb.png.0d56b78244dbccd31b5fe141e07c234a.png

  • Выберите понравившуюся LoRA.

image.thumb.png.aeb645a82135206b64a31d5b7735e953.png

  • Скопируйте ссылку на неё в браузере (эту ссылку мы будем отправлять боту, активировав нейросеть FLUX).

image.png.20465b90fdd7c7e32714550d09067505.png

  • После добавления LoRA прочитайте описание, детали и посмотрите примеры (страницу можете перевести в браузере).

image.thumb.png.f24660cb8819eed5c02a39857d4b017e.png

  • Откройте пример изображения. Здесь вы можете увидеть авторский промпт.

image.thumb.png.b13127142dd4318e6f13fe79c6af76fd.png

Как видите, данная LoRA отвечает за драматическое освещение, то есть она будет особенно хороша на вечерних изображениях. Обратите внимание, что эта LoRA не имеет триггеров, к своему промпту мы добавим только код - <lora:340248:1>. Для наглядности возьмем тот же промпт, что в начале статьи.

Например:

«Фотография энергичного молодого человека в свободном спортивном костюме, стоящего на фоне яркого граффити в городском парке. Он держит в руках плакат с надписью "I ❤️ YES AI BOT", контрастное освящение, Canon EOS 5D Mark IV DSLR, f/8, 1/250s, 80mm lens, ISO 240 <lora:340248:1>»

Вот такой результат получился:

image.thumb.jpeg.fa311800bb16f4fd97d6b5eedd9bb1fa.jpeg

Важно! В боте временно ограничено количество LoRA в промпте. Пока вы можете использовать только одну LoRA.

Преимущества FLUX

  • Высокий уровень фотореализма и детализации

 FLUX может точно воссоздавать сложные текстуры, освещение и тени. Это делает его отличным инструментом для проектов, где важна детальная проработка.

  • Точное выполнение заданных условий

FLUX точно отображает заданные визуальные элементы. Например, изображение взаимодействия жабы и гадюки будет реалистичным, а не усредненным, как в старых моделях.

  • Отличное воспроизведение текста

FLUX хорошо передает текст на изображениях, особенно на английском, и делает это без ошибок. Однако это возможно только с латинским алфавитом, что позволяет создавать постеры и вывески.

  • Адаптивность и настройка

Открытая структура модели позволяет пользователям настраивать FLUX под свои нужды. Можно использовать LoRA для добавления данных об объектах и стилях.

  • Использование Telegram-бота

FLUX можно использовать через Telegram-бота от Yes AI, что избавляет от необходимости устанавливать дополнительные приложения и иметь мощную видеокарту.

Недостатки FLUX

  • Проблемы с имитацией стилей

FLUX не может точно воспроизводить художественные стили, такие как Дали или Моне, так как был обучен на фотореалистичных образцах. Это ограничивает его возможности в создании художественных изображений.

  • Ограниченная креативность

FLUX иногда критикуют за недостаток креативности в обработке абстрактных или фантастических запросов. Его строгое следование заданным параметрам может ограничивать творческий подход.

***

Теперь вы узнали, как создать картинку с текстом в нейросети FLUX без установки сторонних приложений в Telegram-боте. Научились использовать LoRA FLUX. Закрепили основные правила составления текстовых запросов (промптов) на русском языке. Рассмотрели преимущества и недостатки FLUX, актуальные на текущий момент. Данная информация значительно повышает ваш уровень работы с этой нейросетью. Больше практикуйтесь, чтобы получать самые невероятные результаты.

image.png.61e5d9451bd7945ca7454adbccbfa0cd.png

Ссылка на комментарий
Поделиться на другие сайты

Краткое описание текста: Текст рассказывает о нейросети FLUX, разработанной стартапом Black Forest Labs, которая позволяет создавать реалистичные изображения по текстовым запросам (промптам).

FLUX превосходит другие нейросетные модели, такие как Midjourney и DALL-E, в качестве генерации изображений.

Пользователи могут воспользоваться Telegram-ботом Yes AI для работы с FLUX без установки дополнительного ПО. В тексте подробно описаны правила составления промптов для достижения наилучших результатов:

* детализация запроса;
* структура 'объект детали фон стиль';
* использование технических деталей (камера, объектив, освещение).


Также в статье рассматривается возможность использования LoRA (Low-Rank Adaptation) - дополнительных моделей, которые расширяют возможности FLUX.

Автор приводит примеры создания изображений с использованием промптов и LoRA, а также отмечает преимущества и недостатки FLUX:

**Преимущества:**
* высокое качество и детализация изображений;
* точное выполнение запросов;
* возможность использования LoRA для расширения функциональности.

**Недостатки:**
* трудности в воспроизведении художественных стилей;
* ограниченная креативность при обработке абстрактных запросов.



В заключение автор советует практиковаться в работе с FLUX, чтобы добиваться самых впечатляющих результатов.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...