Перейти к содержанию

Рекомендуемые сообщения

  • Администратор

Nano Banana Pro — улучшенная версия нейросети Nano Banana (не путать с Nano Banana 2, которая еще не вышла на момент написания статьи). Новая версия, как и предыдущая, отличается от ближайших конкурентов (Sora Images, Midjourney, Qwen Images и др.) в первую очередь тем, что гораздо лучше понимает задачи, описанные в промтах, скоростью генераций, уровнем сохранения образов людей и предметов (при использовании референсов), способностью писать текст на изображениях на разных языках, причем, почти всегда без ошибок.

image.jpeg

В этой статье мы опишем основные возможности нейросети Nano Banana Pro и ее младшей версии, а также расскажем, как получить к ней доступ без VPN и иностранных карт.

Nano Banana создана компанией Google, что уже говорит о многом, ведь команда разработчиков обладает большими финансовыми и человеческими ресурсами, что позволило создать одну из лучших нейросетей для генерации изображений по промтам и референсам. Если сравнивать Nano Banana, например, с Midjourney, то окажется, что в арсенале продукта от Google имеется куда больше возможностей, ведь та же MJ, хоть и создает изображения высокого качества и уровнем художественной обработки, не умеет нормально писать текст на изображениях, передавать образы персонажей, создавать полноценную инфографику и т.д.

Цитата

Не поймите нас неправильно, мы искренне верим, что в скором времени Midjourney и другие конкуренты подтянут уровень своих возможностей, но на момент написания статьи они отставали от гугла.


Возможности нейросети Nano Banana

  • Обширная база знаний: нейросеть очень хорошо знает, как должны выглядеть многие известные персонажи, даже кот Матроскин из советского мультфильма будет нарисован почти как оригинальный;
  • способность "думать" прежде чем генерировать, т.е. нейросеть может самостоятельно дорабатывать ваш промт перед созданием картинки. Например, вы можете заказать первую картинку комикса с диалогами по своим предпочтениям, а потом, используя полученный референс, отправить следующее задание с просьбой продолжить сюжет — нейросеть сама все придумает;
  • исходя из предыдущего пункта, вы могли догадаться, что "банана" умеет читать текст не только из ваших промтов, но и тот, который находится в референсах! Вот пример использования этой "фишки": допустим, у вас есть картинка, на которой размещен некий текст, можно попросить Nano Banana изменить его или исправить ошибки. А вот еще идея: можно попросить нейросеть перевести текст с картинки на нужный язык, теперь не вызовет никаких проблем создание рекламных материалов для соц. сетей на разных языках;
  • фрагментация промтов: нейросеть понимает взаимосвязи и логику... к какому предмету относится та или иная часть текста из промта. Например, можно в рамках одной генерации перечислить несколько действий:
на фоне помести еловый лес, цвет шляпы на девушке замени на зеленый, мужчина держит в руке самовар

Большинство других нейросетей запросто могут перепутать перечисленные действия: самовар отдадут девушке, а шляпу — мужчине;

  • высокая скорость генераций: так как "банан" был создан компанией Google, то в комплекте с одной из умнейших нейросетей бонусом вы получаете очень мощное железо, так что создание генераций занимает всего 10-40 секунд (зависит от версии: Nano Banana или Nano Banana Pro). Однако из-за высокого спроса иногда бывают перегрузки и задания отклоняются, в этом случае повторяйте попытки;
  • точное копирование лиц, одежды и образов с исходных фотографий (если использовались референсы);
  • способность писать тексты на картинках на разных языках, в т.ч. на русском;
  • поддержка разных стилей написания текста и шрифтов;
  • возможность создавать инфографику с множеством элементов и подписей;
  • возможность создавать бесконечные цепочки генераций с использованием референсов (подойдет, например, для создания комиксов);
  • глубокий анализ промтов, их автоматическая модернизация с помощью нейросети Gemini 2.5 и 3.0;
  • возможность удалять какие-либо предметы и/или людей с фотографий, менять позы персонажей, менять цвета перечисленных предметов или одежды;
  • способность почти идеально передавать признаки стилей, которые указаны в промте (реализм, студийная фотография, сюрреализм, аниме и пр.);
  • замена фона или его удаление;
  • поддержка мульти-референсов: можно загружать несколько фотографий и описать в промте то, что нужно сделать с элементами, которые на них изображены;
  • изменение одежды и образов персонажей по описанию с сохранением внешности;
  • переодевание персонажей по референсам с поддержкой нескольких элементов одежды, например, головной убор, пиджак, перчатки и пр.;
  • стилизация референсов: можно взять любое фото и изменить его в соответствии с указанным стилем, например, преобразовать в аниме, студийное фото, ретро-футуризм и пр.

Пример использования цепочек референсов

Создаем генерацию по промту "нарисуй комикс с диалогами про кота матроскина и собаку шарика".

image.jpeg

Просим нейросеть перевести все тексты с картинки на русский язык (используем предыдущую картинку в качестве референса).

image.jpeg

Теперь просим нейросеть продолжить сюжет комикса (используем предыдущую картинку в качестве референса).

image.jpeg


Пример замены нескольких элементов одежды через нейросеть

Отправляем нейросети фотографию человека и пару элементов одежды + промт с описанием задачи.

image.png

На выходе получаем очень достойный результат, причем Nano Banana преобразовала исходник в стиль Реализм, так как иное не было указано в промте.

image.jpeg


Как и другие современные нейросети, Nano Banana поддерживает эти функции прямо из текста, написанного в промте, т.е. вам достаточно в свободной форме описать задачи, а банана постарается это сделать.

* Рекомендуем подробно описывать суть задачи, например:

надень на мужчину эту шляпу и пиджак, поменяй его позу, чтобы он указывал пальцем вверх

 

Цитата

Прошло то время, когда пользователям приходилось писать хитрые команды для получения нужных результатов, это наглядно демонстрируют современные нейросети, в числе которых можно выделить Sora Images и Nano Banana. Просто для сравнения: в Midjourney для использования элементов приходилось писать команду --oref, а для повтора образов персонажей --cref и т.д.

Многие полезные функции недоступны в официальных сборках Nano Banana, например, автоматическое применение стилей и автокоррекция промтов для генерации текстов на разных языках, поэтому рекомендуем использовать для работы этой нейросети Телеграм-бота Yes Ai. Пользуясь Yes Ai, вы также получаете возможность генерировать изображения по самым низким ценам.


Теперь перечислим то, что запрещено или сложно реализовать в "банане":

  • подделка документов. Запрещено использовать нейросеть для любых целей, противоречащих законодательству. Если коротко, запрещен любой NSFW-контент, подробнее рассказали в этой статье;
  • "удаление фона" — понятие достаточно растяжимое, так что Nano Banana при использовании такой общей формулировки может удалить бэкграунд и заменить его на серо-белую сетку. Следует четко указывать, что именно нужно сделать с фоном; пример правильной формулировки задачи:
замени весь фон на белый цвет, человека оставь без изменений
  • так как "банан" использует в качестве интерпретатора нейросеть Gemini, то все ваши промты будут автоматически доработаны — это плюс, но есть и недостаток, он заключается в том, что если вы очень абстрактно или кратко опишете суть задачи без пояснений, то "гемини" может придумать что-то неподходящее или не удовлетворяющее вашим ожиданиям;
  • если вы опишете стиль, с применением которого должна быть создана генерация и при этом укажете имя известного художника, характер картин которого хотите применить, то есть вероятность, что нано банана напишет текстом имя или автограф этого художника прямо на вашей картинке. Это можно предотвратить — упомяните в промте, что никаких надписей быть не должно;
  • "банан" иногда ругается на просьбы удалить водяные знаки, так что для этой цели лучше использовать Qwen Image Edit;
  • анализатор промтов Gemini, встроенный в Nano Banana, иногда отказывается делать генерации, даже если текст запроса не содержит запрещенных слов и фраз, т.е. иногда фильтр срабатывает там, где не должен. Стоит признать, что фильтры "банана" гораздо мягче, чем у Миджорни и у Sora;
  • если вы создаете комиксы с участием нескольких персонажей, то, при использовании цепочек референсов, их образы и/или реплики могут быть перепутаны местами. Это не проблема, просто отправляйте заказы на генерации повторно.

Чем отличаются Nano Banana и Nano Banana Pro

  • скорость генераций (Pro-версия делает картинки чуть дольше);
  • Pro-версия гораздо лучше сохраняет образы персонажей и лица людей при использовании референсов;
  • более высокое качество генераций ("про" может делать апскейл картинок до 2K - 4K);
  • глубина понимания и проработки промтов ("про" версия работает на базе Gemini 3.0, за счет чего уровень анализа задач, описанных текстом, заметно выше);
  • количество референсов (исходных фотографий и картинок), которые можно загрузить в "про" версии увеличено до 10, это позволит делать очень интересные вещи, например, можно загрузить фото человека и множество элементов одежды с целью надеть их все. Теперь вы можете всего за одно действие выполнить задачу, для решения которой раньше приходилось делать несколько генераций, меняя элементы одежды поштучно;
  • группировка нескольких персонажей на одном изображении: благодаря поддержке мульти-референсов и возможности загружать большое количество фотографий, pro-версия способна усадить нескольких человек за один стол или сделать их коллективное фото на фоне египетских пирамид. Данная возможность присутствует и в базовой версии "банана", но "прошка" гораздо качественнее повторяет образы и лица;
  • способность делать фокус на нужных областях референсов: допустим, что у вас есть фотография, на которой хорошо виден человек, но фон слишком размыт. Можно попросить нейросеть сделать фон более четким, при этом сохранив резкость очертаний человека, находящегося впереди. Подобным образом можно делать любые манипуляции с фокусировкой.

 

Если вы хотите посмотреть примеры генераций из нейросети Nano Banana, то рекомендуем заглянуть в нашу галерею.


Где получить доступ к нейросети Nano Banana Pro

Есть несколько путей:

  • через Телеграм-бота Yes Ai

https://t.me/yes_ai_bot?start=_nanobanana
...самый простой вариант (не нужны ни заграничные карты, ни VPN, ни регистрация). На момент публикации статьи некоторые расширенные функции нейросети находятся на этапе доработки.

 

  • через API для разработчиков собственных проектов и приложений

...находится в разработке, скоро опубликуем документацию

 

  • через чат с Gemini
 https://gemini.google.com 

...требуется платная подписка + VPN + заграничная карта для оплаты + заграничный аккаунт Google

 

  • через AI Studio
 https://aistudio.google.com/prompts/new_chat?model=gemini-3-pro-image-preview 

...требуется платная подписка + VPN + заграничная карта для оплаты + заграничный аккаунт Google

 

  • через Flow
 https://labs.google/fx/tools/flow 

...требуется платная подписка + VPN + заграничная карта для оплаты + заграничный аккаунт Google

 

  • через панель для разработчиков
 https://ai.google.dev/gemini-api/docs/image-generation 

...требуется платная подписка + VPN + заграничная карта для оплаты + заграничный аккаунт Google, генерации стоят достаточно дорого

 

  • через Vertex AI Studio
 https://cloud.google.com/generative-ai-studio 

...требуется платная подписка + VPN + заграничная карта для оплаты + заграничный аккаунт Google


Инструкция по использованию Nano Banana в боте Yes Ai

Как подать задание на генерацию изображений по текстовому описанию (по промту):

  • откройте Телеграм-бота по этой ссылке (автоматически запустится нейросеть Nano Banana);

image.png

  • в ⚙️ настройках выберите нужную версию (v.1 или v.1.Pro) и соотношение сторон;

image.png

  • при необходимости выберите от 1 до 3 стилей (они будут применены к генерации), для этого в нижнем меню нажмите кнопку "🎭 Стили";

image.png

  • отправьте боту промт с подробным описанием того, что нужно сгенерировать (поддерживаются любые языки). Если на картинках должен присутствовать текст, то следует писать его "внутри двойных кавычек" — это снизит вероятность ошибок.
Цитата

Обратите внимание, что при активации 🎭 стилей, изменении соотношения сторон и версии, настройки сохранятся для всех последующих генераций, но их можно переключить в любой момент.

Как подать задание с использованием одного или нескольких референсов (исходных картинок):

  • откройте Телеграм-бота по этой ссылке
  • в ⚙️ настройках выберите нужную версию (v.1 или v.1.Pro) и соотношение сторон;
  • отправьте боту одну или несколько 📎 картинок-референсов + описание того, что нейросеть должна с ними сделать. Если на картинках должен присутствовать текст, то следует писать его "внутри двойных кавычек" — это снизит вероятность ошибок;

image.png

  • при необходимости выберите от 1 до 3 стилей (они будут применены к генерации), для этого в нижнем меню нажмите кнопку "🎭 Стили";
  • в появившемся сообщении нажмите кнопку "🎡 Смешать изображения".

 

Кстати, вот что получилось в результате смешивания этих трех изображений.

image.jpeg

 

Если у вас появятся вопросы по работе с Nano Banana или с какой-то другой нейросетью, то пишите в наш чат.

image.png.bbc007783bfd77866c40d333bcf7acb0.pngimage.png.34ece97900fdaa0a096e6e0fa4f78094.png

Ссылка на комментарий
Поделиться на другие сайты

Краткий анализ публикации: Nano Banana Pro — это улучшенная версия нейросети Nano Banana от Google, отличающаяся от конкурентов (Sora Images, Midjourney и др.) лучшим пониманием промтов, скоростью генерации, сохранением образов людей и предметов при использовании референсов, а также способностью писать текст на изображениях на разных языках. Она обладает обширной базой знаний, 'думает' перед генерацией, может читать текст из промтов и референсов, фрагментирует промты, поддерживает высокую скорость генераций, точно копирует лица и образы с исходных фотографий, создает инфографику, позволяет создавать бесконечные цепочки генераций, анализирует промты и автоматически их модернизирует. Нейросеть умеет удалять предметы, менять позы персонажей, цвета одежды, стилизовать референсы и поддерживает мульти-референсы. Nano Banana Pro предлагает улучшенное сохранение образов, более высокое качество генераций (до 4K), глубокий анализ промтов и возможность загружать до 10 референсов. Доступ к ней можно получить через Телеграм-бота Yes Ai или через API для разработчиков, но существуют и другие варианты, требующие платной подписки, VPN и заграничных карт. Следует избегать использования нейросети для подделки документов или создания NSFW-контента.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...