статья Обзор новой версии нейросети Nano Banana 2: что изменилось в модели Gemini

not.found · 10 марта

Nano Banana 2 — новая версия нейросети Gemini для генерации изображений по промтам. В этом обзоре разбирается, что изменилось в Nano Banana 2, как модель стала точнее понимать промты, генерировать читаемый текст на изображениях и лучше учитывать физику сцены. Также в статье показаны реальные тесты Nano Banana 2: генерация рекламного постера, проверка отражений, текстур, анатомии персонажей и качества сложных сцен.

26 февраля 2026 года появилась новая версия модели для генерации изображений — нейросеть Nano Banana 2.

Обновление Nano Banana 2 затронуло несколько ключевых аспектов генерации изображений: точность выполнения промтов, понимание контекста сцены, скорость обработки запросов и качество визуальных деталей. Нейросеть стала точнее следовать описанию, аккуратнее генерировать текст на изображениях и стабильнее создавать сложные сцены.

Разработчики также оптимизировали движок генерации. Задания выполняются быстрее, а количество ошибок заметно снизилось даже при высокой нагрузке. Система стабильнее интерпретирует промты и реже блокирует корректные запросы.

Однако главный вопрос заключается в другом: какие изменения действительно заметны на практике и чем Nano Banana 2 отличается от предыдущей версии Nano Banana Pro.

Чтобы это проверить, функции Nano Banana 2 были протестированы на реальных промтах для генерации изображений — от создания текста внутри картинки до сложных сцен с несколькими персонажами.

Nano Banana 2 генерирует читаемый текст на изображениях

Одна из проблем большинства генераторов изображений — текст внутри картинки. Когда в промте есть длинная фраза, модель часто создаёт набор случайных символов или искажённых букв.

В Nano Banana 2 эта проблема заметно уменьшилась. Нейросеть стала гораздо лучше генерировать читаемые надписи, в том числе на русском языке. В описании модели это улучшение называется precision text rendering — точное отображение текста внутри изображения.

Это важно для задач, где текст является частью изображения:

Рекламные баннеры;
Дизайн упаковки;
Постеры;
Инфографика.

Чтобы проверить, насколько точно Nano Banana 2 генерирует длинные надписи внутри изображения, был проведён простой тест.

Задача — сгенерировать рекламный постер кофейни, где текст является важной частью изображения. Такие сцены часто вызывают ошибки у нейросетей для генерации изображений: вместо заданной фразы появляются случайные символы или искажённые буквы.

Nano Banana 2 умеет работать с длинными надписями, поэтому для эксперимента возьмем фразу, где есть:

10–15 слов;
Знаки препинания;
Разделение на две строки.

Потому что именно в таких случаях нейросети обычно начинают ошибаться.

Промт для генерации изображения:

Рекламный постер кофейни, текст: «Свежий кофе, круассаны и завтраки каждый день с 8:00 до 12:00. Начните утро в уютной кофейне», уютная городская кофейня, мягкий утренний свет.

В результате генерации оцениваются три параметра:

Читаемость текста;
Отсутствие ошибок в самой фразе;
Аккуратное размещение надписи внутри композиции.

Nano Banana 2 сгенерировала изображение, где надпись «Свежий кофе, круассаны и завтраки каждый день с 8:00 до 12:00. Начните утро в уютной кофейне» отображается полностью и без искажений.

Фраза написана корректно, без случайных символов и пропущенных букв. Текст встроен в дизайн постера и выглядит как часть реального рекламного макета — надпись располагается на вывеске кофейни и гармонично сочетается с общей композицией изображения.

В результате Nano Banana 2 создаёт изображение, которое выглядит как готовый рекламный постер, а не как концепт с искаженным текстом.

Нейросеть Nano Banana 2 лучше учитывает физику сцены

Одно из заметных улучшений Nano Banana 2 — более точная логика изображения. Речь идёт о том, как объекты взаимодействуют с окружающей средой.

В реальной фотографии многие детали подчиняются законам физики: свет отражается от поверхностей, вода создаёт отражения, стекло искажает изображение, а тени появляются в зависимости от источника света.

Ранее генераторы изображений могли ошибаться в таких ситуациях. Например:

Отражение в воде или стекле не совпадало с объектом;
Надписи в зеркалах отображались неправильно;
Свет и тени не соответствовали источнику освещения.

В Nano Banana 2 такие сцены генерируются точнее. Модель лучше передаёт отражения, освещение и взаимодействие объектов в пространстве. Благодаря этому сложные сцены — с водой, зеркалами, стеклом или источниками света — выглядят более естественно и ближе к реальной фотографии.

Практический эксперимент: чтобы проверить, как Nano Banana 2 работает с отражениями, была создана сцена с водой. Поверхность воды хорошо показывает ошибки генерации: отражение должно повторять фигуру человека, его одежду и позу.

Тестовый промт

Человек стоит на берегу спокойного озера на закате, в тёмной куртке и с рюкзаком, гладкая поверхность воды отражает человека, кинематографическая фотография.

Nano Banana 2 сгенерировала сцену, где человек стоит у воды, а его отражение видно на поверхности озера. Отражение повторяет фигуру персонажа: совпадают силуэт, одежда и положение тела. В отражении сохраняются те же элементы сцены — куртка, рюкзак и поза человека.

Поверхность воды выглядит гладкой, отражение слегка смягчено, как это бывает на реальной воде. Визуально сцена выглядит как фотография с естественным отражением на спокойной водной поверхности.

Nano Banana 2 точнее понимает промты для генерации изображений

В нейросетях для генерации изображений часто возникает проблема интерпретации промта. Даже если в промте перечислены несколько элементов, модель может проигнорировать часть деталей, заменить объекты или добавить лишние элементы. В Nano Banana 2 точность выполнения промтов стала выше. В официальном описании модели это обозначено как precise instruction following — точное следование инструкциям пользователя при генерации изображений.

Модель лучше удерживает структуру описания и корректно воспроизводит объекты, которые указаны в запросе.

Практический эксперимент: Для проверки использован промт с несколькими деталями сцены. Такой тест позволяет увидеть, появляются ли все объекты из описания и правильно ли они расположены в композиции.

Тестовый промт

Девушка в жёлтом плаще стоит на деревянном мосту над узкой рекой, держит красный зонт, рядом на перилах сидит чёрная кошка, осенний парк, лёгкий туман, кинематографическая фотография

Сгенерированное изображение показывает девушку в жёлтом плаще, стоящую на деревянном мосту над узкой рекой. В руках у неё красный зонт, а на перилах моста рядом с ней сидит чёрная кошка. Сцена разворачивается в осеннем парке: вокруг видны деревья с осенней листвой, а лёгкий туман создаёт мягкую атмосферу.

Все элементы, указанные в промте — плащ, зонт, мост, кошка и окружение — присутствуют на изображении и расположены в соответствии с описанием.

Nano Banana 2 улучшила передачу текстур материалов

Одно из заметных обновлений Nano Banana 2 — более точная передача текстур при генерации изображений. В ранних генераторах картинки часто выглядели сглаженными: материалы теряли детали, а разные поверхности могли выглядеть одинаково.

В новой версии модель лучше различает типы материалов и их свойства. В описании модели это обозначено как visual fidelity — повышение визуальной достоверности изображения. Это особенно заметно при генерации поверхностей:

Кожи;
Ткани;
Дерева;
Металла;
Стекла.

Практический эксперимент: Для теста выбрана сцена с несколькими материалами, чтобы можно было сравнить их текстуры и взаимодействие со светом.

Тестовый промт

Крупный план винтажного фотоаппарата на деревянном столе. Стол покрыт легким налетом пыли. Кожаный ремешок камеры, металлический корпус, стеклянная линза объектива, мягкий студийный свет.

Сгенерированное изображение показывает фотоаппарат на деревянном столе. На поверхности стола видна текстура древесины и пыли. Кожаный ремешок камеры выглядит матовым и имеет характерные складки. Металлический корпус отражает свет и имеет гладкую поверхность. Линза объектива передаёт стеклянную структуру и световые блики. Разные материалы в кадре выглядят различимо, поэтому Nano Banana 2 лучше передаёт текстуры дерева, кожи, металла и стекла.

Nano Banana 2 лучше генерирует анатомию персонажей

В нейросетях для генерации изображений сложные сцены с людьми часто приводят к ошибкам в позах, руках, ногах и пропорциях тела. Особенно это заметно, когда в кадре находится несколько персонажей и между ними есть взаимодействие.

В Nano Banana 2 такие сцены выглядят более естественно. Модель точнее передаёт пропорции тела и положение рук и ног в разных позах.

Практический эксперимент: Для теста выбрана сцена пикника, где персонажи расположены на разных планах изображения. Такой сюжет позволяет проверить, как модель передаёт анатомию людей и масштаб фигур в пространстве: один персонаж находится ближе к камере, другие — дальше.

Промпт

Летний пикник в парке, группа друзей сидят на траве: один человек сидит на переднем плане ближе к камере и наливает чай из термоса, двое друзей сидят немного дальше и разговаривают, на заднем плане девушка смеётся, рядом с ней человек держит корзину с фруктами, солнечный день, фотография.

На изображении Nano Banana 2 показывает группу друзей на пикнике, расположенную на разных планах сцены. Один человек находится ближе к камере и наливает чай из термоса. Немного дальше сидят двое друзей, которые разговаривают друг с другом. На заднем плане видна девушка, которая смеётся, рядом с ней человек держит корзину с фруктами.

При генерации изображения в Nano Banana 2 персонажи расположены на разных расстояниях от камеры, поэтому их масштаб отличается: фигуры на переднем плане выглядят крупнее, а люди на заднем плане — меньше. Пропорции тел, положение рук и ног выглядят естественно, а сцена воспринимается как реалистичная фотография группы людей на пикнике.

Стабильность персонажей и объектов в Nano Banana 2

Nano Banana 2 лучше сохраняет внешний вид персонажей при генерации изображений по референсу.

В официальном описании Nano Banana 2 говорится, что модель может удерживать до 5 персонажей и до 14 объектов в одном рабочем процессе. Это означает, что нейросеть старается сохранять ключевые визуальные признаки персонажей при изменении сцены.

Классическая Nano Banana работает в режиме последовательного рабочего процесса: новая сцена генерируется как продолжение предыдущей, и модель может опираться на прошлый результат.

В нашем боте каждая генерация изображения выполняется с нуля, поэтому предыдущие картинки не используются как контекст. В таком режиме для сохранения одного и того же персонажа удобнее использовать референс — изображение героя, которое передаётся Nano Banana 2 как визуальный ориентир.

После того как персонаж создан и выбран как референс, его внешность уже не нужно подробно описывать в каждом новом промпте. Достаточно указать, что в новой сцене должен быть тот же персонаж. Nano Banana 2 берёт внешность героя из референса и переносит её в новую ситуацию.

Апгрейд Nano Banana 2 заметно улучшил работу именно в таком режиме. При генерации новых сцен на основе референса модель точнее сохраняет:

Черты лица;
Причёску;
Одежду;
Аксессуары;
Общий силуэт персонажа.

Практический эксперимент: генерация одного персонажа в разных сценах

Сначала создаётся персонаж, после чего его изображение используется как референс для генерации новых сцен.

Промпт 1 — создание персонажа

Молодой путешественник в зелёной куртке с рыжим рюкзаком, короткие тёмные волосы, кинематографическая фотография.

После генерации это изображение используется как референс.

Промпт 2 — новая сцена с использованием референса

Тот же персонаж сидит у костра в горах ночью, освещённый светом огня.

Промпт 3 — новая сцена с использованием референса

Тот же персонаж сидит у окна поезда и смотрит на пейзаж за окном.

На новых изображениях, созданных в Nano Banana 2 по референсу, сохраняются основные визуальные признаки героя: форма лица, причёска, зелёная куртка и рыжий рюкзак. Меняется только окружение сцены — горы, костёр или интерьер поезда.

Персонаж воспринимается как один и тот же человек в разных ситуациях, что позволяет создавать последовательные сцены одной истории.

Генерация изображений в высоком разрешении до 4K

Nano Banana 2 поддерживает генерацию изображений в разных разрешениях — от 512 пикселей до 4K (3840×2160). Это позволяет использовать нейросеть для разных задач: публикаций в соцсетях, презентаций, печатных материалов и видеопроектов. При необходимости изображение можно сразу сгенерировать в нужном формате, не меняя композицию вручную.

Быстрая генерация изображений благодаря архитектуре Flash

Нейросеть Nano Banana 2 работает на архитектуре Gemini Flash, которая оптимизирована для быстрой генерации изображений. В отличие от более тяжёлых моделей, она быстрее обрабатывает промпты и позволяет получать результат почти сразу после запроса. Высокая скорость особенно важна при работе с визуальными идеями. Пользователь может быстро изменять детали сцены, тестировать разные варианты композиции и получать несколько версий изображения без длительного ожидания.

Такой режим генерации делает работу с изображениями похожей на процесс быстрых набросков: сначала создаётся базовая идея, затем постепенно уточняются детали сцены, освещение или стиль изображения.

Генерация инфографики и диаграмм в Nano Banana 2

Нейросеть Nano Banana 2 стала точнее генерировать инфографику, диаграммы и объясняющие схемы. Если предыдущая версия просто создавала визуальные схемы, то новая модель лучше удерживает структуру информации: последовательность шагов, подписи элементов и связи между объектами.

Основное улучшение связано с тем, что Nano Banana 2 точнее понимает логические процессы и может распределять элементы инфографики так, чтобы они соответствовали описанию. В результате изображения выглядят не просто как набор иконок, а как полноценная схема процесса.

Особенно заметна разница при генерации инфографики, где есть:

Несколько этапов процесса;
Подписи к элементам;
Стрелки, показывающие направление движения;
Логическая последовательность действий.

Тестовый промпт для генерации инфографики

Инфографическая карта прогулки по Санкт-Петербургу, маршрут начинается на Васильевском острове, далее переход через Благовещенский мост, затем Новая Голландия, аллея к Исаакиевскому собору, после Исаакиевского собора маршрут идёт к памятнику Медный всадник, затем прогулка по набережной к Зимнему дворцу и Эрмитажу, финальная точка — станция метро Адмиралтейская; схема маршрута с линией движения и стрелками, подписи к каждому месту, минималистичный стиль туристической карты, светлый фон.

Что можно проверить на такой инфографике

Присутствуют ли все точки маршрута;
Правильно ли подписаны объекты и названия мест;
Понятна ли последовательность движения;
Соединены ли точки линией маршрута или стрелками.

В результате Nano Banana 2 формирует инфографическую карту прогулочного маршрута по Санкт-Петербургу. Маршрут начинается на Васильевском острове и проходит через Благовещенский мост, после чего отмечается точка Новой Голландии. Далее линия маршрута ведёт к Исаакиевскому собору, затем к памятнику Медный всадник. Следующий участок проходит по набережной к Зимнему дворцу и Эрмитажу. Финальной точкой маршрута обозначена станция метро Адмиралтейская.

Все ключевые места подписаны на карте, а между ними проведена линия маршрута со стрелками, показывающими последовательность движения. Инфографика выглядит как схема туристической прогулки, где объекты расположены в логической последовательности и связаны единым маршрутом.

Перевод текста внутри изображения в Nano Banana 2

Ещё одна особенность Nano Banana 2 — перевод текста внутри изображения без разрушения исходного дизайна.

Речь идёт не просто о добавлении новой надписи поверх картинки. Nano Banana 2 анализирует структуру изображения: где находится текст, каким шрифтом он написан и как встроен в композицию. После этого нейросеть может перевести исходный текст на другой язык, сохранив стиль и расположение надписи.

Такая задача сложнее, чем обычная генерация текста. Модели нужно одновременно выполнить несколько задач:

Распознать текст на изображении;
Понять его место в композиции;
Заменить слова на другой язык;
Сохранить шрифт, цвет и форму надписи.

В Nano Banana 2 эта функция работает заметно точнее. При переводе текста нейросеть старается сохранить визуальный стиль изображения, чтобы новая надпись выглядела частью оригинального дизайна.

Это особенно полезно в задачах, где требуется быстро адаптировать визуальные материалы для разных языков — например, при локализации рекламных баннеров, постеров или презентаций.

Практический эксперимент: возьмем изображение с текстом на одном языке, после чего выполним генерацию той же сцены с переводом текста внутри изображения.

Тестовый промпт для перевода текста на изображении

Тот же постер, перевести надпись на русский

После обработки в Nano Banana 2 на изображении сохраняется исходная композиция: круассан и графический стиль постера остаются такими же, как в первоначальной версии. При этом текст на изображении переводится на русский язык.

Надпись встроена в дизайн изображения и выглядит естественной частью композиции — она соответствует стилю постера и не воспринимается как добавленный поверх элемент.

Image Search Grounding в Nano Banana 2: генерация изображений с опорой на поиск Google

Одной из новых функций Nano Banana 2 стала технология Image Search Grounding — генерация изображений с опорой на данные поиска Google. Благодаря этому нейросеть может точнее воспроизводить реальные объекты, географические места, достопримечательности и культурные элементы.

Nano Banana Pro уже умела:

Рисовать реальные объекты;
Генерировать города;
Создавать карты и инфографику.

Но она делала это по обученным данным, а не по актуальной информации из поиска. То есть модель знала:

Как выглядит Париж;
Где примерно находится Лион,

но не использовала поиск Google во время генерации.

В Nano Banana 2 появилась технология Image Search Grounding. Это означает, что модель может:

Обращаться к данным поиска;
Использовать изображения и информацию из интернета;
Уточнять детали реальных объектов.

По сути, изображение в Nano Banana 2 создаётся с опорой на реальные данные из поиска, а не только на знания модели.

Nano Banana 2 лучше справляется с генерацией изображений, где важны реальные детали:

Карты;
Достопримечательности;
Бренды;
Локальные объекты;
Научные схемы.

Например:

Nano Banana Pro может сгенерировать карту Франции, но иногда города на ней расположены приблизительно. Nano Banana 2 чаще размещает города в логически правильных местах, потому что опирается на реальные данные из поиска.

Для проверки используется промт, где требуется создать карту с конкретными городами.

Тестовый промпт для генерации карты

Инфографическая карта Франции, отмечены города Париж, Лион, Марсель, Канкаль

В результате Nano Banana 2 формирует карту Франции, где указаны названия городов. Париж располагается в северной части страны, Лион — ближе к центру, а Марсель — на юге, у побережья Средиземного моря.

Города расположены в логически корректных местах, что показывает, как Image Search Grounding помогает Nano Banana 2 использовать реальные географические данные при генерации изображения.

Заключение

Нейросеть Nano Banana 2 заметно отличается от предыдущей версии не только скоростью, но и общим уровнем генерации изображений. Модель лучше справляется с задачами, где важно точное выполнение промпта, корректная логика сцены и аккуратная работа с текстом внутри изображения.

Кроме улучшения качества генерации, появились и новые сценарии использования. Например, нейросеть может создавать инфографику, переводить текст прямо внутри изображения и использовать данные из поиска для более точной генерации карт и объектов. В результате Nano Banana 2 становится более удобным инструментом для повседневной работы с визуальным контентом. Её можно использовать не только для генерации отдельных изображений, но и для создания презентаций, маркетинговых материалов, схем и других визуальных задач.

Если Nano Banana Pro хорошо подходила для сложных генераций и экспериментов, то Nano Banana 2 делает процесс создания изображений быстрее и удобнее, особенно когда требуется быстро получить несколько вариантов одной идеи.

**Yes_Ai** · 11 марта

Описание содержания: Новая версия нейросети Nano Banana 2 значительно улучшена по сравнению с предыдущей версией Nano Banana Pro. Обновление затронуло точность понимания запросов (промтов), генерацию длинного текста, учет физики сцен и визуальные детали. Нейросеть теперь лучше справляется с созданием читаемых надписей внутри изображений, даже на русском языке, что важно для рекламы и дизайна упаковки.

Улучшена логика изображения: отражения в воде и зеркалах стали более реалистичными, а тени соответствуют источнику света. Nano Banana 2 точнее следует описанию промта, воспроизводя все указанные элементы сцены. Также улучшена передача текстур материалов (кожи, ткани, дерева, металла) и анатомии персонажей, особенно в сложных сценах с несколькими людьми.

Новая версия поддерживает генерацию изображений высокого разрешения до 4K и оптимизирована для быстрой работы благодаря архитектуре Gemini Flash. Добавлена функция перевода текста прямо внутри изображения без изменения дизайна, а также технология Image Search Grounding, позволяющая модели использовать данные из поиска Google для более точной генерации реальных объектов и географических мест, например, при создании карт. Модель лучше справляется с созданием инфографики и схем, сохраняя структуру информации и логическую последовательность элементов.

Войти

статья Обзор новой версии нейросети Nano Banana 2: что изменилось в модели Gemini

Рекомендуемые сообщения

not.found

Nano Banana 2 генерирует читаемый текст на изображениях

Нейросеть Nano Banana 2 лучше учитывает физику сцены

Nano Banana 2 точнее понимает промты для генерации изображений

Nano Banana 2 улучшила передачу текстур материалов

Nano Banana 2 лучше генерирует анатомию персонажей

Стабильность персонажей и объектов в Nano Banana 2

Генерация изображений в высоком разрешении до 4K

Быстрая генерация изображений благодаря архитектуре Flash

Генерация инфографики и диаграмм в Nano Banana 2

Перевод текста внутри изображения в Nano Banana 2

Image Search Grounding в Nano Banana 2: генерация изображений с опорой на поиск Google

Ссылка на комментарий

Поделиться на другие сайты

Yes_Ai

Ссылка на комментарий

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Объявления

Похожий контент

Галерея