Пользователь not.found Опубликовано 1 час назад Пользователь Поделиться Опубликовано 1 час назад Обзор новой версии нейросети Nano Banana 2: что изменилось в модели Gemini. Во второй части разбирается, как нейросеть Nano Banana 2 стала точнее понимать промты, корректно генерировать длинный текст и лучше учитывать физику сцен. В обзоре показаны реальные эксперименты: тест текстур, анатомии персонажей и скорости генерации изображений. 26 феврая 2026 года появилась новая версия модели генерации изображений — нейросеть Nano Banana 2. Обновление затронуло сразу несколько ключевых аспектов работы нейросети: точность генерации, понимание контекста сцены, скорость обработки задач и качество визуальных деталей. Модель стала точнее следовать описанию в промтах, аккуратнее работать с текстом и стабильнее создавать сложные сцены. Разработчики также оптимизировали движок генерации. Задания выполняются быстрее, а количество ошибок заметно снизилось даже при высокой нагрузке. Система стабильнее интерпретирует промты и реже блокирует корректные запросы. Однако главный вопрос заключается в другом: какие изменения действительно заметны на практике и чем Nano Banana 2 отличается от предыдущей версии Nano Banana Pro. Чтобы это выяснить, ключевые функции новой модели были проверены на реальных промтах — от генерации текста внутри изображения до сложных сцен с несколькими персонажами. Нейросеть Nano Banana 2 генерирует длинные тексты Одна из проблем большинства генераторов изображений — текст внутри картинки. Когда в промте есть длинная фраза, модель часто создаёт набор случайных символов или искажённых букв. В Nano Banana 2 эта проблема заметно уменьшилась. Нейросеть стала гораздо лучше генерировать читаемые надписи, в том числе на русском языке. В описании модели это улучшение называется precision text rendering — точное отображение текста внутри изображения. Это важно для задач, где текст является частью изображения: Рекламные баннеры; Дизайн упаковки; Постеры; Инфографика. Чтобы проверить, насколько точно Nano Banana 2 генерирует длинные надписи внутри изображения, был проведён простой тест. Задача — создать рекламный постер кофейни, где текст является важной частью изображения. Такие сцены обычно вызывают ошибки у многих генеративных моделей: вместо фразы появляются случайные символы или искажённые буквы. Nano Banana 2 умеет работать именно с длинными надписями, поэтому для эксперимента возьмем фразу, где есть: 10–15 слов; Знаки препинания Возможно две строки. Потому что именно в таких случаях нейросети обычно начинают ошибаться. Промпт: Рекламный постер кофейни, текст: «Свежий кофе, круассаны и завтраки каждый день с 8:00 до 12:00. Начните утро в уютной кофейне», уютная городская кофейня, мягкий утренний свет. В результате генерации оцениваются три параметра: Читаемость текста; Отсутствие ошибок в самой фразе; Аккуратное размещение надписи внутри композиции. Nano Banana 2 сгенерировала изображение, где надпись «Свежий кофе, круассаны и завтраки каждый день с 8:00 до 12:00. Начните утро в уютной кофейне» отображается полностью и без искажений. Фраза написана корректно, без случайных символов и пропущенных букв. Текст встроен в дизайн постера и выглядит как часть реального рекламного макета — надпись располагается на вывеске кофейни и гармонично сочетается с общей композицией изображения. В результате получается изображение, которое визуально выглядит как готовый рекламный постер, а не как концепт с искажённым текстом. Нейросеть Nano Banana 2 лучше учитывает физику сцены Одно из заметных улучшений Nano Banana 2 — более точная логика изображения. Речь идёт о том, как объекты взаимодействуют с окружающей средой. В реальной фотографии многие детали подчиняются законам физики: свет отражается от поверхностей, вода создаёт отражения, стекло искажает изображение, а тени появляются в зависимости от источника света. Ранее генераторы изображений могли ошибаться в таких ситуациях. Например: Отражение в воде или стекле не совпадало с объектом; Надписи в зеркалах отображались неправильно; Свет и тени не соответствовали источнику освещения. В Nano Banana 2 такие сцены обрабатываются точнее. Модель лучше понимает, как должны работать отражения, освещение и взаимодействие объектов в пространстве. Благодаря этому сложные сцены — с водой, зеркалами, стеклом или источниками света — выглядят более естественно и ближе к реальной фотографии. Практический эксперимент: Чтобы проверить, как модель работает с отражениями, была создана сцена с водой. Поверхность воды хорошо показывает ошибки генерации: отражение должно повторять фигуру человека, его одежду и позу. Тестовый промт Человек стоит на берегу спокойного озера на закате, в тёмной куртке и с рюкзаком, гладкая поверхность воды отражает человека, кинематографическая фотография. Nano Banana 2 сгенерировала сцену, где человек стоит у воды, а его отражение видно на поверхности озера. Отражение повторяет фигуру персонажа: совпадают силуэт, одежда и положение тела. В отражении сохраняются те же элементы сцены — куртка, рюкзак и поза человека. Поверхность воды выглядит гладкой, отражение слегка смягчено, как это бывает на реальной воде. Визуально сцена напоминает фотографию с естественным отражением на спокойной водной поверхности. Нейросеть Nano Banana 2 точнее следует описанию промта В генераторах изображений часто возникает проблема интерпретации запроса. Даже если в промте перечислены несколько элементов, модель может проигнорировать часть деталей, заменить объекты или добавить лишние элементы. В Nano Banana 2 точность выполнения промта стала выше. В официальном описании модели это обозначено как precise instruction following — точное следование инструкциям пользователя. Модель лучше удерживает структуру описания и корректно воспроизводит объекты, которые указаны в запросе. Практический эксперимент: Для проверки использован промт с несколькими деталями сцены. Такой тест позволяет увидеть, появляются ли все объекты из описания и правильно ли они расположены в композиции. Тестовый промт Девушка в жёлтом плаще стоит на деревянном мосту над узкой рекой, держит красный зонт, рядом на перилах сидит чёрная кошка, осенний парк, лёгкий туман, кинематографическая фотография Сгенерированное изображение показывает девушку в жёлтом плаще, стоящую на деревянном мосту над узкой рекой. В руках у неё красный зонт, а на перилах моста рядом с ней сидит чёрная кошка. Сцена разворачивается в осеннем парке: вокруг видны деревья с осенней листвой, а лёгкий туман создаёт мягкую атмосферу. Все элементы, указанные в промте — плащ, зонт, мост, кошка и окружение — присутствуют на изображении и расположены в соответствии с описанием. Улучшенная передача текстур материалов Одно из заметных обновлений Nano Banana 2 — более точная передача текстур. В ранних генераторах изображения часто выглядели сглаженными: материалы теряли детали, а разные поверхности могли выглядеть одинаково. В новой версии модель лучше различает типы материалов и их свойства. В описании модели это обозначено как visual fidelity — повышение визуальной достоверности изображения. Это особенно заметно при генерации поверхностей: Кожи; Ткани; Дерева; Металла; Стекла. Практический эксперимент: Для теста выбрана сцена с несколькими материалами, чтобы можно было сравнить их текстуры и взаимодействие со светом. Тестовый промт Крупный план винтажного фотоаппарата на деревянном столе. Стол покрыт легким налетом пыли. Кожаный ремешок камеры, металлический корпус, стеклянная линза объектива, мягкий студийный свет. Сгенерированное изображение показывает фотоаппарат на деревянном столе. На поверхности стола видна текстура древесины и пыли. Кожаный ремешок камеры выглядит матовым и имеет характерные складки. Металлический корпус отражает свет и имеет гладкую поверхность. Линза объектива передаёт стеклянную структуру и световые блики. Разные материалы в кадре выглядят различимо и имеют характерные визуальные свойства. Улучшенная анатомия персонажей В генераторах изображений сложные сцены с людьми часто приводят к ошибкам в позах или пропорциях тела. Особенно это заметно, когда в кадре находится несколько персонажей и между ними есть взаимодействие. В Nano Banana 2 такие сцены выглядят более естественно. Модель точнее передаёт пропорции тела и положение рук и ног в разных позах. Практический эксперимент: Для теста выбрана сцена пикника, где персонажи расположены на разных планах изображения. Такой сюжет позволяет проверить, как модель передаёт анатомию людей и масштаб фигур в пространстве: один персонаж находится ближе к камере, другие — дальше. Промпт Летний пикник в парке, группа друзей сидят на траве: один человек сидит на переднем плане ближе к камере и наливает чай из термоса, двое друзей сидят немного дальше и разговаривают, на заднем плане девушка смеётся, рядом с ней человек держит корзину с фруктами, солнечный день, фотография. На изображении показана группа друзей на пикнике, расположенных на разных планах сцены. Один человек находится ближе к камере и наливает чай из термоса. Немного дальше сидят двое друзей, которые разговаривают друг с другом. На заднем плане видна девушка, которая смеётся, рядом с ней человек держит корзину с фруктами. Персонажи расположены на разных расстояниях от камеры, поэтому их масштаб отличается: фигуры на переднем плане выглядят крупнее, а люди на заднем плане — меньше. Пропорции тел и положение рук и ног выглядят естественно, а сцена воспринимается как фотография группы людей на пикнике. Стабильность персонажей и объектов Nano Banana 2 лучше сохраняет внешний вид персонажей при генерации изображений на основе референсов. В официальном описании модели говорится о способности удерживать до 5 персонажей и до 14 объектов в одном рабочем процессе. Это означает, что модель старается сохранять ключевые визуальные признаки персонажей при изменении сцены. Классическая Nano Banana работает в режиме последовательного workflow — когда новая сцена генерируется как продолжение предыдущей, и модель может опираться на предыдущий результат. В нашем боте каждая генерация выполняется с нуля, поэтому предыдущие изображения не используются как контекст. В таком режиме для сохранения персонажа удобнее использовать референс — изображение героя, которое передаётся модели как визуальный ориентир. После того как персонаж создан и выбран как референс, его внешность уже не нужно подробно описывать в каждом новом промпте. Достаточно указать, что в новой сцене должен быть тот же персонаж. Модель берёт внешность героя из референса и переносит её в новую ситуацию. Апгрейд Nano Banana 2 заметно улучшил работу именно в таком режиме. При генерации новых сцен на основе референса модель точнее сохраняет: Черты лица; Причёску; Одежду; Аксессуары; Общий силуэт персонажа. Практический эксперимент: Сначала создаётся персонаж, после чего его изображение используется как референс для генерации новых сцен. Промпт 1 — создание персонажа Молодой путешественник в зелёной куртке с рыжим рюкзаком, короткие тёмные волосы, кинематографическая фотография. После генерации это изображение используется как референс. Промпт 2 — новая сцена с использованием референса Тот же персонаж сидит у костра в горах ночью, освещённый светом огня. Промпт 3 — новая сцена с использованием референса Тот же персонаж сидит у окна поезда и смотрит на пейзаж за окном. На новых изображениях сохраняются основные визуальные признаки героя: форма лица, причёска, зелёная куртка и рыжий рюкзак. Меняется только окружение сцены — горы, костёр или интерьер поезда. Персонаж воспринимается как один и тот же человек в разных ситуациях, что позволяет создавать последовательные сцены одной истории. Поддержка высокого разрешения до 4K Nano Banana 2 поддерживает генерацию изображений в разных разрешениях. Модель может создавать картинки от 512 пикселей до 4K (3840×2160). Это позволяет использовать нейросеть для разных задач: от публикаций в соцсетях до презентаций, печатных материалов и видеопроектов. При необходимости изображение можно сразу генерировать в нужном формате, не меняя композицию вручную. Быстрая генерация благодаря архитектуре Flash Нейросеть Nano Banana 2 работает на архитектуре Gemini Flash, которая оптимизирована для высокой скорости генерации. В отличие от более тяжёлых моделей, она быстрее обрабатывает промты и позволяет получать результат практически сразу после запроса. Высокая скорость особенно важна при работе с визуальными идеями. Пользователь может быстро изменять детали сцены, тестировать разные варианты композиции и получать несколько версий изображения без длительного ожидания. Такой режим генерации делает работу с изображениями похожей на процесс быстрых набросков: сначала создаётся базовая идея, затем постепенно уточняются детали сцены, освещение или стиль изображения. Генерация инфографики и диаграмм Нейросеть Nano Banana 2 стала точнее работать с инфографикой и объясняющими схемами. Если предыдущая версия просто могла создавать визуальные схемы, то новая модель лучше удерживает структуру информации: последовательность шагов, подписи элементов и связи между объектами. Основное улучшение связано с тем, что Nano Banana 2 точнее понимает логические процессы и может распределять элементы инфографики так, чтобы они соответствовали описанию. В результате изображения выглядят не просто как набор иконок, а как полноценная схема процесса. Особенно заметна разница в инфографике, где есть: Несколько этапов процесса; Подписи к элементам; Стрелки, показывающие направление движения; Логическая последовательность действий. Тестовый промт Инфографическая карта прогулки по Санкт-Петербургу, маршрут начинается на Васильевском острове, далее переход через Благовещенский мост, затем Новая Голландия, аллея к Исаакиевскому собору, после Исаакиевского собора маршрут идёт к памятнику Медный всадник, затем прогулка по набережной к Зимнему дворцу и Эрмитажу, финальная точка — станция метро Адмиралтейская; схема маршрута с линией движения и стрелками, подписи к каждому месту, минималистичный стиль туристической карты, светлый фон. Что можно проверить на такой инфографике Присутствуют ли все точки маршрута; Правильно ли подписаны объекты и названия мест; Понятна ли последовательность движения; Соединены ли точки линией маршрута или стрелками. На изображении формируется инфографическая карта прогулочного маршрута по Санкт-Петербургу. Маршрут начинается на Васильевском острове и проходит через Благовещенский мост, после чего отмечена точка Новой Голландии. Далее линия маршрута ведёт к Исаакиевскому собору, затем к памятнику Медный всадник. Следующий участок проходит по набережной к Зимнему дворцу и Эрмитажу. Финальной точкой маршрута обозначена станция метро Адмиралтейская. Все ключевые места подписаны на карте, а между ними проведена линия маршрута со стрелками, показывающими последовательность движения. Инфографика выглядит как схема туристической прогулки, где объекты расположены в логической последовательности и связаны единым маршрутом. Перевод текста прямо внутри изображения Ещё одна особенность Nano Banana 2 — возможность изменять язык текста непосредственно внутри изображения, не разрушая сам дизайн. Речь идёт не просто о добавлении новой надписи поверх картинки. Модель анализирует структуру изображения: где находится текст, каким шрифтом он написан и как встроен в композицию. После этого нейросеть может заменить исходный текст на другой язык, сохранив стиль и расположение надписи. Такая задача сложнее, чем обычная генерация текста. Модели нужно одновременно решить несколько вещей: Распознать текст на изображении; Понять его место в композиции; Заменить слова на другой язык; Сохранить шрифт, цвет и форму надписи. В Nano Banana 2 эта функция работает заметно точнее. При переводе текста нейросеть старается сохранить визуальный стиль изображения, чтобы новая надпись выглядела частью оригинального дизайна. Это особенно полезно в задачах, где требуется быстро адаптировать визуальные материалы для разных языков — например, при локализации рекламных баннеров, постеров или презентаций. Практический эксперимент: Мы возьмем изображение с текстом на одном языке, после чего выполним генерацию той же сцены с переводом текста. Тестовый промт Тот же постер, перевести надпись на русский На изображении сохраняется исходная композиция: круассан и графический стиль постера остаются такими же, как в первоначальной версии. При этом текст на изображении отображается на русском языке. Надпись встроена в дизайн изображения и выглядит естественной частью композиции — она соответствует стилю постера и не воспринимается как добавленный поверх элемент. Поиск информации через Image Search Grounding Одной из новых функций Nano Banana 2 стала технология Image Search Grounding. Она позволяет модели использовать данные из поиска Google при генерации изображений. Благодаря этому нейросеть может точнее воспроизводить реальные объекты, географические места и культурные элементы. Nano Banana Pro уже умела: Рисовать реальные объекты; Генерировать города; Создавать карты и инфографику. Но она делала это по обученным данным, а не по актуальной информации из поиска. То есть модель знала: Как выглядит Париж; Где примерно находится Лион но не использовала поиск Google во время генерации. В Nano Banana 2 появилась технология Image Search Grounding. Это означает, что модель может: Обращаться к данным поиска; Использовать изображения и информацию из интернета; Уточнять детали реальных объектов. По сути, изображение создаётся с опорой на реальные данные, а не только на знания модели. Nano Banana 2 лучше справляется с задачами, где важны реальные детали: Карты Достопримечательности Бренды Локальные объекты Научные схемы. Например: Nano Banana Pro может нарисовать карту Франции, но иногда города расположены приблизительно. Nano Banana 2 чаще размещает города в логически правильных местах, потому что опирается на реальные данные. Для проверки используется промт, где требуется создать карту с конкретными городами. Тестовый промт Инфографическая карта Франции, отмечены города Париж, Лион, Марсель, Канкаль На изображении формируется карта Франции, где указаны названия городов. Париж располагается в северной части страны, Лион — ближе к центру, а Марсель — на юге у побережья Средиземного моря. Города расположены в логически корректных местах, что показывает использование моделью реальных географических данных при генерации изображения. Заключение Нейросеть Nano Banana 2 заметно отличается от предыдущей версии не только скоростью, но и общим уровнем работы с изображениями. Модель лучше справляется с задачами, где важно точное выполнение промта, корректная логика сцены и аккуратная работа с текстом внутри изображения. Кроме улучшения качества генерации, появились и новые сценарии использования. Например, нейросеть может создавать инфографику, переводить текст прямо внутри изображения и использовать данные из поиска для более точной генерации карт и объектов. В результате Nano Banana 2 становится более удобным инструментом для повседневной работы с визуальным контентом. Её можно использовать не только для генерации отдельных изображений, но и для создания презентаций, маркетинговых материалов, схем и других визуальных задач. Если Nano Banana Pro хорошо подходила для сложных генераций и экспериментов, то Nano Banana 2 делает процесс создания изображений быстрее и удобнее, особенно когда требуется быстро получить несколько вариантов одной идеи. Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
Рекомендуемые сообщения
Присоединяйтесь к обсуждению
Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.