Модератор Baki Опубликовано 2 часа назад Модератор Поделиться Опубликовано 2 часа назад Google, похоже, готовит крупный AI-анонс — Gemini Omni. Это новая мультимодальная нейросеть в линейке Gemini, которая должна работать не только с текстом и изображениями, но и с видео, аудио, кодом, таблицами и большими массивами данных. Цитата По предварительным данным, Gemini Omni могут представить на Google I/O 19–20 мая. Что такое Google Gemini Omni Gemini Omni называют отдельной AI-моделью Google, а не просто обновлением видеогенератора Veo. Разница принципиальная. Veo в первую очередь заточен под генерацию видео. А Gemini Omni, судя по слухам, должна стать универсальным AI-инструментом: пользователь загружает файл, пишет задачу обычным языком, а нейросеть сама работает с нужным форматом — текстом, роликом, звуком, картинкой, таблицей или кодом. То есть Google пытается собрать в одном окне генерацию, редактирование, анализ, программирование и автоматизацию. Главная функция Gemini Omni — AI-редактирование видео по текстовому запросу Самая обсуждаемая возможность Gemini Omni — редактирование видео прямо в чате. Можно будет загрузить ролик и написать, что изменить: поменять ракурс; улучшить качество; заменить фон или объект; изменить стиль; доработать звук; применить монтажный шаблон; адаптировать видео под Reels, Shorts, рекламу или VK Клипы. Например: «Сделай сцену в стиле ночного Токио, добавь мягкий свет и убери шум в голосе». Без таймлайна, сложных настроек и ручного монтажа. Если Google добьётся стабильного результата, это может заметно встряхнуть рынок AI-видео. Чем Gemini Omni отличается от Veo По слухам, новая модель может обойти Veo по нескольким пунктам: качество картинки; стабильность объектов в кадре; реалистичная работа со звуком; понимание сложных команд; редактирование готовых видео, а не только генерация новых; работа с разными типами данных в одном интерфейсе. Особенно важна стабильность сцены. Сейчас у многих видеонейросетей персонажи «плывут», предметы меняются между кадрами, детали пропадают при смене плана. Если Gemini Omni решит эту проблему, модель быстро заинтересует блогеров, маркетологов, дизайнеров и продакшен-команды. Возможности Google Gemini Omni Ожидается, что Gemini Omni сможет: генерировать и редактировать видео; создавать и дорабатывать изображения; писать тексты, сценарии, письма, описания товаров; помогать с кодом, искать ошибки и объяснять фрагменты программы; анализировать документы, таблицы, отчёты и большие массивы данных; работать через Gemini API в приложениях, ботах и корпоративных системах. Также вероятна интеграция с Google Cloud, Google Workspace и Google Sheets. Если модель получит прямой доступ к таблицам и документам, она станет полезной для бизнеса, аналитики и командной работы. Где пригодится Gemini Omni Сценариев много: рекламные видео; визуалы для соцсетей; короткие ролики для Shorts, Reels, VK Клипов; презентации и сценарии; SEO-тексты и описания; анализ продаж и маркетинговых данных; автоматизация отчётов; проверка кода; обработка выгрузок из CRM. Для российского рынка это особенно актуально. В 2026 году бизнесу нужны инструменты, которые быстро закрывают рутину: собрать ролик для Telegram или VK, подготовить отчёт, переписать текст под SEO, проверить код сайта, разобрать таблицу с продажами. Если всё это будет доступно в одном AI-интерфейсе, спрос окажется высоким. Когда выйдет Gemini Omni Точной даты релиза пока нет. Главная ожидаемая площадка для анонса — Google I/O 19–20 мая. После выхода Gemini Omni для генерации и редактирования видео модель будет добавлена в @yes_ai_bot Следить за обновлениями можно в канале: https://t.me/yes_ai_official Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
Рекомендуемые сообщения
Присоединяйтесь к обсуждению
Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.