Перейти к содержанию

Veo 3 - нейросеть для создания видео со звуком


Рекомендуемые сообщения

  • Администратор

Veo 3 — это нейросеть от компании Google, способная создавать видео по текстовым описаниям и референсам. Её отличительная особенность — возможность создавать видео со звуком, включая озвучку речи персонажей. Veo 3 стала первой в истории нейросетью, обладающей высоким уровнем понимания промтов и поддерживающей озвучивание на разных языках, в том числе и русском.

В этой статье мы расскажем о том, как пользоваться Veo 3, как правильно писать промты для этой нейросети, а также как получить доступ к ней без регистрации и VPN.

image.png

Преимущества Veo 3

  • Возможность генерировать видео со звуком, включая озвучку голосом и синхронизацию губ (lip sync). Поддерживаются разные языки озвучки.
  • Длительность каждого видео составляет 8 секунд вместо привычных 5 (большинство аналогичных нейросетей генерирует видео длительностью до 5 секунд).
  • Высокая скорость генерации (несколько минут).
  • Высокий уровень детализации.
  • Отсутствие ошибок при генерации рук, ног и других частей тела.
  • Уровень понимания промтов часто достигает 80-90%.
  • Veo 3 идеально подходит для создания вирусного контента и юмористических видео.
  • Если вы создаете несколько видео и делаете описание персонажей одинаковым, то с высокой вероятностью на выходе получатся ролики с очень похожими людьми (не одинаковыми, но похожими).

 

Недостатки Veo 3

  • Сравнительно высокая стоимость: 125 видео обойдутся примерно в 250 долларов (стоимость одного видео примерно 150–190 рублей). Если использовать Veo 3 через @yes_ai_bot, стоимость будет значительно ниже.
  • Видео может быть сгенерировано без звука, для решения этой проблемы необходимо изменять промт (если нейросеть отправила видео без звука). Google уже работает над улучшением алгоритма.
  • Поддерживаются промты только на английском языке (однако в Yes Ai Bot эта проблема решена — поддерживаются все языки, в том числе русский).
  • Иногда в видео помимо озвученной речи появляются субтитры. Google уже работает над улучшением алгоритма.
  • Лица людей могут искажаться, если персонажи находятся далеко от камеры.
  • Если в видео несколько персонажей, нейросеть может перепутать, кто из них должен произнести нужную фразу.
  • Доступ к Veo 3 официально есть только у жителей США, требуется VPN и аккаунт Google, созданный в Америке. Существует высокая вероятность блокировки доступа, если Google заподозрит, что пользователь не из США (например, по геолокации браузера, IP-адресу прокси и другим признакам).
  • На данном этапе нейросеть не очень хорошо пишет тексты, указанные в промте (могут быть ошибки).

 

Ограничения

  • запрещено создавать контент категории 18+ (NSFW);
  • запрещено использовать в промтах и референсах имена, фамилии и образы известных личностей.

Как писать промты для Veo 3

Нейросеть понимает только английский текст промтов, и возникает вопрос: «А как же делать озвучку русскоговорящих персонажей?»  
Все достаточно просто. Вот основные тезисы:  

  • Пишите всю описательную часть промта на английском языке, а текст диалогов ставьте "в кавычки" и пишите его на нужном языке, например, на русском.
  • Описательная часть промта (та, которая на английском) должна быть примерно в 2–3 раза больше по объёму, чем текст, находящийся в кавычках (то есть, реплики персонажей).

Пример промта с диалогом:

grandma with a pink bow and a green umbrella walks down the street of St. Petersburg waving a fan; she says, "Как же прекрасен этот день." grandma walks into the sunset

🚩 Если вы генерируете видео в Veo 3 через @yes_ai_bot в Телеграм, описанные выше правила вас не касаются. Система Yes Ai самостоятельно выполняет все необходимые преобразования промтов автоматически. Просто пишите промты на русском языке: как описательную, так и диалоговую часть.

🔞 Генерация видео категории NSFW (not safe for work) строго запрещена.

Пример промта с диалогом для Yes Ai Bot:

бабуля с розовым бантом и зелёным зонтиком идёт по улице Санкт-Петербурга, размахивая веером, и говорит: «Как прекрасен этот день». бабуля уходит в закат

Как запустить генерацию по промту в нейросети Veo 3 через телеграм-бота

  • Запустите бота по этой ссылке: https://t.me/yes_ai_bot?start=_veo
  • Отправьте текстовое сообщение с описанием генерации (промт на любом языке).
  • В появившемся меню нажмите кнопку «🐬 Veo 3» и запустите задание. Генерация займёт несколько минут.

image.png


Как запустить генерацию по референсу Veo 3

Важно! Veo 3 поддерживает в качестве референсов картинки с соотношением сторон 16:9, если вы загрузите изображение с другими пропорциями, то из него будет взята только прямоугольная центральная часть.

  • Запустите бота по этой ссылке: https://t.me/yes_ai_bot?start=_veo
  • Отправьте боту картинку, которую хотите использовать в качестве референса (на данный момент поддерживается только одно изображение). В примечании к референсу необходимо указать промт.

image.png

  • В появившемся меню нажмите кнопку "🐬 Veo 3"

image.png

  • Нажмите кнопку "🎞 Анимировать изображение"

image.png


API нейросети Veo 3

Мы разработали API (application programming interface) для нейросети Veo 3, так что вы можете интегрировать функции этой нейросети в собственный проект: в бота, на сайт или в приложение. Все инструкции и описание находятся в этом документе: https://yesai.su/ru/docs/veo

 


Работа с нейросетью Veo 3 через официальный сайт

Вы можете зарегистрироваться в Google, используя IP-адрес из США и американскую карту для оплаты. Учтите, что вам также понадобится американская SIM-карта для приёма SMS.  

image.jpeg

image.png.bbc007783bfd77866c40d333bcf7acb0.pngimage.png.34ece97900fdaa0a096e6e0fa4f78094.png

Ссылка на комментарий
Поделиться на другие сайты

  • admin изменил название на Veo 3 - нейросеть для создания видео со звуком
  • admin закрепил тема
Краткий обзор материала: Статья посвящена нейросети Veo 3 от Google, которая генерирует видео по текстовым описаниям, включая звук и озвучку персонажей на разных языках (в том числе русском). Veo 3 выделяется высоким уровнем понимания промптов, детализацией изображений и относительно высокой скоростью генерации. Видео создаются продолжительностью до 8 секунд с возможностью синхронизации губной артикуляции.

В статье подробно рассматриваются преимущества Veo 3 (звук, озвучка, языковая поддержка, длительность видео, скорость и детализация) и недостатки (стоимость, зависимость от корректности промптов, языковые ограничения при работе с официальным сайтом, искажение лиц на расстоянии, возможные путаницы в репликах персонажей, географические ограничения доступа).

Особое внимание уделено правильному составлению промптов для Veo 3: рекомендуется писать описательную часть на английском языке, а диалоги – на нужном языке (например, русском) в кавычках. Для упрощения процесса и обхода языковых ограничений предлагается использовать телеграм-бот @yes_ai_bot, который автоматически преобразует промпты, позволяя создавать видео с русскоязычными персонажами без необходимости использования VPN или американского аккаунта Google. В заключение описываются способы запуска генерации через телеграм-бота и официальный сайт, а также подчеркивается необходимость американской SIM-карты для получения SMS при регистрации на сайте.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...