Jump to content

Veo 3 - нейросеть для создания видео со звуком


Recommended Posts

  • Administrators

Veo 3 — это нейросеть от компании Google, способная создавать видео по текстовым описаниям и референсам. Её отличительная особенность — возможность создавать видео со звуком, включая озвучку речи персонажей. Veo 3 стала первой в истории нейросетью, обладающей высоким уровнем понимания промтов и поддерживающей озвучивание на разных языках, в том числе и русском.

В этой статье мы расскажем о том, как пользоваться Veo 3, как правильно писать промты для этой нейросети, а также как получить доступ к ней без регистрации и VPN.

image.png

Преимущества Veo 3

  • Возможность генерировать видео со звуком, включая озвучку голосом и синхронизацию губ (lip sync). Поддерживаются разные языки озвучки.
  • Длительность каждого видео составляет 8 секунд вместо привычных 5 (большинство аналогичных нейросетей генерирует видео длительностью до 5 секунд).
  • Высокая скорость генерации (несколько минут).
  • Высокий уровень детализации.
  • Отсутствие ошибок при генерации рук, ног и других частей тела.
  • Уровень понимания промтов часто достигает 80-90%.
  • Veo 3 идеально подходит для создания вирусного контента и юмористических видео.
  • Если вы создаете несколько видео и делаете описание персонажей одинаковым, то с высокой вероятностью на выходе получатся ролики с очень похожими людьми (не одинаковыми, но похожими).

 

Недостатки Veo 3

  • Сравнительно высокая стоимость: 125 видео обойдутся примерно в 250 долларов (стоимость одного видео примерно 150–190 рублей). Если использовать Veo 3 через @yes_ai_bot, стоимость будет значительно ниже.
  • Видео может быть сгенерировано без звука, для решения этой проблемы необходимо изменять промт (если нейросеть отправила видео без звука). Google уже работает над улучшением алгоритма.
  • Поддерживаются промты только на английском языке (однако в Yes Ai Bot эта проблема решена — поддерживаются все языки, в том числе русский).
  • Иногда в видео помимо озвученной речи появляются субтитры. Google уже работает над улучшением алгоритма.
  • Лица людей могут искажаться, если персонажи находятся далеко от камеры.
  • Если в видео несколько персонажей, нейросеть может перепутать, кто из них должен произнести нужную фразу.
  • Доступ к Veo 3 официально есть только у жителей США, требуется VPN и аккаунт Google, созданный в Америке. Существует высокая вероятность блокировки доступа, если Google заподозрит, что пользователь не из США (например, по геолокации браузера, IP-адресу прокси и другим признакам).
  • На данном этапе нейросеть не очень хорошо пишет тексты, указанные в промте (могут быть ошибки).

Как писать промты для Veo 3

Нейросеть понимает только английский текст промтов, и возникает вопрос: «А как же делать озвучку русскоговорящих персонажей?»  
Все достаточно просто. Вот основные тезисы:  

  • Пишите всю описательную часть промта на английском языке, а текст диалогов ставьте "в кавычки" и пишите его на нужном языке, например, на русском.
  • Описательная часть промта (та, которая на английском) должна быть примерно в 2–3 раза больше по объёму, чем текст, находящийся в кавычках (то есть, реплики персонажей).

Пример промта с диалогом:

grandma with a pink bow and a green umbrella walks down the street of St. Petersburg waving a fan; she says, "Как же прекрасен этот день." grandma walks into the sunset

🚩 Если вы генерируете видео в Veo 3 через @yes_ai_bot в Телеграм, описанные выше правила вас не касаются. Система Yes Ai самостоятельно выполняет все необходимые преобразования промтов автоматически. Просто пишите промты на русском языке: как описательную, так и диалоговую часть.

🔞 Генерация видео категории NSFW (not safe for work) строго запрещена.

Пример промта с диалогом для Yes Ai Bot:

бабуля с розовым бантом и зелёным зонтиком идёт по улице Санкт-Петербурга, размахивая веером, и говорит: «Как прекрасен этот день». бабуля уходит в закат

Как запустить генерацию по промту в нейросети Veo 3 через телеграм-бота

  • Запустите бота по этой ссылке: https://t.me/yes_ai_bot?start=_veo
  • Отправьте текстовое сообщение с описанием генерации (промт на любом языке).
  • В появившемся меню нажмите кнопку «🐬 Veo 3» и запустите задание. Генерация займёт несколько минут.

image.png


Как запустить генерацию по референсу Veo 3

Важно! Veo 3 поддерживает в качестве референсов картинки с соотношением сторон 16:9, если вы загрузите изображение с другими пропорциями, то из него будет взята только прямоугольная центральная часть.

  • Запустите бота по этой ссылке: https://t.me/yes_ai_bot?start=_veo
  • Отправьте боту картинку, которую хотите использовать в качестве референса (на данный момент поддерживается только одно изображение). В примечании к референсу необходимо указать промт.

image.png

  • В появившемся меню нажмите кнопку "🐬 Veo 3"

image.png

  • Нажмите кнопку "🎞 Анимировать изображение"

image.png


Работа с нейросетью Veo 3 через официальный сайт

Вы можете зарегистрироваться в Google, используя IP-адрес из США и американскую карту для оплаты. Учтите, что вам также понадобится американская SIM-карта для приёма SMS.  

image.jpeg

  • Like 1
  • Like 3

image.png.bbc007783bfd77866c40d333bcf7acb0.pngimage.png.34ece97900fdaa0a096e6e0fa4f78094.png

Link to comment
Share on other sites

  • admin changed the title to Veo 3 - нейросеть для создания видео со звуком
  • admin pinned this topic
Краткий обзор материала: Статья посвящена нейросети Veo 3 от Google, которая генерирует видео по текстовым описаниям, включая звук и озвучку персонажей на разных языках (в том числе русском). Veo 3 выделяется высоким уровнем понимания промптов, детализацией изображений и относительно высокой скоростью генерации. Видео создаются продолжительностью до 8 секунд с возможностью синхронизации губной артикуляции.

В статье подробно рассматриваются преимущества Veo 3 (звук, озвучка, языковая поддержка, длительность видео, скорость и детализация) и недостатки (стоимость, зависимость от корректности промптов, языковые ограничения при работе с официальным сайтом, искажение лиц на расстоянии, возможные путаницы в репликах персонажей, географические ограничения доступа).

Особое внимание уделено правильному составлению промптов для Veo 3: рекомендуется писать описательную часть на английском языке, а диалоги – на нужном языке (например, русском) в кавычках. Для упрощения процесса и обхода языковых ограничений предлагается использовать телеграм-бот @yes_ai_bot, который автоматически преобразует промпты, позволяя создавать видео с русскоязычными персонажами без необходимости использования VPN или американского аккаунта Google. В заключение описываются способы запуска генерации через телеграм-бота и официальный сайт, а также подчеркивается необходимость американской SIM-карты для получения SMS при регистрации на сайте.
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...