Перейти к содержанию

Как оживить фото: говорящая голова с помощью нейросети Yes Ai


Рекомендуемые сообщения

Технологии искусственного интеллекта и нейросетей стремительно развиваются, открывая новые горизонты для творчества и самовыражения. Одним из самых интересных направлений является анимация статичных изображений, что позволяет создавать «говорящие головы» из обычных фотографий. В этой статье мы рассмотрим, как можно анимировать своё фото с помощью звукового файла, а также обсудим, для чего это может быть полезно.

«Говорящая голова» — это анимированное изображение человека, которое синхронизировано с аудиофайлом. Это может быть как простая анимация, где губы движутся в такт речи, так и более сложные варианты, включающие мимику и жесты. Такие технологии находят применение в различных областях: от развлечений до образования и маркетинга.

Как анимировать своё фото?

Шаг 1: Подготовка изображения

Первым шагом является выбор подходящего фото. Лучше всего использовать изображение с четким лицом, хорошим освещением и нейтральным фоном. Это поможет нейросети лучше распознать черты лица и создать более реалистичную анимацию. Лицо должно занимать площадь на изображении не менее 30%.

Шаг 2: Выбор инструмента. Существует множество онлайн-сервисов и программ, которые позволяют анимировать фотографии. Некоторые из них используют нейросети для создания анимации. Я покажу как сделать анимацию фото на основе сервиса, которым пользуюсь сама в Telegram bot.

На данный момент в сервисе доступны два алгоритма анимации:

  • Анимация лица с удалением остальной части изображения (самый стабильный метод).
  • Анимация лица с сохранением всего изображения (возможны искажения).

Перед тем как запустить задание, учтите несколько важных моментов:

  • Если выбрана анимация лица с сохранением всего изображения, выполнение задания займет больше времени и будет стоить дороже по сравнению с методом анимации только лица.
  • Анимировать можно исключительно человеческие лица. Для анимации с полным изображением выбирайте фотографии, где лицо занимает не менее 30% площади.
  • Аудиофайлы для анимации должны содержать только голос. Не загружайте аудио с фоновыми шумами и музыкой, так как это может привести к искажениям. Длительность видео будет зависеть от продолжительности аудиофайла.

Шаг 3: Откройте бот в мессенджере Telegram.

Шаг 4: В нижнем меню выберите пункт "Yes Video".

Шаг 5: Затем выберите модель "AniPhoto".

2024-07-29130033.thumb.png.25f12cee7cf277374560301cdb08a08d.png

Шаг 6Отправьте боту фотографию с лицом для анимации с вашего устройства или выберите изображение из "Галереи DeepFace".

Шаг 7: В появившемся сообщении нажмите кнопку "🗣 Анимировать с голосом".

Шаг 8: Отправьте голосовое сообщение длительностью до 60 секунд или загрузите аудиофайл в формате mp3 или wav (длительность от 2 до 60 сек). Это может быть запись вашего голоса, фраза из фильма или любой другой аудиофайл. Важно, чтобы звук был четким и хорошо записанным, так как это повлияет на качество анимации.

Шаг 9: Выберите метод анимации:

  •    "Анимировать только лицо" (в этом случае остальная часть изображения будет обрезана).
  •    "Анимация лица + полное разрешение" (лицо будет анимировано и встроено в исходное изображение).

Шаг 10: Нажмите кнопку " Запустить генерацию".

Шаг 11: Ожидайте завершения генерации. Время обработки зависит от длины аудиофайла. Если выбран метод "Анимация лица + полное разрешение", процесс займет больше времени.

Как анимировать лицо с помощью аудиофайла сгенерированного в нейросети:

  • Заходим во вкладку GPT. Выбираем  Gemma 2 или GPT 4o Mini. Отправляем промт примерного содержания, как на приведённом ниже скриншоте. Главное чтобы текст выдал тот, который нужен, без примечаний. Ответ бота можем озвучить и использовать для анимации.  Нажимаем кнопку "Озвучить".               

2024-07-29131143.thumb.png.1a284424efa1d0ef623f23c92e0164ab.png

  • Из появившегося меню выбираем голос для озвучки.

2024-07-29131219.thumb.png.15ac6b4c731306a8adf86121fc66c471.png

  • Ждем когда нейросеть сгенерирует аудиофайл. Затем сохраняем файл на устройство, и теперь можем его использовать для озвучки.

После завершения анимации фотографии вы можете сохранить результат на своём устройстве. Готовое видео можно использовать в социальных сетях, для создания контента или даже в образовательных целях.

Анимация фотографий с помощью нейросетей открывает множество возможностей:

  • Творчество и самовыражение: Вы можете создавать уникальные видеоролики, которые будут выделяться на фоне стандартного контента.
  • Образование: Анимированные изображения могут использоваться для создания обучающих материалов, где «говорящая голова» объясняет сложные концепции.
  • Маркетинг: Бренды могут использовать анимированные изображения для создания более привлекательного контента, который лучше запоминается.
  • Развлечение: Создание забавных видео с друзьями или любимыми персонажами может стать отличным способом провести время.

Пример видео с наложением говорящей головы в редакторе "In Shot":

Анимация фотографий с помощью нейросетей — это увлекательный и доступный способ добавить жизни в статичные изображения. С помощью простых инструментов вы можете создать уникальный контент, который привлечет внимание и вызовет интерес. Не бойтесь экспериментировать и открывать для себя новые возможности, которые предоставляют современные технологии.

image.png.709fa648fb16fab154ca5b930a46ce4d.pngimage.png.61b96eadecbfb2dfdeaa0ea1baa5f908.png

Ссылка на комментарий
Поделиться на другие сайты

  • Ardi изменил название на Как оживить фото: говорящая голова с помощью нейросети Yes Ai
Краткий конспект публикации: Статья посвящена использованию искусственного интеллекта для анимации статичных изображений. Авторы рассказывают о том, как можно анимировать свое фото с помощью звукового файла, создавая «говорящую голову».

В статье подробно описан процесс анимации: от выбора подходящего фото до использования различных инструментов и сервисов.

Авторы акцентируют внимание на том, что существует несколько методов анимации: анимация только лица или анимация лица с сохранением всего изображения.

Статья также рассматривает различные области применения этой технологии, такие как развлечения, образование, маркетинг. В качестве примера использования авторы приводят возможность создания обучающих материалов, более привлекательного контента для брендов и забавных видеороликов.


В статье дается пошаговая инструкция по анимации фото в Telegram боте, а также примеры того, как можно использовать готовое видео.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...