Перейти к содержанию

Рекомендуемые сообщения

OpenAI находится на финальной стадии внедрения функционала «Видение в реальном времени» в ChatGPT.
Пользователям будет предоставлена возможность взаимодействия с искусственным интеллектом с использованием видеокамеры, что позволит системе анализировать и осуществлять комментирование окружающей среды.

image.thumb.png.36e62b83e31660593eec1a2712062640.png

В рамках демонстрации возможностей работы с видеокамерой в усовершенствованном режиме обработки голосовых команд (Advanced Voice Mode) в ChatGPT, OpenAI воздержалась от уточнения времени выхода функции из альфа-версии.

Были обнаружены кодовые строки, указывающие на то, что данная функция, скорее всего, будет именоваться как «Видеонаблюдение в реальном времени» (Live camera) и в ближайшее время станет доступной в бета-версии ChatGPT.

Многочисленные пользователи уже активно применяют ChatGPT как в профессиональных, так и в личных целях. Внедрение функций камеры в ChatGPT предвещает значительное расширение сфер применения данного инструмента, включая, например, сферу образования, дизайн и решение повседневных задач. Возможность получать незамедлительные рекомендации и анализ от искусственного интеллекта посредством видео в режиме реального времени предоставляет новые перспективы для улучшения пользовательского взаимодействия. Усовершенствованный режим обработки голосовых команд делает общение более приятным, однако пользователи с нетерпением ожидают появление визуальных функций. По всей видимости, функционал Live Video в ChatGPT готовится к масштабному внедрению.

Когда OpenAI объявила о выходе GPT-4o в мае 2024 года, компания акцентировала внимание на расширенных возможностях обработки видеопотока в рамках усовершенствованного режима обработки голосовых команд. Эти инновации обещают внести значительный вклад в повышение интерактивности и функциональности ChatGPT, предоставляя пользователю возможности не только вести диалог, но и делиться визуальным контентом для более основательного анализа и получения обратной связи. Во время презентации было показано, как новый режим умеет распознавать объекты в кадре, такие как собака, запоминать их названия, идентифицировать мяч и ассоциировать эти элементы с определенными действиями, например, игрой в мяч.

Презентация произвела впечатление своей способностью к быстрому и точному реагированию на происходящее без необходимости ручного ввода данных.

Это опыт сродни разговору через видеосвязь с живым человеком.

image.webp.e545ef84345e07da6a606d88c52f7061.webp

Ссылка на комментарий
Поделиться на другие сайты

Описание публикации: OpenAI готовится добавить функцию 'Видение в реальном времени' в ChatGPT, которая позволит ИИ анализировать окружающую среду через камеру и комментировать ее. Хотя точное время релиза неизвестно, ожидается, что функция появится в бета-версии под названием «Live camera». Это расширит возможности ChatGPT в различных сферах, таких как образование и дизайн, предоставляя пользователям мгновенные рекомендации на основе видео. Улучшенный режим обработки голосовых команд уже сделал общение более удобным, а предстоящее добавление визуальных функций обещает повысить интерактивность инструмента. Новый режим распознавания объектов и действий в кадре демонстрирует потенциал ChatGPT для глубокого анализа видео и взаимодействия с пользователем на новом уровне, создавая ощущение живого общения через видеосвязь.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...