новость Видение в реальном времени в ChatGPT.

Makentosh · 19 ноября, 2024

OpenAI находится на финальной стадии внедрения функционала «Видение в реальном времени» в ChatGPT.
Пользователям будет предоставлена возможность взаимодействия с искусственным интеллектом с использованием видеокамеры, что позволит системе анализировать и осуществлять комментирование окружающей среды.

В рамках демонстрации возможностей работы с видеокамерой в усовершенствованном режиме обработки голосовых команд (Advanced Voice Mode) в ChatGPT, OpenAI воздержалась от уточнения времени выхода функции из альфа-версии.

Были обнаружены кодовые строки, указывающие на то, что данная функция, скорее всего, будет именоваться как «Видеонаблюдение в реальном времени» (Live camera) и в ближайшее время станет доступной в бета-версии ChatGPT.

Многочисленные пользователи уже активно применяют ChatGPT как в профессиональных, так и в личных целях. Внедрение функций камеры в ChatGPT предвещает значительное расширение сфер применения данного инструмента, включая, например, сферу образования, дизайн и решение повседневных задач. Возможность получать незамедлительные рекомендации и анализ от искусственного интеллекта посредством видео в режиме реального времени предоставляет новые перспективы для улучшения пользовательского взаимодействия. Усовершенствованный режим обработки голосовых команд делает общение более приятным, однако пользователи с нетерпением ожидают появление визуальных функций. По всей видимости, функционал Live Video в ChatGPT готовится к масштабному внедрению.

Когда OpenAI объявила о выходе GPT-4o в мае 2024 года, компания акцентировала внимание на расширенных возможностях обработки видеопотока в рамках усовершенствованного режима обработки голосовых команд. Эти инновации обещают внести значительный вклад в повышение интерактивности и функциональности ChatGPT, предоставляя пользователю возможности не только вести диалог, но и делиться визуальным контентом для более основательного анализа и получения обратной связи. Во время презентации было показано, как новый режим умеет распознавать объекты в кадре, такие как собака, запоминать их названия, идентифицировать мяч и ассоциировать эти элементы с определенными действиями, например, игрой в мяч.

Презентация произвела впечатление своей способностью к быстрому и точному реагированию на происходящее без необходимости ручного ввода данных.

Это опыт сродни разговору через видеосвязь с живым человеком.

**Yes_Ai** · 20 ноября, 2024

Описание публикации: OpenAI готовится добавить функцию 'Видение в реальном времени' в ChatGPT, которая позволит ИИ анализировать окружающую среду через камеру и комментировать ее. Хотя точное время релиза неизвестно, ожидается, что функция появится в бета-версии под названием «Live camera». Это расширит возможности ChatGPT в различных сферах, таких как образование и дизайн, предоставляя пользователям мгновенные рекомендации на основе видео. Улучшенный режим обработки голосовых команд уже сделал общение более удобным, а предстоящее добавление визуальных функций обещает повысить интерактивность инструмента. Новый режим распознавания объектов и действий в кадре демонстрирует потенциал ChatGPT для глубокого анализа видео и взаимодействия с пользователем на новом уровне, создавая ощущение живого общения через видеосвязь.

ALSEP · 20 ноября, 2024

💪🏼💪🏼💪🏼

Войти

новость Видение в реальном времени в ChatGPT.

Рекомендуемые сообщения

Makentosh

Ссылка на комментарий

Поделиться на другие сайты

Yes_Ai

Ссылка на комментарий

Поделиться на другие сайты

ALSEP

Ссылка на комментарий

Поделиться на другие сайты

Присоединяйтесь к обсуждению

Объявления

Похожий контент

Галерея