ChatGPT научился «видеть», «слышать» и «говорить». OpenAI анонсировала новые возможности своего чат-бота

Компания OpenAI объявила о развертывании новых возможностей своего популярного чата с искусственным интеллектом ChatGPT. Они предлагают новые виды взаимодействия с ИИ, и позволят пользователям вести голосовой разговор или показывать чаботу, о чем идет речь.

Оставить комментарий
ChatGPT научился «видеть», «слышать» и «говорить». OpenAI анонсировала новые возможности своего чат-бота

Компания OpenAI объявила о развертывании новых возможностей своего популярного чата с искусственным интеллектом ChatGPT. Они предлагают новые виды взаимодействия с ИИ, и позволят пользователям вести голосовой разговор или показывать чаботу, о чем идет речь.

Об этом OpenAI рассказала в своем блоге. Обновление с голосом и изображением в ChatGPT появится в течение следующих двух недель для пользователей тарифных планов Plus и Enterprise. Поддержка голоса появится на iOS и Android (ее нужно включить в настройках), а изображения будут доступны на всех платформах.

Голос в ChatGPT

С этим обновлением ChatGPT научится слушать и говорить с пользователем. По словам компании, эта функция позволит говорить с чатом на ходу, попросить его рассказать сказку на ночь для детей или быстро решить незначительный спор вокруг какого-то факта.

Голосовая функция основана на новой модели преобразования текста в речи, которая способна генерировать звучание, подобно человеческому, только из текста и нескольких секунд образца речи.

Мы сотрудничали с профессиональными актерами, чтобы создать каждый голос. Мы также используем Whisper, нашу систему распознавания языка с открытым исходным кодом, чтобы превратить ваши произнесенные слова в текст», — говорится в блоге OpenAI

В блоге есть возможность протестировать несколько вариантов голоса — 2 женских и 3 мужских. Они могут зачитать тестовые образцы истории, рецепта, речи, поэмы или пояснения.

Компания также опубликовала пример работы этой функции, где ChatGPT рассказывает сказку о еже Ларри и отвечает на вопросы пользователя о персонаже. Кстати, этот еж помогал иллюстрировать возможности новой версии генератора изображений от OpenAI — DALL-E 3.

Как начать использовать голос в ChatGPT

Чтобы начать пользоваться голосом, нужно перейти в Настройки → Новые функции в мобильном приложении и выбрать голосовую связь. Затем нужно коснуться кнопки наушников, расположенной в верхнем правом углу главного экрана, и выбрать голос по вкусу.

Изображение в ChatGPT

Чат-бот научится не только слушать, но и видеть — пользователь сможет показать ему одно или несколько изображений и задать связанный с ними вопрос или задание.

«Узнайте, почему не включается гриль, изучите содержимое холодильника, чтобы спланировать ужин, или проанализируйте сложный график для получения данных, связанных с работой. Чтобы сосредоточиться на определенной части изображения, вы можете использовать инструмент рисования в нашем мобильном приложении», — описываются возможные применения этой функции

В приведенном компанией примере пользователь поднимает с помощью ИИ сиденье на велосипеде. ChatGPT дает инструкцию, определяет тип крепления сиденья и указывает пользователю, что он имеет соответствующий инструмент в своем наборе.

Как начать использовать изображение в ChatGPT

Нужно нажать на кнопку «Фото», чтобы сделать снимок или выбрать изображение. На iOS или Android, сначала нужно коснуться кнопки «+».

С ChatGPT можно будет обсудить несколько изображений одновременно или использовать инструмент для рисования, чтобы указать, что именно интересует на изображении.

Обработка изображений поддерживается версиями GPT-3.5 и GPT-4.

Комментарий OpenAI о запуске новых функций

В компании понимают, что голос и изображения могут использоваться для злоупотреблений. В частности, поэтому в OpenAI используют голос только для одной цели — голосового чата. Подчеркивается, что голосовой чат создан с помощью голосовых актеров, с которыми компания непосредственно работала.

«Мы также сотрудничаем с другими подобным образом. Например, Spotify использует возможности этой технологии для пилотного запуска функции голосового перевода, которая помогает подкастерам расширить аудиторию их историй, переводя подкасты на дополнительные языки голосами самих подкастеров», — говорится в блоге

Функция распознавания изображений ChatGPT призвана помочь пользователям в повседневной жизни. «Лучше всего он делает это, когда видит то, что видите вы», — считают в OpenAI. Этот подход основывается на сотрудничестве компании с бесплатным мобильным приложением Be My Eyes, которое помогает слепым и слабовидящим людям.

Компания утверждает, что приняла технические меры, чтобы значительно ограничить способность ChatGPT анализировать и делать прямые заявления о людях, поскольку «ChatGPT не всегда точен», а ИИ должен «уважать конфиденциальность людей».

Читайте главные IT-новости страны в нашем Telegram
Читайте главные IT-новости страны в нашем Telegram
По теме
Читайте главные IT-новости страны в нашем Telegram
За лето трафик ChatGPT ощутимо снизился – до 10%. Но с началом учебного года надеются на улучшение
За лето трафик ChatGPT ощутимо снизился — до 10%. Но с началом учебного года надеются на улучшение
По теме
За лето трафик ChatGPT ощутимо снизился — до 10%. Но с началом учебного года надеются на улучшение
Джордж Мартин и другие писатели подали в суд на разработчиков ChatGPT. В иске Мартина фигурирует разработчик, который «написал» продолжение его книг с помощью ИИ
Джордж Мартин и другие писатели подали в суд на разработчиков ChatGPT. В иске Мартина фигурирует разработчик, «написавший» продолжение его книг с помощью ИИ
По теме
Джордж Мартин и другие писатели подали в суд на разработчиков ChatGPT. В иске Мартина фигурирует разработчик, «написавший» продолжение его книг с помощью ИИ
В ChatGPT добавили плагин графического дизайна Canva. Как с его помощью легко создать баннер лого или презентацию
В ChatGPT добавили плагин графического дизайна Canva. Как с его помощью легко создать баннер, лого или презентацию
По теме
В ChatGPT добавили плагин графического дизайна Canva. Как с его помощью легко создать баннер, лого или презентацию
Для обработки всего 5 запросов ChatGPT может выпить почти 500 мл воды. Сложность запроса на «жадность» не влияет
Для обработки всего 5 запросов ChatGPT может выпить почти 500 мл воды. Сложность запроса на «жадность» не влияет
По теме
Для обработки всего 5 запросов ChatGPT может выпить почти 500 мл воды. Сложность запроса на «жадность» не влияет
Історії айтівців, які повертаються до життя після ЗСУ, в новому відео-проєкті «З фронту в IT»

Владислав Ящук, Senior Backend Engineer: IT — Бахмут — IT.

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментариев пока нет.