Вікторія Горбік ШІ 30 квітня 2025, 09:20

Сем Альтман пояснив, чому ChatGPT почав «підлизуватися» до користувачів, і що в OpenAI планують робити з цією проблемою

Компанія OpenAI вимушена була скасувати оновлення моделі GPT-4o, випущене минулого тижня, через те, що ШІ став «підлабузником».

Залишити коментар

Сем Альтман пояснив, чому ChatGPT почав «підлизуватися» до користувачів, і що в OpenAI планують робити з цією проблемою

Компанія OpenAI вимушена була скасувати оновлення моделі GPT-4o, випущене минулого тижня, через те, що ШІ став «підлабузником».

«Ми скасували минулотижневе оновлення GPT-4o в ChatGPT, оскільки воно було надто схвальним та приємним. Тепер ви маєте доступ до попередньої версії з більш збалансованою поведінкою», — повідомили в OpenAI у відповідному пості на X та додали, що компанія бореться з підлабузництвом.

Генеральний директор Сем Альтман зі свого боку також підтвердив, що проблема існує, компанія почала відкатувати останнє оновлення до GPT-4o і OpenAI працюватиме над виправленнями «якомога швидше».

«Тепер для безплатних користувачів його повністю відкинуто, і ми оновимо його знову, коли він буде завершений для платних користувачів, сподіваємося, пізніше сьогодні. Ми працюємо над додатковими виправленнями для моделювання особистості та поділимося більшою кількістю інформації найближчими днями», — додав він.

Серед виправлень, які впроваджує OpenAI, є вдосконалення основних методів навчання моделі та системних підказок, щоб явно відвернути GPT-4o від підлабузництва, пише TechCrunch, посилаючись на заяву компанії. Також в OpenAI додали, що компанія створює більше захисних бар'єрів, щоб «підвищити чесність та прозорість [моделі]», та продовжує розширювати свої оцінки, щоб «допомогти виявити проблеми, що виходять за рамки підлабузництва».

OpenAI також заявляє, що експериментує зі способами, які дозволять користувачам надавати «зворотний зв’язок у режимі реального часу», щоб «безпосередньо впливати на їхню взаємодію» з ChatGPT та вибирати з кількох налаштувань ChatGPT.

«Ми досліджуємо нові способи включення ширшого, демократичного зворотного зв’язку до поведінки ChatGPT за замовчуванням», — написала компанія у своєму блозі. «Ми сподіваємося, що зворотний зв’язок допоможе нам краще відображати різноманітні культурні цінності по всьому світу та розуміти, як ви хотіли б, щоб ChatGPT розвивався […] Ми також вважаємо, що користувачі повинні мати більше контролю над тим, як поводиться ChatGPT, і, наскільки це безпечно та можливо, вносити корективи, якщо вони не згодні з поведінкою за замовчуванням».

Читайте головні IT-новини країни в нашому Telegram

OpenAI додала функцію покупок до вебпошуку в ChatGPT

OpenAI терміново пофіксила баг ChatGPT який дозволяв підліткам генерувати еротичний контент

OpenAI запустила нові ШІ-моделі міркувань: o3 й o4-mini можуть генерувати відповіді за допомогою інструментів у ChatGPT таких як перегляд вебсторінок написання коду на Python та обробка зображень

Залишити коментар

Текст: Вікторія Горбік Фото: unsplash Теги: chatgpt, openai, сем альтман, ші, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар