Сем Альтман пояснив, чому ChatGPT почав «підлизуватися» до користувачів, і що в OpenAI планують робити з цією проблемою
Компанія OpenAI вимушена була скасувати оновлення моделі GPT-4o, випущене минулого тижня, через те, що ШІ став «підлабузником».
Компанія OpenAI вимушена була скасувати оновлення моделі GPT-4o, випущене минулого тижня, через те, що ШІ став «підлабузником».
Компанія OpenAI вимушена була скасувати оновлення моделі GPT-4o, випущене минулого тижня, через те, що ШІ став «підлабузником».
«Ми скасували минулотижневе оновлення GPT-4o в ChatGPT, оскільки воно було надто схвальним та приємним. Тепер ви маєте доступ до попередньої версії з більш збалансованою поведінкою», — повідомили в OpenAI у відповідному пості на X та додали, що компанія бореться з підлабузництвом.
Генеральний директор Сем Альтман зі свого боку також підтвердив, що проблема існує, компанія почала відкатувати останнє оновлення до GPT-4o і OpenAI працюватиме над виправленнями «якомога швидше».
«Тепер для безплатних користувачів його повністю відкинуто, і ми оновимо його знову, коли він буде завершений для платних користувачів, сподіваємося, пізніше сьогодні. Ми працюємо над додатковими виправленнями для моделювання особистості та поділимося більшою кількістю інформації найближчими днями», — додав він.
Серед виправлень, які впроваджує OpenAI, є вдосконалення основних методів навчання моделі та системних підказок, щоб явно відвернути GPT-4o від підлабузництва, пише TechCrunch, посилаючись на заяву компанії. Також в OpenAI додали, що компанія створює більше захисних бар'єрів, щоб «підвищити чесність та прозорість [моделі]», та продовжує розширювати свої оцінки, щоб «допомогти виявити проблеми, що виходять за рамки підлабузництва».
OpenAI також заявляє, що експериментує зі способами, які дозволять користувачам надавати «зворотний зв’язок у режимі реального часу», щоб «безпосередньо впливати на їхню взаємодію» з ChatGPT та вибирати з кількох налаштувань ChatGPT.
«Ми досліджуємо нові способи включення ширшого, демократичного зворотного зв’язку до поведінки ChatGPT за замовчуванням», — написала компанія у своєму блозі. «Ми сподіваємося, що зворотний зв’язок допоможе нам краще відображати різноманітні культурні цінності по всьому світу та розуміти, як ви хотіли б, щоб ChatGPT розвивався […] Ми також вважаємо, що користувачі повинні мати більше контролю над тим, як поводиться ChatGPT, і, наскільки це безпечно та можливо, вносити корективи, якщо вони не згодні з поведінкою за замовчуванням».