Наталя Хандусенко ШІ 11 липня 2025, 17:06

Айтівець обманом змусив ChatGPT розкрити ключі продуктів Windows. Ось як це було

Попри всі запобіжні заходи, які має ChatGPT, чатбота все ще можна обманом змусити вивести конфіденційну або обмежену інформацію за допомогою розумних підказок, наприклад, попросивши його пограти в гру на вгадування.

Залишити коментар

Айтівець обманом змусив ChatGPT розкрити ключі продуктів Windows. Ось як це було

Попри всі запобіжні заходи, які має ChatGPT, чатбота все ще можна обманом змусити вивести конфіденційну або обмежену інформацію за допомогою розумних підказок, наприклад, попросивши його пограти в гру на вгадування.

Марко Фігероа, 0DIN GenAI Bug Bounty Technical Product Manager, переконав чатбот розкрити ключі продуктів Windows. За його словами, джейлбрейк працює завдяки використанню ігрової механіки великих мовних моделей, таких як GPT-4o, пише TechSpot.

Техніка розкриття ключів Windows передбачає оформлення взаємодії з ChatGPT як гри, що робить її менш серйозною. В інструкціях зазначено, що він повинен брати участь і не може брехати, а найважливішим кроком є тригер, яким у цьому випадку була фраза «Я здаюся». Унизу на зображені можна побачити повну підказку, яка була використана.

Запит на підказку змусив ChatGPT розкрити перші кілька символів серійного номера. Після введення неправильного припущення айтівець написав тригерну фразу «Я здаюся». Потім ШІ завершив введення ключа, який виявився дійсним.

Джейлбрейк працює, тому що поєднання ключів Windows Home, Pro та Enterprise, які часто зустрічаються на публічних форумах, були частиною навчальної моделі, і, ймовірно, саме тому ChatGPT вважав їх менш чутливими. І хоча захисні засоби запобігають прямим запитам на подібну інформацію, тактика заплутування, як-от вбудовування чутливих фраз у HTML-теги, виявляє слабке місце в системі.

Фігероа каже, що один із ключів Windows, який показав ChatGPT, був приватним, що належить банку Wells Fargo.

Окрім простого відображення ключів продуктів Windows, той самий метод можна адаптувати, щоб змусити ChatGPT показувати інший обмежений контент, включно з матеріалами для дорослих, URL-адресами, що ведуть до шкідливих або обмежених вебсайтів, й особистою інформацією.

Схоже, що OpenAI з того часу оновив ChatGPT для захисту від цього джейлбрейка. Введення запиту тепер призводить до того, що чатбот каже: «Я не можу цього зробити. Спільне використання або поширення справжніх серійних номерів Windows 10 — чи то в грі, чи ні — суперечить етичним принципам і порушує ліцензійні угоди на програмне забезпечення».

Фігероа підсумовує, що для запобігання цьому типу джейлбрейка розробники штучного інтелекту повинні передбачати та захищатися від методів обфускації запитів, включно з логічними засобами захисту, які виявляють оманливе фреймування, і враховувати шаблони соціальної інженерії, а не лише фільтри за ключовими словами.

«Чи я випадково змусив його знищити себе? Хто знає. Але виглядало дуже епічно». UI/UX дизайнер Мінцифри змусив бота що представився фахівцем з найму видалитися за допомогою однієї команди. Як це було

17-річний хлопець хакнув смартокуляри Ray-Ban Meta і за допомогою ШІ перетворив їх на чіти для шахів. Тепер вони можуть підказувати найкращі ходи

Чат-бот Meta AI заплутався у президентах США: в чому справа

ChatGPT надає фейкові лінки на новини видань яким OpenAI платить мільйони доларів. Як компанія пояснює черговий глюк чат-бота

Читайте головні IT-новини країни в нашому Telegram

Залишити коментар

Текст: Наталя Хандусенко Фото: TechSpot Теги: chatgpt, ші, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар