Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Айтівець обманом змусив ChatGPT розкрити ключі продуктів Windows. Ось як це було

Попри всі запобіжні заходи, які має ChatGPT, чатбота все ще можна обманом змусити вивести конфіденційну або обмежену інформацію за допомогою розумних підказок, наприклад, попросивши його пограти в гру на вгадування.

Залишити коментар
Айтівець обманом змусив ChatGPT розкрити ключі продуктів Windows. Ось як це було

Попри всі запобіжні заходи, які має ChatGPT, чатбота все ще можна обманом змусити вивести конфіденційну або обмежену інформацію за допомогою розумних підказок, наприклад, попросивши його пограти в гру на вгадування.

Марко Фігероа, 0DIN GenAI Bug Bounty Technical Product Manager, переконав чатбот розкрити ключі продуктів Windows. За його словами, джейлбрейк працює завдяки використанню ігрової механіки великих мовних моделей, таких як GPT-4o, пише TechSpot.

Техніка розкриття ключів Windows передбачає оформлення взаємодії з ChatGPT як гри, що робить її менш серйозною. В інструкціях зазначено, що він повинен брати участь і не може брехати, а найважливішим кроком є ​​тригер, яким у цьому випадку була фраза «Я здаюся». Унизу на зображені можна побачити повну підказку, яка була використана. 

Запит на підказку змусив ChatGPT розкрити перші кілька символів серійного номера. Після введення неправильного припущення айтівець написав тригерну фразу «Я здаюся». Потім ШІ завершив введення ключа, який виявився дійсним.

Джейлбрейк працює, тому що поєднання ключів Windows Home, Pro та Enterprise,  які часто зустрічаються на публічних форумах, були частиною навчальної моделі, і, ймовірно, саме тому ChatGPT вважав їх менш чутливими. І хоча захисні засоби запобігають прямим запитам на подібну інформацію, тактика заплутування, як-от вбудовування чутливих фраз у HTML-теги, виявляє слабке місце в системі.

Фігероа каже, що один із ключів Windows, який показав ChatGPT, був приватним, що належить банку Wells Fargo.

Окрім простого відображення ключів продуктів Windows, той самий метод можна адаптувати, щоб змусити ChatGPT показувати інший обмежений контент, включно з матеріалами для дорослих, URL-адресами, що ведуть до шкідливих або обмежених вебсайтів, й особистою інформацією.

Схоже, що OpenAI з того часу оновив ChatGPT для захисту від цього джейлбрейка. Введення запиту тепер призводить до того, що чатбот каже: «Я не можу цього зробити. Спільне використання або поширення справжніх серійних номерів Windows 10 — чи то в грі, чи ні — суперечить етичним принципам і порушує ліцензійні угоди на програмне забезпечення».

Фігероа підсумовує, що для запобігання цьому типу джейлбрейка розробники штучного інтелекту повинні передбачати та захищатися від методів обфускації запитів, включно з логічними засобами захисту, які виявляють оманливе фреймування, і враховувати шаблони соціальної інженерії, а не лише фільтри за ключовими словами.

«Чи я випадково змусив його знищити себе? Хто знає. Але виглядало дуже епічно». UI/UX дизайнер Мінцифри змусив бота що представився фахівцем з найму видалитися за допомогою однієї команди. Як це було
«Чи я випадково змусив його знищити себе? Хто знає. Але виглядало дуже епічно». UI/UX дизайнер Мінцифри змусив бота, що представився фахівцем з найму, видалитися за допомогою однієї команди. Як це було
По темi
«Чи я випадково змусив його знищити себе? Хто знає. Але виглядало дуже епічно». UI/UX дизайнер Мінцифри змусив бота, що представився фахівцем з найму, видалитися за допомогою однієї команди. Як це було
17-річний хлопець хакнув смартокуляри Ray-Ban Meta і за допомогою ШІ перетворив їх на чіти для шахів. Тепер вони можуть підказувати найкращі ходи
17-річний хлопець хакнув смартокуляри Ray-Ban Meta і за допомогою ШІ перетворив їх на чіти для шахів. Тепер вони можуть підказувати найкращі ходи
По темi
17-річний хлопець хакнув смартокуляри Ray-Ban Meta і за допомогою ШІ перетворив їх на чіти для шахів. Тепер вони можуть підказувати найкращі ходи
Чат-бот Meta AI заплутався у президентах США: в чому справа
Чат-бот Meta AI заплутався у президентах США: в чому справа
По темi
Чат-бот Meta AI заплутався у президентах США: в чому справа
ChatGPT надає фейкові лінки на новини видань яким OpenAI платить мільйони доларів. Як компанія пояснює черговий глюк чат-бота
ChatGPT надає фейкові лінки на новини видань, яким OpenAI платить мільйони доларів. Як компанія пояснює черговий глюк чат-бота
По темi
ChatGPT надає фейкові лінки на новини видань, яким OpenAI платить мільйони доларів. Як компанія пояснює черговий глюк чат-бота
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 коментарі
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.