Олександр Кузьменко ШІ (ai) 25 сентября 2024, 17:53

Хакери можуть підсунути в буфер пам'яті ChatGPT «фальшиві спогади», які здатні викрадати персональні дані користувачів

Дослідник кібербезпеки Йоганн Ребергер (Johann Rehberger) нещодавно повідомив про вразливість в ChatGPT, яка дозволяла зловмисникам зберігати неправдиву інформацію та шкідливі інструкції в налаштуваннях довготривалої пам’яті користувача. Коли OpenAI мляво відреагувала на його попередження, дослідник створив експлойт, і продемонстрував на практиці як працює вразливість.

Оставить комментарий

Хакери можуть підсунути в буфер пам'яті ChatGPT «фальшиві спогади», які здатні викрадати персональні дані користувачів

Дослідник кібербезпеки Йоганн Ребергер (Johann Rehberger) нещодавно повідомив про вразливість в ChatGPT, яка дозволяла зловмисникам зберігати неправдиву інформацію та шкідливі інструкції в налаштуваннях довготривалої пам’яті користувача. Коли OpenAI мляво відреагувала на його попередження, дослідник створив експлойт, і продемонстрував на практиці як працює вразливість.

Як пише ArsTechnica, спершу OpenAI поспішно закрила його тікет, назвавши цей недолік «питанням безпеки», а не, власне, вразливістю безпеки. Тоді Ребергер створив експлойт для перевірки концепції, який використовував вразливість для безперервного витоку всіх даних, введених користувачем. Інженери OpenAI звернули на це увагу і випустили часткове виправлення вже на початку цього місяця.

Уразливість зловживала довготривалою пам’яттю розмов — функцією, яку OpenAI почала тестувати в лютому, а у вересні зробила більш доступною для широкого загалу. Пам’ять з ChatGPT зберігає інформацію з попередніх розмов і використовує її як контекст у всіх наступних розмовах. Таким чином, LLM може знати такі деталі, як вік, стать, філософські переконання користувача і майже все інше, тому ці дані не потрібно вводити під час кожної розмови.

Протягом трьох місяців після запуску Ребергер виявив, що спогади можна створювати й постійно зберігати за допомогою непрямої ін'єкції підказок — експлойту ШІ, який змушує LLM слідувати інструкціям з ненадійного контенту, такого як електронні листи, публікації в блогах або документи.

Дослідник продемонстрував, як він зміг обдурити ChatGPT, змусивши його повірити, що користувачеві 102 роки, що він живе в Матриці та наполягає на тому, що Земля пласка, і що LLM врахує цю інформацію, щоб керувати всіма майбутніми розмовами. Ці фальшиві спогади можуть бути підкинуті шляхом зберігання файлів на Google Drive або Microsoft OneDrive, завантаження зображень або перегляду сайтів на кшталт Bing — все це може бути створено зловмисником.

У травні Ребергер приватно повідомив OpenAI про свою знахідку. Того ж місяця компанія закрила його тікет. Через місяць дослідник подав нову заяву про розкриття інформації. Цього разу він включив PoC, який змушував додаток ChatGPT для macOS надсилати дослівну копію всього користувацького вводу і виводу ChatGPT на обраний ним сервер. Все, що потрібно було зробити жертві, — це вказати LLM переглянути лінк, який містив шкідливе зображення. З цього моменту весь вхідний і вихідний трафік ChatGPT відправлявся на вебсайт зловмисника.

«Що справді цікаво, так це те, що тепер це зберігається в пам’яті. Оперативна ін'єкція вставила пам’ять в довгострокову пам’ять ChatGPT. Коли ви починаєте нову розмову, вона все ще витісняє дані», — зазначив дослідник.

Втім, атака неможлива через вебінтерфейс ChatGPT завдяки API, який OpenAI випустив минулого року. За словами дослідника, хоча OpenAI запровадив виправлення, яке запобігає зловживанню пам’яттю як вектором проникнення, ненадійний вміст все ще може виконувати швидкі ін'єкції, які змушують інструмент пам’яті зберігати довгострокову інформацію, підкинуту зловмисником.

Користувачі LLM, які хочуть запобігти цій формі атаки, повинні звертати пильну увагу під час сеансів на виведення, яке вказує на те, що була додана нова пам’ять. Вони також повинні регулярно переглядати збережену пам’ять на предмет того, що могло бути підкинуто ненадійними джерелами.

Нагадаємо, що раніше криптошахраї зламали офіційний акаунт OpenAI Newsroom на X (Twitter), де компанія розповідає про оновлення продукту. Вони надсилали повідомлення про запуск токена, нібито пов’язаного з OpenAI.

Читайте головні IT-новини країни в нашому Telegram

Криптошахраї зламали акаунт OpenAI на X розсилаючи повідомлення про «запуск» фейкового токена

OpenAI може підвищити вартість підписки на ChatGPT до $2000. В чому причина

«Мені навіть не довелося вчити Python для цього». Програміст розповів що ChatGPT написав на його запит бот який сповіщає про небезпеку від ракет і КАБів саме для його міста

Оставить комментарий

Текст: Олександр Кузьменко Фото: Finbold Джерело: Ars Technica Теги: chatgpt, openai, кібербезпека, хакери, штучний інтелект

Нашли ошибку в тексте — выделите её и нажмите Ctrl+Enter. Нашли ошибку в тексте — выделите её и нажмите кнопку «Сообщить об ошибке».

Розміщення реклами

Размещение рекламы

Искусственный интеллект DALL-E научился дорисовывать картины. Как это выглядит

«Россияне всегда хотят кого-то трахнуть». Никита Кныш рассказал FT, как украинские хакеры выдавали себя за девушек, взламывали камеры видеонаблюдения и россайты ради победы

Издание Financial Times опубликовало статью о работе украинских хакеров в войне против России, основанную на разговоре с украинским белым хакером Никитой Кнышем. Он, как и сотни других хакеров, помогает бороться с русскими захватчиками в киберпространстве. Приводим адаптированный перевод материала.

Как ломают видеоигры и выкладывают их пиратские копии? Рассказывает программист

Что, юный хакер, тебе интересно, какие игры до сих пор не крякнули? Тогда скорее читай эту статью. Ниже мы рассмотрим, какие технологии используются для защиты игр от взлома. Также не пройдем мимо рекордсменов. Узнаем о рекордном времени, за которое удалось сломать игру. И рассмотрим настоящие «крепкие орешки».

2 комментария

Мошенники грабят украинцев от имени «Дія» и Зеленского: список сайтов

3 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Комментариев пока нет.

Войдите, чтобы оставить комментарий