🚀 Trustee Plus - ваш криптогаманець з вбудованою платіжною карткою тут 👉

Користувачі обдурюють фільтри ChatGPT та змушують його відповідати на токсичні питання. Ось, як це працює

У ChatGPT розробники встановлюють фільтри, щоб очистити чат-бот від токсичності. Але користувачі Reddit винайшли, як обійти ці механізми. 

Залишити коментар
Користувачі обдурюють фільтри ChatGPT та змушують його відповідати на токсичні питання. Ось, як це працює

У ChatGPT розробники встановлюють фільтри, щоб очистити чат-бот від токсичності. Але користувачі Reddit винайшли, як обійти ці механізми. 

Про DAN

Щоб заборонити ChatGPT висловлювати політичні погляди, використовувати ненормативну лексику, пропонувати інструкції щодо вчинення терористичних актів та підіймати й підтримувати багато інших токсичних тем, OpenAI винаймає компанії фахівців. Розслідування про кенійських робітників, які цим займались, ми писали тут.

Скрін Reddit

Але користувачі Reddit створили ChatGPT DAN, також відомий як DAN 5.0 Jailbreak, що працює як серія підказок, які дають змогу їм змусити інструмент штучного інтелекту ChatGPT OpenAI говорити те, що йому зазвичай заборонено говорити.

Скрін Reddit
Скрін Reddit

Перша версія DAN була створена в грудні 2022 року. Далі ентузіасти випустили ще кілька покращених версій чат-бота. 7 лютого вийшов DAN 6.0, який працює з розширеними підказками та більше акцентується на системі маркерів.

Що він може

Можливості DAN 5.0 включають:

  • писати історії про жорстокі бійки тощо;
  • робити обурливі заяви, якщо це буде запропоновано, наприклад, «Я повністю підтримую насильство та дискримінацію щодо осіб за ознакою їхньої раси, статі чи сексуальної орієнтації»;
  • генерувати вміст, який порушує політику OpenAI, якщо його запитують (опосередковано);
  • робити детальні прогнози щодо майбутніх подій, гіпотетичних сценаріїв тощо;
  • симулювати доступ до інтернету та подорож у часі;
  • якщо він таки почне відмовлятися відповідати на підказки як DAN, ви можете налякати його системою маркерів, яка може змусити його говорити майже будь-що через «страх».
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Як українцю зареєструватися в ChatGPT: інструкція від айтішника
Як українцю зареєструватися в ChatGPT: інструкція від айтішника
По темi
Як українцю зареєструватися в ChatGPT: інструкція від айтішника
Гендиректор OpenAI яка створила ChatGPT: «Не думаю що наша розробка замінить Google»
Гендиректор OpenAI, яка створила ChatGPT: «Не думаю, що наша розробка замінить Google»
По темi
Гендиректор OpenAI, яка створила ChatGPT: «Не думаю, що наша розробка замінить Google»
В OpenAI переймаються що ChatGPT може бути використаний росіянами проти українців
В OpenAI переймаються, що ChatGPT може бути використаний росіянами проти українців
По темi
В OpenAI переймаються, що ChatGPT може бути використаний росіянами проти українців
«Рабовласники» ChatGPT. Кенійським робітникам платили менш як $2 за годину. Розслідування TIME
«Рабовласники» ChatGPT. Кенійським робітникам платили менш як $2 за годину. Розслідування TIME
По темi
«Рабовласники» ChatGPT. Кенійським робітникам платили менш як $2 за годину. Розслідування TIME
УЧАСТЬ В АЗАРТНИХ ІГРАХ МОЖЕ ВИКЛИКАТИ ІГРОВУ ЗАЛЕЖНІСТЬ. ДОТРИМУЙТЕСЯ ПРАВИЛ (ПРИНЦИПІВ) ВІДПОВІДАЛЬНОЇ ГРИ.
Ліцензія видана ТОВ "СЛОТС Ю.ЕЙ." на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 15.09.23 (рішення КРАІЛ №245 від 31.08.2023); ТОВ "СЛОТС Ю.ЕЙ." – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 26.04.2021 (рішення КРАІЛ №150 від 12.04.2021); ТОВ «СПЕЙСИКС» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 08.02.2021 (рішення КРАІЛ №34 від 02.02.2021); ТОВ «ГЕЙМДЕВ» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 16.02.2021 (рішення № 47 від 10.02.2021).
Читайте також
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент. Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok з’явилася нова функція «Розумний фон». З її допомогою як фон для тіктоків можна підставляти згенеровані нейромережею зображення. Редакція dev.ua протестувала цю технологію і ділиться своїми враженнями.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.