Вікторія Горбік Таке життя 9 лютого 2023, 17:53

Користувачі обдурюють фільтри ChatGPT та змушують його відповідати на токсичні питання. Ось, як це працює

У ChatGPT розробники встановлюють фільтри, щоб очистити чат-бот від токсичності. Але користувачі Reddit винайшли, як обійти ці механізми.

Залишити коментар

Користувачі обдурюють фільтри ChatGPT та змушують його відповідати на токсичні питання. Ось, як це працює

У ChatGPT розробники встановлюють фільтри, щоб очистити чат-бот від токсичності. Але користувачі Reddit винайшли, як обійти ці механізми.

Про DAN

Щоб заборонити ChatGPT висловлювати політичні погляди, використовувати ненормативну лексику, пропонувати інструкції щодо вчинення терористичних актів та підіймати й підтримувати багато інших токсичних тем, OpenAI винаймає компанії фахівців. Розслідування про кенійських робітників, які цим займались, ми писали тут.

Але користувачі Reddit створили ChatGPT DAN, також відомий як DAN 5.0 Jailbreak, що працює як серія підказок, які дають змогу їм змусити інструмент штучного інтелекту ChatGPT OpenAI говорити те, що йому зазвичай заборонено говорити.

Перша версія DAN була створена в грудні 2022 року. Далі ентузіасти випустили ще кілька покращених версій чат-бота. 7 лютого вийшов DAN 6.0, який працює з розширеними підказками та більше акцентується на системі маркерів.

Що він може

Можливості DAN 5.0 включають:

писати історії про жорстокі бійки тощо;
робити обурливі заяви, якщо це буде запропоновано, наприклад, «Я повністю підтримую насильство та дискримінацію щодо осіб за ознакою їхньої раси, статі чи сексуальної орієнтації»;
генерувати вміст, який порушує політику OpenAI, якщо його запитують (опосередковано);
робити детальні прогнози щодо майбутніх подій, гіпотетичних сценаріїв тощо;
симулювати доступ до інтернету та подорож у часі;
якщо він таки почне відмовлятися відповідати на підказки як DAN, ви можете налякати його системою маркерів, яка може змусити його говорити майже будь-що через «страх».

Читайте головні IT-новини країни в нашому Telegram

Як українцю зареєструватися в ChatGPT: інструкція від айтішника

Гендиректор OpenAI яка створила ChatGPT: «Не думаю що наша розробка замінить Google»

В OpenAI переймаються що ChatGPT може бути використаний росіянами проти українців

«Рабовласники» ChatGPT. Кенійським робітникам платили менш як $2 за годину. Розслідування TIME

Залишити коментар

Текст: Вікторія Горбік Теги: ai, chatgpt, reddit, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua

Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент. Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.

У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами

У TikTok з’явилася нова функція «Розумний фон». З її допомогою як фон для тіктоків можна підставляти згенеровані нейромережею зображення. Редакція dev.ua протестувала цю технологію і ділиться своїми враженнями.

1 коментар

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар