💳 Кожен. Повинен. Мати. Trustee Plus: криптогаманець і європейська платіжна картка з лімітом 50к євро 👉
Наталя ХандусенкоШІ
24 жовтня 2024, 18:47
2024-10-24
Google виклав у відкритий доступ свій інструмент для нанесення водяних знаків на тексти, згенеровані ШІ
Тепер розробники можуть використовувати інструмент водяних знаків SynthID від Google, щоб виявити, чи були текстові дані отримані від їхніх власних моделей.
Технологія водяного маркування тексту SynthID від Google — інструмент, який компанія створила, щоб полегшити ідентифікацію тексту, створеного штучним інтелектом, — тепер доступна з відкритим вихідним кодом через Google Responsible Generative AI Toolkit, пише The Verge.
«Тепер інші розробники ШІ зможуть використовувати цю технологію, щоб визначити, чи були текстові результати отримані з їхніх власних [великих мовних моделей], що полегшить більшій кількості розробників відповідально створювати ШІ», — сказав Пушміт Колі, віцепрезидент з досліджень Google DeepMind.
Водяні знаки стають дедалі важливішими інструментами, оскільки великі мовні моделі використовуються для поширення політичної дезінформації, створення контенту сексуального характеру без згоди та для інших зловмисних цілей. У Каліфорнії вже розглядають можливість зробити водяні знаки штучного інтелекту обов’язковими, тоді як уряд Китаю почав вимагати це минулого року. Але інструменти все ще розробляються.
SynthID, анонсований у серпні минулого року, допомагає виявляти результати, згенеровані ШІ, додаючи невидимі водяні знаки до зображень, аудіо, відео та тексту під час їх створення. Google стверджує, що текстова версія SynthID працює, роблячи вивід тексту дещо менш ймовірним таким чином, щоб його можна було виявити програмним забезпеченням, але не людиною.
Як це працює
LLM генерує текст по одному токену за раз. Ці лексеми можуть представляти один символ, слово або частину фрази. Щоб створити послідовність зв’язного тексту, модель прогнозує наступний найбільш імовірний токен для генерації. Ці передбачення ґрунтуються на попередніх словах і балах ймовірності, призначених кожному потенційному маркеру.
Наприклад, фразою «Мої улюблені тропічні фрукти — __». LLM може почати завершувати речення лексемами «манго», «лічі», «папайя» або «дуріан», і кожній лексемі надається оцінка ймовірності. Коли є вибір різних токенів, SynthID може налаштувати оцінку ймовірності кожного прогнозованого токена у випадках, коли це не вплине на якість, точність і креативність результату.
Цей процес повторюється в усьому згенерованому тексті, тому одне речення може містити десять або більше скоригованих оцінок ймовірності, а сторінка може містити сотні. Остаточний шаблон балів для обох вибраних моделлю слів у поєднанні зі скоригованими балами ймовірності вважається водяним знаком.
Google стверджує, що система, яку вона вже інтегрувала у свого чат-бота Gemini, не погіршує якість, точність, креативність або швидкість згенерованого тексту, що вже давно є проблемою для систем водяних знаків. Google заявляє, що може працювати з текстом довжиною до трьох речень, а також з текстом, який було обрізано, перефразовано або змінено. Але йому важко працювати з коротким текстом, переписаним або перекладеним контентом і навіть з відповідями на фактичні запитання.