💳 Кожен. Повинен. Мати. Trustee Plus: криптогаманець і європейська платіжна картка з лімітом 50к євро 👉

Google виклав у відкритий доступ свій інструмент для нанесення водяних знаків на тексти, згенеровані ШІ

Тепер розробники можуть використовувати інструмент водяних знаків SynthID від Google, щоб виявити, чи були текстові дані отримані від їхніх власних моделей.

Залишити коментар
Google виклав у відкритий доступ свій інструмент для нанесення водяних знаків на тексти, згенеровані ШІ

Тепер розробники можуть використовувати інструмент водяних знаків SynthID від Google, щоб виявити, чи були текстові дані отримані від їхніх власних моделей.

Технологія водяного маркування тексту SynthID від Google — інструмент, який компанія створила, щоб полегшити ідентифікацію тексту, створеного штучним інтелектом, — тепер доступна з відкритим вихідним кодом через Google Responsible Generative AI Toolkit, пише The Verge.

«Тепер інші розробники ШІ зможуть використовувати цю технологію, щоб визначити, чи були текстові результати отримані з їхніх власних [великих мовних моделей], що полегшить більшій кількості розробників відповідально створювати ШІ», — сказав Пушміт Колі, віцепрезидент з досліджень Google DeepMind.

Водяні знаки стають дедалі важливішими інструментами, оскільки великі мовні моделі використовуються для поширення політичної дезінформації, створення контенту сексуального характеру без згоди та для інших зловмисних цілей. У Каліфорнії вже розглядають можливість зробити водяні знаки штучного інтелекту обов’язковими, тоді як уряд Китаю почав вимагати це минулого року. Але інструменти все ще розробляються.

SynthID, анонсований у серпні минулого року, допомагає виявляти результати, згенеровані ШІ, додаючи невидимі водяні знаки до зображень, аудіо, відео та тексту під час їх створення. Google стверджує, що текстова версія SynthID працює, роблячи вивід тексту дещо менш ймовірним таким чином, щоб його можна було виявити програмним забезпеченням, але не людиною.

Як це працює

LLM генерує текст по одному токену за раз. Ці лексеми можуть представляти один символ, слово або частину фрази. Щоб створити послідовність зв’язного тексту, модель прогнозує наступний найбільш імовірний токен для генерації. Ці передбачення ґрунтуються на попередніх словах і балах ймовірності, призначених кожному потенційному маркеру.

Наприклад, фразою «Мої улюблені тропічні фрукти — __». LLM може почати завершувати речення лексемами «манго», «лічі», «папайя» або «дуріан», і кожній лексемі надається оцінка ймовірності. Коли є вибір різних токенів, SynthID може налаштувати оцінку ймовірності кожного прогнозованого токена у випадках, коли це не вплине на якість, точність і креативність результату.

Цей процес повторюється в усьому згенерованому тексті, тому одне речення може містити десять або більше скоригованих оцінок ймовірності, а сторінка може містити сотні. Остаточний шаблон балів для обох вибраних моделлю слів у поєднанні зі скоригованими балами ймовірності вважається водяним знаком.

Google стверджує, що система, яку вона вже інтегрувала у свого чат-бота Gemini, не погіршує якість, точність, креативність або швидкість згенерованого тексту, що вже давно є проблемою для систем водяних знаків. Google заявляє, що може працювати з текстом довжиною до трьох речень, а також з текстом, який було обрізано, перефразовано або змінено. Але йому важко працювати з коротким текстом, переписаним або перекладеним контентом і навіть з відповідями на фактичні запитання.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Штучний інтелект домалював колишній співробітниці Google бюстгальтер. Ось чому це її так обурило
Штучний інтелект домалював колишній співробітниці Google бюстгальтер. Ось чому це її так обурило
По темi
Штучний інтелект домалював колишній співробітниці Google бюстгальтер. Ось чому це її так обурило
Понад 200 шкідливих застосунків у Google Play завантажили 8 млн разів: які найпоширеніші загрози
Понад 200 шкідливих застосунків у Google Play завантажили 8 млн разів: які найпоширеніші загрози
По темi
Понад 200 шкідливих застосунків у Google Play завантажили 8 млн разів: які найпоширеніші загрози
Одна з країн звернулася до Apple та Google з проханням заблокувати Temu. У чому претензії до китайського додатка
Одна з країн звернулася до Apple та Google з проханням заблокувати Temu. У чому претензії до китайського додатка
По темi
Одна з країн звернулася до Apple та Google з проханням заблокувати Temu. У чому претензії до китайського додатка
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Харківська художниця намалювала новий дудл для Google на День Незалежності України
Харківська художниця намалювала новий дудл для Google на День Незалежності України
Харківська художниця намалювала новий дудл для Google на День Незалежності України
Фахівців Google тепер годуватимуть роботи. Вони також уміють давати корисні (і не дуже) поради
Фахівців Google тепер годуватимуть роботи. Вони також уміють давати корисні (і не дуже) поради
Фахівців Google тепер годуватимуть роботи. Вони також уміють давати корисні (і не дуже) поради

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.