💳 Кожен. Повинен. Мати. Trustee Plus: криптогаманець і європейська платіжна картка з лімітом 50к євро 👉

Microsoft запускає нові функції для виявлення підозрілих вхідних даних у чат-ботах і блокування їх у режимі реального часу

Нові функції безпеки вбудовуються в платформу для розробки Azure AI Studio.

Залишити коментар
Microsoft запускає нові функції для виявлення підозрілих вхідних даних у чат-ботах і блокування їх у режимі реального часу

Нові функції безпеки вбудовуються в платформу для розробки Azure AI Studio.

Інструменти містять «prompt shields», які призначені для виявлення і блокування навмисних спроб — також відомих як атаки з використанням підказок або джейлбрейки, що змушують модель ШІ поводитися непередбачуваним чином.

Microsoft також бореться з «indirect prompt injections», коли хакери вставляють шкідливі інструкції в дані, на яких навчається модель, і змушують її виконувати такі незаконні дії, як крадіжка інформації про користувача або захоплення системи, пише Bloomberg.

Крім того, впроваджують функцію, яка попереджає користувачів, коли модель щось вигадує або генерує помилкові відповіді.

Компанія прагне підвищити довіру до своїх генеративних інструментів штучного інтелекту, якими зараз користуються як споживачі, так і корпоративні клієнти. У лютому компанія розслідувала інциденти, пов’язані з чат-ботом Copilot, який генерував дивні та шкідливі відповіді. Після аналізу інцидентів Microsoft заявила, що користувачі навмисно намагалися обдурити Copilot, щоб змусити його генерувати такі відповіді.

Нагадуємо, що Microsoft уперше за 30 років змінила клавіатуру Windows, додавши на неї клавішу Copilot.

Про те, як можна обманути чат-бот, dev.ua писав раніше: дослідники декількох американських університетів знайшли спосіб, як обійти обмеження ШІ-моделей за допомогою техніки під назвою ArtPrompt.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Конкуренція загострюється — Claude 3 вперше обійшов GPT-4 в рейтингу можливостей ШІ
Конкуренція загострюється — Claude 3 вперше обійшов GPT-4 в рейтингу можливостей ШІ
По темi
Конкуренція загострюється — Claude 3 вперше обійшов GPT-4 в рейтингу можливостей ШІ
Як створити власного ШІ-помічника без жодного програмування в Copilot або ChatGPT
Як створити власного ШІ-помічника без жодного програмування в Copilot або ChatGPT
По темi
Як створити власного ШІ-помічника без жодного програмування в Copilot або ChatGPT
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Call of Duty не зникне з PlayStation раптово. Sony отримала таку гарантію під Microsoft, яка купує розробника гри – Activision Blizzard
Call of Duty не зникне з PlayStation раптово. Sony отримала таку гарантію під Microsoft, яка купує розробника гри – Activision Blizzard
Call of Duty не зникне з PlayStation раптово. Sony отримала таку гарантію під Microsoft, яка купує розробника гри – Activision Blizzard
У Microsoft визнали, що PS4 продаються у два рази краще, ніж Xbox
У Microsoft визнали, що PS4 продаються у два рази краще, ніж Xbox
У Microsoft визнали, що PS4 продаються у два рази краще, ніж Xbox
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.