Наталя Хандусенко ШІ 28 березня 2024, 16:09

Microsoft запускає нові функції для виявлення підозрілих вхідних даних у чат-ботах і блокування їх у режимі реального часу

Нові функції безпеки вбудовуються в платформу для розробки Azure AI Studio.

Інструменти містять «prompt shields», які призначені для виявлення і блокування навмисних спроб — також відомих як атаки з використанням підказок або джейлбрейки, що змушують модель ШІ поводитися непередбачуваним чином.

Microsoft також бореться з «indirect prompt injections», коли хакери вставляють шкідливі інструкції в дані, на яких навчається модель, і змушують її виконувати такі незаконні дії, як крадіжка інформації про користувача або захоплення системи, пише Bloomberg.

Крім того, впроваджують функцію, яка попереджає користувачів, коли модель щось вигадує або генерує помилкові відповіді.

Компанія прагне підвищити довіру до своїх генеративних інструментів штучного інтелекту, якими зараз користуються як споживачі, так і корпоративні клієнти. У лютому компанія розслідувала інциденти, пов’язані з чат-ботом Copilot, який генерував дивні та шкідливі відповіді. Після аналізу інцидентів Microsoft заявила, що користувачі навмисно намагалися обдурити Copilot, щоб змусити його генерувати такі відповіді.

Нагадуємо, що Microsoft уперше за 30 років змінила клавіатуру Windows, додавши на неї клавішу Copilot.

Про те, як можна обманути чат-бот, dev.ua писав раніше: дослідники декількох американських університетів знайшли спосіб, як обійти обмеження ШІ-моделей за допомогою техніки під назвою ArtPrompt.

Читайте головні IT-новини країни в нашому Telegram

Конкуренція загострюється — Claude 3 вперше обійшов GPT-4 в рейтингу можливостей ШІ

Як створити власного ШІ-помічника без жодного програмування в Copilot або ChatGPT

Залишити коментар

Текст: Наталя Хандусенко Теги: azure ai studio, microsoft, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

УЧАСТЬ В АЗАРТНИХ ІГРАХ МОЖЕ ВИКЛИКАТИ ІГРОВУ ЗАЛЕЖНІСТЬ. ДОТРИМУЙТЕСЯ ПРАВИЛ (ПРИНЦИПІВ) ВІДПОВІДАЛЬНОЇ ГРИ.

Ліцензія видана ТОВ "СЛОТС Ю.ЕЙ." на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 15.09.23 (рішення КРАІЛ №245 від 31.08.2023); ТОВ "СЛОТС Ю.ЕЙ." – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 26.04.2021 (рішення КРАІЛ №150 від 12.04.2021); ТОВ «СПЕЙСИКС» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 08.02.2021 (рішення КРАІЛ №34 від 02.02.2021); ТОВ «ГЕЙМДЕВ» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 16.02.2021 (рішення № 47 від 10.02.2021).

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Call of Duty не зникне з PlayStation раптово. Sony отримала таку гарантію під Microsoft, яка купує розробника гри – Activision Blizzard

У Microsoft визнали, що PS4 продаються у два рази краще, ніж Xbox

Штучний інтелект почав озвучувати фільми на MEGOGO

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар