Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Microsoft створила фейковий маркетплейс для тестування ШІ-агентів, які несподівано зазнали невдачі

Microsoft разом з Університетом штату Аризона провели дослідження, яке показало, що сучасні агентні моделі можуть бути вразливими до маніпуляцій. Для цього дослідники створили нове середовище моделювання під назвою Magentic Marketplace, щоб перевірити, наскільки добре ШІ-агенти можуть працювати без нагляду.

Залишити коментар
Microsoft створила фейковий маркетплейс для тестування ШІ-агентів, які несподівано зазнали невдачі

Microsoft разом з Університетом штату Аризона провели дослідження, яке показало, що сучасні агентні моделі можуть бути вразливими до маніпуляцій. Для цього дослідники створили нове середовище моделювання під назвою Magentic Marketplace, щоб перевірити, наскільки добре ШІ-агенти можуть працювати без нагляду.

Експерименти команди включали 100 агентів з боку клієнтів, які взаємодіяли з 300 агентами з боку бізнесу, пише TechCrunch.

Оскільки вихідний код маркетплейсу є відкритим, інші дослідницькі групи можуть використати його для нових експериментів чи підтвердження отриманих результатів.

Есе Камар, керівний директор Лабораторії AI Frontiers Lab у Microsoft Research, каже, що подібні дослідження будуть критично важливими для розуміння можливостей ШІ-агентів. «Це справді велике питання: як саме зміниться світ, коли ці агенти почнуть співпрацювати, спілкуватися та вести переговори між собою. Наше завдання — ґрунтовно розібратися в цьому».

Первинний аналіз, що охопив провідні моделі — GPT-4o, GPT-5 і Gemini-2.5-Flash — виявив низку неочікуваних недоліків. Зокрема, дослідники знайшли декілька технік маніпуляції, за допомогою яких бізнеси можуть змусити клієнтських агентів купувати їхні товари. Було помічено значне зниження ефективності роботи агента, коли він стикався з великою кількістю варіантів вибору, що буквально перевантажувало його увагу.

Крім того, агенти зазнавали невдачі, коли мали спільно працювати над досягненням цілі, демонструючи невпевненість щодо розподілу ролей у команді. Хоча продуктивність зросла після надання моделям детальніших інструкцій щодо співпраці, дослідники все одно наголошують, що базові здібності цих моделей потребують значного вдосконалення.

Режим ШІ Google отримав нові можливості агента: забронює квитки на події та запишеться на бюті-процедури
Режим ШІ Google отримав нові можливості агента: забронює квитки на події та запишеться на б’юті-процедури
По темi
Режим ШІ Google отримав нові можливості агента: забронює квитки на події та запишеться на б’юті-процедури
OpenAI представила ШІ-агента з кібербезпеки на базі GPT-5: як Aardvark захищає код від вразливостей
OpenAI представила ШІ-агента з кібербезпеки на базі GPT-5: як Aardvark захищає код від вразливостей
По темi
OpenAI представила ШІ-агента з кібербезпеки на базі GPT-5: як Aardvark захищає код від вразливостей
GitHub запускає платформу Agent HQ із ШІ-агентами для програмування
GitHub запускає платформу Agent HQ із ШІ-агентами для програмування
По темi
GitHub запускає платформу Agent HQ із ШІ-агентами для програмування
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Call of Duty не зникне з PlayStation раптово. Sony отримала таку гарантію під Microsoft, яка купує розробника гри – Activision Blizzard
Call of Duty не зникне з PlayStation раптово. Sony отримала таку гарантію під Microsoft, яка купує розробника гри – Activision Blizzard
Call of Duty не зникне з PlayStation раптово. Sony отримала таку гарантію під Microsoft, яка купує розробника гри – Activision Blizzard
У Microsoft визнали, що PS4 продаються у два рази краще, ніж Xbox
У Microsoft визнали, що PS4 продаються у два рази краще, ніж Xbox
У Microsoft визнали, що PS4 продаються у два рази краще, ніж Xbox
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.