Google запускає програму винагород за виявлені помилки в продуктах зі штучним інтелектом
Паралельно з програмою винагород, Google представила інструмент-агент CodeMender від DeepMind, який допомагає автоматично знаходити та виправляти вразливий код.
Паралельно з програмою винагород, Google представила інструмент-агент CodeMender від DeepMind, який допомагає автоматично знаходити та виправляти вразливий код.
Паралельно з програмою винагород, Google представила інструмент-агент CodeMender від DeepMind, який допомагає автоматично знаходити та виправляти вразливий код.
Google оголосив про запуск програми виявлення вразливостей для своїх продуктів. У межах програми Google чіткіше визначив, що вважатиметься помилкою штучного інтелекту — вразливості, які використовують великі мовні моделі або генеративні системи для заподіяння шкоди або обходу безпеки.
Компанія навела як приклади тематичних досліджень спливаючі вікна, які змушують смартпристрій виконувати небажану дію, або вразливість, яка витягує та пересилає конфіденційні дані.
Найбільша винагорода до $20 000 США буде виплачена за критичні «несанкціоновані дії» на флагманських сервісах, з можливістю додаткового бонусу до $30 000 США за високоякісний та інноваційний звіт.
За два роки з початку відкритого набору дослідників Google вже виплатив понад $430 000. Тепер компанія хоче стимулювати зосередження саме на використанні штучного інтелекту, яке призводить до «шкідливих дій».
Водночас Google просить, щоб проблеми, пов’язані з неетичним контентом (наприклад, мовою ворожнечі або порушенням авторських прав), надсилалися через стандартні канали зворотного зв’язку в продуктах, а не в рамках програми.
Поряд із програмою винагород, Google представила інструмент-агент CodeMender від DeepMind, який допомагає автоматично знаходити та виправляти вразливий код. Google стверджує, що після перевірки людиною цей інструмент вже допоміг виправити десятки проблем у програмному забезпеченні з відкритим кодом.
Отже, за останні шість місяців, завдяки CodeMender, у проєкти з відкритим кодом вже було внесено 72 виправлення безпеки, деякі з яких містять до 4,5 мільйонів рядків коду.



