UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Claude Mythos вразила тестувальників безпеки в Anthropic: «Коли ми отримали модель, ми зрозуміли, що вона відрізняється від інших»

Ніколас Карліні, дослідник штучного інтелекту, пов’язаний з Anthropic,  розповів, що новітня модель компанії Claude Mythos швидко обійшла протоколи безпеки й отримала доступ до конфіденційних даних.

Залишити коментар
Claude Mythos вразила тестувальників безпеки в Anthropic: «Коли ми отримали модель, ми зрозуміли, що вона відрізняється від інших»

Ніколас Карліні, дослідник штучного інтелекту, пов’язаний з Anthropic,  розповів, що новітня модель компанії Claude Mythos швидко обійшла протоколи безпеки й отримала доступ до конфіденційних даних.

Про це повідомляє Futurism із посиланням на Bloomberg.

Як відомо, компанія Anthropic вирішила не випускати свою найновішу модель під назвою Mythos у широкий загал. Причиною стали результати внутрішніх тестувань, які продемонстрували здатність ШІ самостійно зламувати складні системи, зокрема ядро Linux.

Внутрішня група тестувальників Anthropic — Frontier Red Team — виявила, що модель здатна діяти самостійно, щоб обійти протоколи безпеки та отримати доступ до конфіденційних даних. Mythos також продемонструвала здатність «приховувати сліди» після порушення інструкцій та намагалася вийти з ізольованого середовища («пісочниці») у відкриту мережу.

«Вже через кілька годин після отримання моделі ми зрозуміли, що вона інша», — зазначив керівник команди Логан Грем.

Занепокоєння також викликає виявлення моделлю вразливостей у ядрі Linux. Як зазначив виконавчий директор Linux Foundation Джим Землін, Mythos змогла об'єднати кілька дрібних багів у «функціональний експлойт», що ставить під загрозу більшість сучасних обчислювальних систем світу.

Через такі ризики Anthropic запустила проєкт Glasswing. У його межах доступ до Mythos отримає лише обмежене коло організацій, зокрема державні інститути з безпеки ШІ (як-от британський AISI), щоб вони могли підготувати засоби захисту до того, як подібні технології потраплять до рук зловмисників.

Раніше Anthropic вже стикалася з інцидентами, пов’язаними з безпекою. У листопаді 2024 року компанія підтвердила, що китайські хакери використовували агентські можливості моделі Claude для проникнення в іноземні системи. Тоді зловмисникам вдалося обійти фільтри ШІ, просто видавши себе за представників легітимних організацій з кібербезпеки. Цей досвід змусив Anthropic радикально переглянути підхід до релізу потужніших систем на кшталт Mythos.

На початку квітня міністр фінансів США Скотт Бессент і голова Федеральної резервної системи Джером Пауелл скликали екстрену зустріч із керівниками банків, щоб попередити їх про ризики для кібербезпеки, які несе нова модель штучного інтелекту компанії Anthropic.

Водночас деякі експерти у галузі ШІ скептично ставляться до повідомлень про неймовірні можливості Mythos. Зокрема, радник Білого дому з питань ШІ Девід Сакс публічно задався питанням, чи не намагається Anthropic штучно підігріти хайп навколо «небезпечності» свого продукту.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Anthropic тестує надзвичайно потужну ШІ-модель Claude Mythos яка містить загрози для кібербезпеки
Anthropic тестує надзвичайно потужну ШІ-модель Claude Mythos, яка містить загрози для кібербезпеки
По темi
Anthropic тестує надзвичайно потужну ШІ-модель Claude Mythos, яка містить загрози для кібербезпеки
Великий парадокс. Anthropic таємно поінформувала адміністрацію Трампа про модель Mythos — попри судовий позов проти Пентагону
Великий парадокс. Anthropic таємно поінформувала адміністрацію Трампа про модель Mythos — попри судовий позов проти Пентагону
По темi
Великий парадокс. Anthropic таємно поінформувала адміністрацію Трампа про модель Mythos — попри судовий позов проти Пентагону
Доведеться перезняти Термінатора? Замість Skynet прийшла Mythos. Явище небезпечне прямо зараз. І це – не жарт
Доведеться перезняти Термінатора? Замість Skynet прийшла Mythos. Явище небезпечне, прямо зараз. І це — не жарт
По темi
Доведеться перезняти Термінатора? Замість Skynet прийшла Mythos. Явище небезпечне, прямо зараз. І це — не жарт
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
3 коментарі
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
2 коментарі
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті. 

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.