Anthropic представила «найбільш агентну модель» з усіх існуючих в цій лінійці. Що може Claude Sonnet 5
Компанія Anthropic представила нову Claude Sonnet 5, яку вона позиціонує як найбільш агентну модель з усіх існуючих у цій лінійці.
Компанія Anthropic представила нову Claude Sonnet 5, яку вона позиціонує як найбільш агентну модель з усіх існуючих у цій лінійці.
Компанія Anthropic представила нову Claude Sonnet 5, яку вона позиціонує як найбільш агентну модель з усіх існуючих у цій лінійці.
Як зазначається у блозі Anthropic, дана модель може «будувати плани», сама використовувати браузери та термінали, і «працювати автономно на рівні, який лише кілька місяців тому вимагав більших і дорожчих моделей».
Компанія зазначає, що Claude Sonnet 5 в плані агентних можливостей наближається до моделей класу Opus.
«Sonnet 5 скорочує розрив: його продуктивність близька до Opus 4.8, але за нижчою ціною. Це суттєве покращення порівняно з попередником, Sonnet 4.6, у важливих аспектах агентної продуктивності», — стверджують у Anthropic.
Там навели таблицю показників Claude Sonnet 5 порівняно з іншими моделями.

Зазначається, що Claude Sonnet 5 віднині доступний для всіх планів. Це модель за замовчуванням для планів Free та Pro, а також вона доступна для користувачів Max, Team та Enterprise.
«Він також доступний у Claude Code та на платформі Claude, де його початкова ціна становить $2 за мільйон вхідних токенів та $10 за мільйон вихідних токенів до 31 серпня 2026 року, після чого його ціна становитиме $3 за мільйон вхідних токенів та $15 за мільйон вихідних токенів.
Розробники можуть використовувати Claude Sonnet 5 через Claude API.
Як додають у ШІ-гіганті, попередня найкраща модель Sonnet (Sonnet 4.6) значно відставала від Opus 4.8, тепер же Sonnet 5 та Opus 4.8 охоплюють один діапазон, причому Sonnet 5 пропонує «вражаючі можливості за нижчою ціною, а Opus 4.8 пропонує більшу точність за вищою ціною».
Що стосується агентної безпеки, то модель, за даними компанії, краще відхиляє шкідливі запити та протистоїть «спробам захоплення». Також модель демонструє нижчі показники галюцинацій та «підлабузництва», ніж Sonnet 4.6.
Sonnet 5 демонструє загалом нижчий рівень неправильної поведінки, ніж Sonnet 4.6, хоча вищий, ніж Mythos Preview та Opus 4.8.

Відносно використання цієї моделі для задач з кібербезпеки компанія повідомила, що навмисно не навчала Sonnet 5 цим завданням, хоча вона «може виконувати деякі рутинні, нешкідливі кіберзавдання». Втім, у розробці програмних експлойтів модель показує значно гіршу продуктивність, ніж Opus 4.8 та Mythos 5.
Як повідомляв dev.ua, компанія OpenAI представила три нові моделі включно з флагманською Sol. Втім, відповідно до нових вимог адміністрації Трампа, вони нині перебувають у «обмеженому попередньому перегляді».


