😍 Спробуй Новий Trustee Plus на дотик - твій криптогаманець і платіжна картка тут 👉
Наталя ХандусенкоШІ
25 лютого 2025, 09:53
2025-02-25
Anthropic запускає першу гібридну ШІ-модель міркувань, яка може відповідати як в реальному часі, так і думати протягом тривалого часу
Anthropic випустила нову ШІ-модель Claude 3.7 Sonnet, яка є поки єдиною, що може давати як відповіді в режимі реального часу, так і більш зважені, «продумані» відповіді на запитання. Користувачі можуть вибрати, чи активувати «міркування» ШІ-моделі, які спонукають Claude 3.7 Sonnet «думати» протягом короткого або тривалого періоду.
Anthropic випустила нову ШІ-модель Claude 3.7 Sonnet, яка є поки єдиною, що може давати як відповіді в режимі реального часу, так і більш зважені, «продумані» відповіді на запитання. Користувачі можуть вибрати, чи активувати «міркування» ШІ-моделі, які спонукають Claude 3.7 Sonnet «думати» протягом короткого або тривалого періоду.
Claude 3.7 Sonnet стала доступною у понеділок для всіх користувачів і розробників. Але доступ до функцій міркування моделі отримають ті, хто користується преміумпланом. Безплатні користувачі отримають стандартну версію Claude 3.7 Sonnet, яка, як стверджує Anthropic, перевершує попередню Claude 3.5 Sonnet. Якщо помітили, то компанія пропустила одну цифру — 6, тобто після 3.5 йде відразу 3.7.
Claude 3.7 Sonnet з функцією міркувань виходить дорожчою за інші «мислячі» моделі, але тут треба мати на увазі, що це гібридна модель. Тож Claude 3.7 Sonnet коштує $3 за 1 млн вхідних токенів (це означає, що за $3 ви можете ввести в Claude приблизно 750 000 слів — більше слів, ніж у всій серії «Володаря перснів») і $15 за 1 млн вихідних токенів. Це роблять його дорожчим за o3-mini від OpenAI ($1.10 за 1 млн вхідних токенів/$4.40 за 1 млн вихідних токенів) та R1 від DeepSeek (55 центів за 1 млн вхідних токенів/$2.19 за 1 млн вихідних токенів).
Моделі міркувань, такі як o3-mini, R1, Gemini 2.0 Flash Thinking від Google та Grok 3 (Think) від xAI, використовують більше часу та обчислювальної потужності, перш ніж відповісти на запитання. Моделі розбивають завдання на менші кроки, що, як правило, підвищує точність остаточної відповіді. Моделі міркувань не обов’язково думають або міркують так, як людина, але їхній процес моделюється за принципом дедукції.
Зрештою, Anthropic хотіла б, щоб Claude з’ясувала, як довго вона повинна «думати» над питаннями самостійно, не вимагаючи від користувачів заздалегідь вибирати елементи управління, розповіла в інтерв’ю TechCrunch керівник відділу продуктів і досліджень Anthropic Діана Пенн.
Anthropic заявляє, що дозволяє Claude 3.7 Sonnet показувати фазу внутрішнього планування через «видимий блокнот». Користувачі бачитимуть повний процес мислення ШІ-моделі для більшості підказок, але деякі частини можуть бути відредаговані з метою довіри та безпеки.
Компанія стверджує, що оптимізувала режими мислення Claude для реальних завдань, таких як складні проблеми з кодуванням або агентські завдання. Розробники, які використовують API Anthropic, можуть контролювати «бюджет» для мислення, швидкість торгівлі та вартість якості відповіді.
В одному з тестів SWE-Bench для точної оцінки здатності моделей ШІ вирішувати реальні проблеми програмного забезпечення, Claude 3.7 Sonnet показав 62,3% точності, порівняно з моделлю o3-mini від OpenAI, яка набрала 49,3%. В іншому тесті для вимірювання здатності моделі штучного інтелекту взаємодіяти зі змодельованими користувачами та зовнішніми API у роздрібній торгівлі, TAU-Bench, Claude 3.7 Sonnet набрав 81,2%, порівняно з моделлю o1 від OpenAI, яка набрала 73,5%.
Anthropic також каже, що Claude 3.7 Sonnet відмовлятиметься відповідати на запитання рідше, ніж його попередні моделі, стверджуючи, що модель здатна робити тонші відмінності між шкідливими та доброякісними підказками. Компанія каже, що це зменшило кількість непотрібних відмов на 45% порівняно з Claude 3.5 Sonnet.
На додаток до Claude 3.7 Sonnet, Anthropic також випускає інструмент агентного кодування під назвою Claude Code. Запущений у вигляді дослідницької версії, цей інструмент дозволяє розробникам запускати конкретні завдання через Claude безпосередньо зі свого термінала.
Як повідомив TechCrunch представник Anthropic, спочатку Claude Code буде доступний для обмеженої кількості користувачів за принципом «хто перший прийшов, той перший і отримав».
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Хочете повідомити важливу новину? Пишіть у Telegram-бот
Головні події та корисні посилання в нашому Telegram-каналі