Наталя Хандусенко ШІ 25 лютого 2025, 09:53

Anthropic запускає першу гібридну ШІ-модель міркувань, яка може відповідати як в реальному часі, так і думати протягом тривалого часу

Anthropic випустила нову ШІ-модель Claude 3.7 Sonnet, яка є поки єдиною, що може давати як відповіді в режимі реального часу, так і більш зважені, «продумані» відповіді на запитання. Користувачі можуть вибрати, чи активувати «міркування» ШІ-моделі, які спонукають Claude 3.7 Sonnet «думати» протягом короткого або тривалого періоду.

Залишити коментар

Anthropic запускає першу гібридну ШІ-модель міркувань, яка може відповідати як в реальному часі, так і думати протягом тривалого часу

Anthropic випустила нову ШІ-модель Claude 3.7 Sonnet, яка є поки єдиною, що може давати як відповіді в режимі реального часу, так і більш зважені, «продумані» відповіді на запитання. Користувачі можуть вибрати, чи активувати «міркування» ШІ-моделі, які спонукають Claude 3.7 Sonnet «думати» протягом короткого або тривалого періоду.

Claude 3.7 Sonnet стала доступною у понеділок для всіх користувачів і розробників. Але доступ до функцій міркування моделі отримають ті, хто користується преміумпланом. Безплатні користувачі отримають стандартну версію Claude 3.7 Sonnet, яка, як стверджує Anthropic, перевершує попередню Claude 3.5 Sonnet. Якщо помітили, то компанія пропустила одну цифру — 6, тобто після 3.5 йде відразу 3.7.

Claude 3.7 Sonnet з функцією міркувань виходить дорожчою за інші «мислячі» моделі, але тут треба мати на увазі, що це гібридна модель. Тож Claude 3.7 Sonnet коштує $3 за 1 млн вхідних токенів (це означає, що за $3 ви можете ввести в Claude приблизно 750 000 слів — більше слів, ніж у всій серії «Володаря перснів») і $15 за 1 млн вихідних токенів. Це роблять його дорожчим за o3-mini від OpenAI ($1.10 за 1 млн вхідних токенів/$4.40 за 1 млн вихідних токенів) та R1 від DeepSeek (55 центів за 1 млн вхідних токенів/$2.19 за 1 млн вихідних токенів).

Моделі міркувань, такі як o3-mini, R1, Gemini 2.0 Flash Thinking від Google та Grok 3 (Think) від xAI, використовують більше часу та обчислювальної потужності, перш ніж відповісти на запитання. Моделі розбивають завдання на менші кроки, що, як правило, підвищує точність остаточної відповіді. Моделі міркувань не обов’язково думають або міркують так, як людина, але їхній процес моделюється за принципом дедукції.

Зрештою, Anthropic хотіла б, щоб Claude з’ясувала, як довго вона повинна «думати» над питаннями самостійно, не вимагаючи від користувачів заздалегідь вибирати елементи управління, розповіла в інтерв’ю TechCrunch керівник відділу продуктів і досліджень Anthropic Діана Пенн.

Anthropic заявляє, що дозволяє Claude 3.7 Sonnet показувати фазу внутрішнього планування через «видимий блокнот». Користувачі бачитимуть повний процес мислення ШІ-моделі для більшості підказок, але деякі частини можуть бути відредаговані з метою довіри та безпеки.

Компанія стверджує, що оптимізувала режими мислення Claude для реальних завдань, таких як складні проблеми з кодуванням або агентські завдання. Розробники, які використовують API Anthropic, можуть контролювати «бюджет» для мислення, швидкість торгівлі та вартість якості відповіді.

В одному з тестів SWE-Bench для точної оцінки здатності моделей ШІ вирішувати реальні проблеми програмного забезпечення, Claude 3.7 Sonnet показав 62,3% точності, порівняно з моделлю o3-mini від OpenAI, яка набрала 49,3%. В іншому тесті для вимірювання здатності моделі штучного інтелекту взаємодіяти зі змодельованими користувачами та зовнішніми API у роздрібній торгівлі, TAU-Bench, Claude 3.7 Sonnet набрав 81,2%, порівняно з моделлю o1 від OpenAI, яка набрала 73,5%.

Anthropic також каже, що Claude 3.7 Sonnet відмовлятиметься відповідати на запитання рідше, ніж його попередні моделі, стверджуючи, що модель здатна робити тонші відмінності між шкідливими та доброякісними підказками. Компанія каже, що це зменшило кількість непотрібних відмов на 45% порівняно з Claude 3.5 Sonnet.

На додаток до Claude 3.7 Sonnet, Anthropic також випускає інструмент агентного кодування під назвою Claude Code. Запущений у вигляді дослідницької версії, цей інструмент дозволяє розробникам запускати конкретні завдання через Claude безпосередньо зі свого термінала.

Як повідомив TechCrunch представник Anthropic, спочатку Claude Code буде доступний для обмеженої кількості користувачів за принципом «хто перший прийшов, той перший і отримав».

Джон Шульман ексспівзасновник OpenAI залишив AI-стартап Anthropic майже через пів року після приєднання. Що трапилось

CEO Anthropic: «ШІ може перевершити людський інтелект до 2027 року»

В Anthropic довели що навіть передові моделі ШІ можна змусити видавати шкідливі відповіді за допомогою простого «джейлбрейку». Як це працює

Читайте головні IT-новини країни в нашому Telegram

Залишити коментар

Текст: Наталя Хандусенко Фото: PYMNTS.com Теги: anthropic, claude, ші, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар