🚀💳 Trustee Plus - більше ніж криптогаманець з європейською платіжною карткою. Спробуй 👉
Наталя ХандусенкоШІ
15 квітня 2025, 10:39
2025-04-15
OpenAI запустила нове сімейство моделей GPT-4.1, які зосереджені на кодуванні: що показали тести
OpenAI представила нові моделі, які фокусуються саме на програмуванні — GPT-4.1, GPT-4.1 mini і GPT-4.1 nano. Остання є найдешевшою моделлю в історії, стверджує компанія.
OpenAI представила нові моделі, які фокусуються саме на програмуванні — GPT-4.1, GPT-4.1 mini і GPT-4.1 nano. Остання є найдешевшою моделлю в історії, стверджує компанія.
Мультимодальні моделі, доступні через API OpenAI, але не через ChatGPT. Мають контекстне вікно в 1 млн токенів, що означає, що вони можуть приймати приблизно 750 000 слів за один раз, пише TechCrunch.
Метою багатьох технічних гігантів, у тому числі OpenAI, навчити ШІ-моделі виконувати складні завдання з розробки програмного забезпечення. Великі амбіції OpenAI — створити «агентного програмного інженера». GPT-4.1 є кроком у цьому напрямку.
«Ми оптимізували GPT-4.1 для використання в реальному світі на основі прямого зворотного зв’язку, щоб покращити сфери, які найбільше цікавлять розробників: інтерфейсне кодування, внесення меншої кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, послідовне використання інструментів тощо», — повідомив TechCrunch електронною поштою представник OpenAI. «Ці вдосконалення дозволяють розробникам створювати агенти, які значно краще справляються з реальними завданнями розробки програмного забезпечення».
GPT-4.1 коштує $2 за млн вхідних токенів і $8 за млн вихідних токенів.
Вартість GPT-4.1 mini становить $0,40 за млн вхідних токенів і $1,60 за млн вихідних токенів.
GPT-4.1 nano — $0,10 за млн вхідних токенів і $0,40 за млн вихідних токенів.
Що показали тести
OpenAI стверджує, що повна модель GPT-4.1 перевершує свої моделі GPT-4o та GPT-4o mini за тестами кодування, включаючи SWE-bench. Кажуть, що GPT-4.1 mini і nano є ефективнішими та швидшими за рахунок певної точності, а що GPT-4.1 nano є найшвидшою — і найдешевшою — моделлю в історії.
Відповідно до внутрішнього тестування OpenAI, GPT-4.1, який може генерувати більше токенів одночасно, ніж GPT-4o (32 768 проти 16 384), набрав від 52% до 54,6% на SWE-bench Verified, перевіреній людиною підмножині SWE-bench.
Ці цифри трохи нижчі від результатів, повідомлених Google і Anthropic для Gemini 2.5 Pro (63,8%) і Claude 3.7 Sonnet (62,3%), відповідно, за тим самим тестом.
В окремій оцінці OpenAI перевірив GPT-4.1 за допомогою Video-MME, який призначений для вимірювання здатності моделі «розуміти» вміст у відео. GPT-4.1 досяг рекордної точності в 72% у категорії «довге відео без субтитрів», стверджує OpenAI.
OpenAI також визнає, що GPT-4.1 стає менш надійною (тобто більше помиляється), чим більше вхідних токенів їй доводиться мати справу. В одному з власних тестів компанії, OpenAI-MRCR, точність моделі знизилася з приблизно 84% з 8000 токенів до 50% з 1 млн токенів. GPT-4.1 також мала тенденцію бути більш «буквальною», ніж GPT-4o, каже компанія, іноді вимагаючи більш конкретних, чітких підказок.
Нагадаємо, дослідження Microsoft показало, що ШІ-моделі не справляються з процесом налагодження коду.
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Діана Смелікова, операційний директор Wezom Academy, у своєму блозі на DOU пояснила, з чого почати вивчати програмування та яким мовам варто налагодити перевагу на початковому етапі. Ось 5 важливих порад від неї.