Наталя Хандусенко ШІ 15 квітня 2025, 10:39

OpenAI запустила нове сімейство моделей GPT-4.1, які зосереджені на кодуванні: що показали тести

OpenAI представила нові моделі, які фокусуються саме на програмуванні — GPT-4.1, GPT-4.1 mini і GPT-4.1 nano. Остання є найдешевшою моделлю в історії, стверджує компанія.

Залишити коментар

OpenAI запустила нове сімейство моделей GPT-4.1, які зосереджені на кодуванні: що показали тести

OpenAI представила нові моделі, які фокусуються саме на програмуванні — GPT-4.1, GPT-4.1 mini і GPT-4.1 nano. Остання є найдешевшою моделлю в історії, стверджує компанія.

Мультимодальні моделі, доступні через API OpenAI, але не через ChatGPT. Мають контекстне вікно в 1 млн токенів, що означає, що вони можуть приймати приблизно 750 000 слів за один раз, пише TechCrunch.

Метою багатьох технічних гігантів, у тому числі OpenAI, навчити ШІ-моделі виконувати складні завдання з розробки програмного забезпечення. Великі амбіції OpenAI — створити «агентного програмного інженера». GPT-4.1 є кроком у цьому напрямку.

«Ми оптимізували GPT-4.1 для використання в реальному світі на основі прямого зворотного зв’язку, щоб покращити сфери, які найбільше цікавлять розробників: інтерфейсне кодування, внесення меншої кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, послідовне використання інструментів тощо», — повідомив TechCrunch електронною поштою представник OpenAI. «Ці вдосконалення дозволяють розробникам створювати агенти, які значно краще справляються з реальними завданнями розробки програмного забезпечення».

GPT-4.1 коштує $2 за млн вхідних токенів і $8 за млн вихідних токенів.
Вартість GPT-4.1 mini становить $0,40 за млн вхідних токенів і $1,60 за млн вихідних токенів.
GPT-4.1 nano — $0,10 за млн вхідних токенів і $0,40 за млн вихідних токенів.

Що показали тести

OpenAI стверджує, що повна модель GPT-4.1 перевершує свої моделі GPT-4o та GPT-4o mini за тестами кодування, включаючи SWE-bench. Кажуть, що GPT-4.1 mini і nano є ефективнішими та швидшими за рахунок певної точності, а що GPT-4.1 nano є найшвидшою — і найдешевшою — моделлю в історії.

Відповідно до внутрішнього тестування OpenAI, GPT-4.1, який може генерувати більше токенів одночасно, ніж GPT-4o (32 768 проти 16 384), набрав від 52% до 54,6% на SWE-bench Verified, перевіреній людиною підмножині SWE-bench.

Ці цифри трохи нижчі від результатів, повідомлених Google і Anthropic для Gemini 2.5 Pro (63,8%) і Claude 3.7 Sonnet (62,3%), відповідно, за тим самим тестом.

В окремій оцінці OpenAI перевірив GPT-4.1 за допомогою Video-MME, який призначений для вимірювання здатності моделі «розуміти» вміст у відео. GPT-4.1 досяг рекордної точності в 72% у категорії «довге відео без субтитрів», стверджує OpenAI.

OpenAI також визнає, що GPT-4.1 стає менш надійною (тобто більше помиляється), чим більше вхідних токенів їй доводиться мати справу. В одному з власних тестів компанії, OpenAI-MRCR, точність моделі знизилася з приблизно 84% з 8000 токенів до 50% з 1 млн токенів. GPT-4.1 також мала тенденцію бути більш «буквальною», ніж GPT-4o, каже компанія, іноді вимагаючи більш конкретних, чітких підказок.

Нагадаємо, дослідження Microsoft показало, що ШІ-моделі не справляються з процесом налагодження коду.

Сем Альтман каже що 10% світу зараз використовують ШІ від OpenAI завдяки зображенням в стилі Studio Ghibli

OpenAI планує ввести підтвердження ID для доступу до своїх ШІ-моделей через API щоб зменшити небезпечне використання ШІ

Читайте головні IT-новини країни в нашому Telegram

Залишити коментар

Текст: Наталя Хандусенко Фото: Yahoo Finance Теги: gpt-4.1, openai, кодування, програмування, ші, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими

Діана Смелікова, операційний директор Wezom Academy, у своєму блозі на DOU пояснила, з чого почати вивчати програмування та яким мовам варто налагодити перевагу на початковому етапі. Ось 5 важливих порад від неї.

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар