🚀💳 Trustee Plus - більше ніж криптогаманець з європейською платіжною карткою. Спробуй 👉

OpenAI запустила нове сімейство моделей GPT-4.1, які зосереджені на кодуванні: що показали тести

OpenAI представила нові моделі, які фокусуються саме на програмуванні — GPT-4.1, GPT-4.1 mini і GPT-4.1 nano. Остання є найдешевшою моделлю в історії, стверджує компанія. 

Залишити коментар
OpenAI запустила нове сімейство моделей GPT-4.1, які зосереджені на кодуванні: що показали тести

OpenAI представила нові моделі, які фокусуються саме на програмуванні — GPT-4.1, GPT-4.1 mini і GPT-4.1 nano. Остання є найдешевшою моделлю в історії, стверджує компанія. 

Мультимодальні моделі, доступні через API OpenAI, але не через ChatGPT. Мають контекстне вікно в 1 млн токенів, що означає, що вони можуть приймати приблизно 750 000 слів за один раз, пише TechCrunch.

Метою багатьох технічних гігантів, у тому числі OpenAI, навчити ШІ-моделі виконувати складні завдання з розробки програмного забезпечення. Великі амбіції OpenAI — створити «агентного програмного інженера». GPT-4.1 є кроком у цьому напрямку.

«Ми оптимізували GPT-4.1 для використання в реальному світі на основі прямого зворотного зв’язку, щоб покращити сфери, які найбільше цікавлять розробників: інтерфейсне кодування, внесення меншої кількості сторонніх редагувань, надійне дотримання форматів, дотримання структури відповідей і порядку, послідовне використання інструментів тощо», — повідомив TechCrunch електронною поштою представник OpenAI. «Ці вдосконалення дозволяють розробникам створювати агенти, які значно краще справляються з реальними завданнями розробки програмного забезпечення».

  • GPT-4.1 коштує $2 за млн вхідних токенів і $8 за млн вихідних токенів.
  • Вартість GPT-4.1 mini становить $0,40 за млн вхідних токенів і $1,60 за млн вихідних токенів.
  • GPT-4.1 nano — $0,10 за млн вхідних токенів і $0,40 за млн вихідних токенів.

Що показали тести

OpenAI стверджує, що повна модель GPT-4.1 перевершує свої моделі GPT-4o та GPT-4o mini за тестами кодування, включаючи SWE-bench. Кажуть, що GPT-4.1 mini і nano є ефективнішими та швидшими за рахунок певної точності, а що GPT-4.1 nano є найшвидшою — і найдешевшою — моделлю в історії.

Відповідно до внутрішнього тестування OpenAI, GPT-4.1, який може генерувати більше токенів одночасно, ніж GPT-4o (32 768 проти 16 384), набрав від 52% до 54,6% на SWE-bench Verified, перевіреній людиною підмножині SWE-bench.

Ці цифри трохи нижчі від результатів, повідомлених Google і Anthropic для Gemini 2.5 Pro (63,8%) і Claude 3.7 Sonnet (62,3%), відповідно, за тим самим тестом.

В окремій оцінці OpenAI перевірив GPT-4.1 за допомогою Video-MME, який призначений для вимірювання здатності моделі «розуміти» вміст у відео. GPT-4.1 досяг рекордної точності в 72% у категорії «довге відео без субтитрів», стверджує OpenAI.

OpenAI також визнає, що GPT-4.1 стає менш надійною (тобто більше помиляється), чим більше вхідних токенів їй доводиться мати справу. В одному з власних тестів компанії, OpenAI-MRCR, точність моделі знизилася з приблизно 84% з 8000 токенів до 50% з 1 млн токенів. GPT-4.1 також мала тенденцію бути більш «буквальною», ніж GPT-4o, каже компанія, іноді вимагаючи більш конкретних, чітких підказок.

Нагадаємо, дослідження Microsoft показало, що ШІ-моделі не справляються з процесом налагодження коду.

Сем Альтман каже що 10% світу зараз використовують ШІ від OpenAI завдяки зображенням в стилі Studio Ghibli
Сем Альтман каже, що 10% світу зараз використовують ШІ від OpenAI завдяки зображенням в стилі Studio Ghibli
По темi
Сем Альтман каже, що 10% світу зараз використовують ШІ від OpenAI завдяки зображенням в стилі Studio Ghibli
OpenAI планує ввести підтвердження ID для доступу до своїх ШІ-моделей через API щоб зменшити небезпечне використання ШІ
OpenAI планує ввести підтвердження ID для доступу до своїх ШІ-моделей через API, щоб зменшити небезпечне використання ШІ
По темi
OpenAI планує ввести підтвердження ID для доступу до своїх ШІ-моделей через API, щоб зменшити небезпечне використання ШІ
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Підключай Megogo зі знижками за акційними тарифами.

від 99 гривень на місяць

Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Хочу стати програмістом. З чого почати і як вибрати між Java Script, PHP, Python та іншими
Діана Смелікова, операційний директор Wezom Academy, у своєму блозі на DOU пояснила, з чого почати вивчати програмування та яким мовам варто налагодити перевагу на початковому етапі. Ось 5 важливих порад від неї.
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
Штучний інтелект почав озвучувати фільми на MEGOGO
1 коментар
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео
Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.