UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉
Наталя ХандусенкоШІ
7 жовтня 2025, 09:35
2025-10-07
OpenAI посилює підтримку розробників, додаючи потужніші моделі до свого API
На конференції Dev Day OpenAI представила оновлення свого API, включаючи презентацію GPT-5 Pro (найновішої мовної моделі), моделі для створення відео Sora 2 та більш компактної й економної голосової моделі.
На конференції Dev Day OpenAI представила оновлення свого API, включаючи презентацію GPT-5 Pro (найновішої мовної моделі), моделі для створення відео Sora 2 та більш компактної й економної голосової моделі.
Як пояснив СЕО OpenAI Сем Альтман, впровадження GPT-5 Pro має привернути увагу розробників, що працюють над програмами для фінансового, юридичного та медичного секторів — тобто тих галузей, де необхідна «висока точність і глибина міркувань», пише TechCrunch.
Альтман також зауважив, що голосові можливості стануть ключовими в майбутньому, оскільки голосове спілкування швидко перетворюється на один із основних способів взаємодії людей зі ШІ. Для цього OpenAI впроваджує gpt-realtime mini — більш компактну та економну голосову модель в API, що забезпечує швидку потокову передачу аудіо та мовлення. Нова модель на 70% дешевша за попередню вдосконалену голосову модель OpenAI, але обіцяє «ту саму якість і виразність голосу».
Нарешті, творці контенту, які працюють в екосистемі розробників OpenAI, тепер можуть отримати попередній доступ до Sora 2 в API. OpenAI випустила Sora 2 — свою новітню модель для генерації аудіо та відео — минулого тижня разом із додатком Sora.
«Розробники відтепер отримують доступ до тієї ж моделі, що створює вражаючі відео у Sora 2, і можуть використовувати її безпосередньо у своїх програмах», — заявив Альтман.
Sora 2 є вдосконаленою версією попередньої моделі, що пропонує реалістичніші, логічні сцени із синхронним аудіосупроводом і розширеними можливостями контролю — від керування ракурсом камери до вибору стилю зображення.
«Наприклад, ви можете взяти кадр, знятий на iPhone, і дати Sora промпт розгорнути його у масштабний кінематографічний кадр», — пояснив Альтман. — «Проте одне з найцікавіших наших досягнень — це те, наскільки добре нова модель поєднує звук та зображення. Це не лише мовлення, а й багаті звукові ландшафти, атмосферні шуми та синхронізовані ефекти, які точно відповідають тому, що відбувається на екрані».
Цей короткий термін на слуху у всіх, хто стикався з розробкою. Але далеко не всі розуміють, що саме він означає та навіщо потрібний. Розробник Петро Газаров розповів про API простими словами у своєму блозі.