OpenAI випускає генератор зображень DALL-E 3, який, ймовірно, буде прямим конкурентом Midjourney
Генеральний директор OpenAI Сем Альтман повідомив про запуск компанією OpenAI третьої версії генератора зображень зі штучним інтелектом DALL-E.
Генеральний директор OpenAI Сем Альтман повідомив про запуск компанією OpenAI третьої версії генератора зображень зі штучним інтелектом DALL-E.
Протягом наступних кількох тижнів, точніше на початку жовтня, DALL-E пошириться на всіх користувачів ChatGPT Plus і Enterprise.
У релізі розробники підкреслюють, що третя версія DALL-E здатна з більшою точністю генерувати зображення за текстовим запитом, ніж це робив навіть її попередник DALL-E 2.
Компанія акцентує про поширену безпеку DALL-E, яку впровадили розробники. Зокрема, як і в попередніх версіях, обмежили здатність нейромережі створювати насильницький, дорослий або ненависницький вміст. Крім того, покращили ефективність запитів, які стосуються публічних осіб та додали можливість відмовитися від навчання своїх зображень майбутнім моделям генерації зображень.
Окремий інструмент, вбудований у DALL-E, який тестують розробники, допоможе визначити, коли зображення було створено за допомогою ШІ.
Старший науковий співробітник АІ NVIDIA Джим Фан написав, що це, кращий пік майбутньої епічної битви масових мультимодальних LLM проти DeepMind Gemini.
«Я думаю, що DALL-E 3 — це не просто позиція проти MidJourney. Цитата: „DALL-E 3 створено на основі ChatGPT“. Це ключова фраза», — акцентує він.
Джим Фан відмічає надзвичайне вирівнювання мови DALL-E 3, яке побудовано на текстовій основі GPT. За його словами, MidJourney насправді не має особливого «мозку для міркування», тому «потрібен такий швидкий злом», це спосіб створити потужний мультимодальний ШІ.