Генеральный директор OpenAI Сэм Альтман сообщил о запуске компании OpenAI третьей версии генератора изображений с искусственным интеллектом DALL-E.
В течение нескольких недель, точнее в начале октября, DALL-E распространится на всех пользователей ChatGPT Plus и Enterprise.
В релизе разработчики подчеркивают, что третья версия DALL-E способна с большей точностью генерировать изображение по текстовому запросу, чем это делал даже ее предшественник DALL-E 2.
Компания акцентирует внимание на распространенной безопасности DALL-E, которую внедрили разработчики. В частности, как и в предыдущих версиях, ограничили способность нейросети создавать насильственное, взрослое или ненавистническое содержимое. Кроме того, улучшили эффективность запросов, касающихся публичных лиц, и добавили возможность отказаться от обучения своих изображений будущим моделям генерации изображений.
Отдельный инструмент, встроенный в DALL-E, тестируемый разработчиками, поможет определить, когда изображение было создано с помощью ИИ.
Старший научный сотрудник АИ NVIDIA Джим Фан написал, что это лучший пик предстоящей эпической битвы массовых мультимодальных LLM против DeepMind Gemini.
«Я думаю, что DALL-E 3 — это не просто позиция против MidJourney. Цитата: „DALL-E 3 создан на основе ChatGPT“. Это ключевая фраза», — акцентирует он.
Джим Фан отмечает чрезвычайное выравнивание языка DALL-E 3, построенного на текстовой основе GPT. По его словам, MidJourney на самом деле не имеет особого «мозга для размышления», поэтому «нужен столь быстрый взлом», это способ создать мощный мультимодальный ИИ.