Вікторія Горбік Такая жизнь 21 сентября 2023, 09:01

OpenAI выпускает генератор изображений DALL-E 3, который, вероятно, станет прямым конкурентом Midjourney

Генеральный директор OpenAI Сэм Альтман сообщил о запуске компании OpenAI третьей версии генератора изображений с искусственным интеллектом DALL-E.

Оставить комментарий

OpenAI выпускает генератор изображений DALL-E 3, который, вероятно, станет прямым конкурентом Midjourney

Генеральный директор OpenAI Сэм Альтман сообщил о запуске компании OpenAI третьей версии генератора изображений с искусственным интеллектом DALL-E.

В течение нескольких недель, точнее в начале октября, DALL-E распространится на всех пользователей ChatGPT Plus и Enterprise.

В релизе разработчики подчеркивают, что третья версия DALL-E способна с большей точностью генерировать изображение по текстовому запросу, чем это делал даже ее предшественник DALL-E 2.

Компания акцентирует внимание на распространенной безопасности DALL-E, которую внедрили разработчики. В частности, как и в предыдущих версиях, ограничили способность нейросети создавать насильственное, взрослое или ненавистническое содержимое. Кроме того, улучшили эффективность запросов, касающихся публичных лиц, и добавили возможность отказаться от обучения своих изображений будущим моделям генерации изображений.

Отдельный инструмент, встроенный в DALL-E, тестируемый разработчиками, поможет определить, когда изображение было создано с помощью ИИ.

Старший научный сотрудник АИ NVIDIA Джим Фан написал, что это лучший пик предстоящей эпической битвы массовых мультимодальных LLM против DeepMind Gemini.

«Я думаю, что DALL-E 3 — это не просто позиция против MidJourney. Цитата: „DALL-E 3 создан на основе ChatGPT“. Это ключевая фраза», — акцентирует он.

Джим Фан отмечает чрезвычайное выравнивание языка DALL-E 3, построенного на текстовой основе GPT. По его словам, MidJourney на самом деле не имеет особого «мозга для размышления», поэтому «нужен столь быстрый взлом», это способ создать мощный мультимодальный ИИ.