Блог

Як ChatGPT може створювати й модифікувати зображення та фото після нещодавнього історичного оновлення

Сталося потужне історичне оновлення ChatGPT. Тепер чатбот можна використовувати для генерації зображень та обробки наявних віжуалів і фото. Раніше я завжди казав, що ChatGPT чи Gemini — це, м’яко кажучи, не найкращі ШІ-сервіси для генерації зображень і роботи з цим форматом контенту. Це не їхній основний профіль. Але ситуація змінюється.

ChatGPT тепер може генерувати якісні зображення

Набагато кращі, ніж були раніше. І фотореалістичні. Тепер це робить не окрема модель для генерації зображень DALL-E, а омнімодальна модель GPT-4o. 

З мінусів — генерація зображень відбувається не дуже швидко. Але терпимо. 

Відмова від цензури

Особливо відзначу несподівану відмову від цензури, тому що генерує зображення навіть відомих особистостей, як і Grok Ілона Маска. Наприклад, я попросив згенерувати зображення Володимира Зеленського, що грає в карти, і ChatGPT це зробив.

З мінусів — а наскільки це етично? Хоча розумію бажання позбавити Grok конкурентної переваги.  

Про «розмовне редагування»

СhatGPT тепер може редагувати зображення за текстовими промптами («розмовне редагування»)

Наприклад, ви можете просто за текстовим описом додати або змінити об'єкти, змінити стиль, видалити фон, а ще можна зробити з багатьох зображень одне.  

З мінусів — трохи змінює обличчя або товари при редагуванні. Консистентність зберігається, але не на 100%. 

Окремо відзначу нову можливість генерації зображень з україномовним текстом на них

Раніше тут це було неможливо, а в окремих ШІ-сервісах, як-от Midjourney чи Ideogram, можна було добиватися англомовних текстів на зображеннях. Наприклад, я попросив згенерувати обкладинку для YouTube-шоу «ШО по ШІ?» — і вийшло майже вдало. 

З мінусів — працює поки неідеально. Інколи букви не ті, що вказані в промпті. Хоча загалом це дуже круто. Навіть інфографіку з текстом може зробити! 

Генерація відео

З’явилася можливість генерації відео, ба більше, навіть якщо у вас безоплатна версія — три відео на день. Раніше це було в окремому ШІ-сервісі Sora від OpenAI й тільки для власників платної версії ChatGPT. До речі, в Sora тепер можна генерувати не тільки відео, але й зображення.