🚀💳 Trustee Plus - більше ніж криптогаманець з європейською платіжною карткою. Спробуй 👉
Вікторія ГорбікШІ
13 березня 2025, 14:57
2025-03-13
ШІ-експерт протестував безоплатну функцію редагування зображення за текстовим описом Google DeepMind. Ось його висновки
Близько місяця тому Google випустила експериментальну версію ШІ-моделі Gemini 2.0 Pro Experimental. Крім того, модель «міркування» Gemini 2.0 Flash Thinking тоді стала доступною в додатку Gemini. Спочатку новими функціями могли скористатись передплатники Gemini Advanced, але наразі вона доступна безоплатно у Google AI Studio.
Експерт із піару, комунікацій і застосування технологій AI Олексій Мінаков спробував, як це без дизайнера не просто генерувати зображення, а ще й легко редагувати їх. Він поділився результатами свого експерименту, як редагувати зображення просто за текстовим описом.
Близько місяця тому Google випустила експериментальну версію ШІ-моделі Gemini 2.0 Pro Experimental. Крім того, модель «міркування» Gemini 2.0 Flash Thinking тоді стала доступною в додатку Gemini. Спочатку новими функціями могли скористатись передплатники Gemini Advanced, але наразі вона доступна безоплатно у Google AI Studio.
Експерт із піару, комунікацій і застосування технологій AI Олексій Мінаков спробував, як це без дизайнера не просто генерувати зображення, а ще й легко редагувати їх. Він поділився результатами свого експерименту, як редагувати зображення просто за текстовим описом.
«"Розмовне редагування» потроху стане мейнстримом», — зазначив Олексій Мінков, додавши, що, найімовірніше, це стане новою нормою в найближчому майбутньому. «Крафтове редагування ручками в Photoshop залишиться в минулому», — додав він і поділився своїми напрацюваннями.
Як скористатись функцією
Безоплатно редагувати зображення за текстовим промптом Google DeepMind можна у Google AI Studio. Для цього:
обираєте модель Gemini 2.0 Flash Experimental,
завантажуєте зображення,
пишете промпт, що змінити на ньому.
Експерт зауважив, що на відміну від інших сервісів, особливість функції у Google DeepMind в тому, що в одному вікні є можливість взаємодії через загальний промпт і для різних задач, від фону до зміни-додавання об'єктів, без необхідності навіть виділення областей на зображенні.
Кольоризація чорно-білого фото
Олексій завантажив чорно-біле фото Львова 1964 року та просто попросив текстом зробити його кольоровим. Через 7 секунд отримав відредаговане кольорове фото.
Кольоризація чорно-білого фото (Фото Facebook)
Head of Product Роман Астафʼєв в коментарях до посту Олексія додав, що він також спробував скористатись цією функцією, але його результати не задовольнити. «Щось не робить, видає помилку після обробки фото», — повідомив Роман. За його словами, продакт завантажив рандомне чорно-біле фото з Google, де зображені люди або архітектура. Крім того, він зауважив, якщо подивитись на семпл на скріні — фото стало гірше. «Обличчя та тіло розмите. Виглядає як не колорайз, а генеративка відмалювала фото з нуля», — розповів про свої враження Роман.
А у Марії Хоменко взагалі не вийшло розфарбувати фотографію. Вона поділилась скріном невтішних результатів спілкування із ШІ-моделлю.
Фото Facebook
Додати обʼєкт
Потім Олексій Мінаков завантажив зображення столу та просто попросив текстом додати на нього квіти. Ось, що вийшло.
Додаємо квіти на стіл (Фото Facebook)
Зміна фону
Далі Олексій завантажив фото із собою та просто попросив текстом змінити фон на космос.
Зміна фону (Фото Facebook)
Замість висновку
Олексій Мінаков підкреслив, що це експериментальний запуск фічі для тестування. «Тому відредаговане зображення ви отримаєте у розширенні не з високої роздільною здатністю. Чекаємо на повноцінний реліз», — додав він.
За його словами, цікаво, що редагування зображення робить не окрема модель для генерації зображень Imagine 3, а мультимодальна модель Gemini. Саме тому він радить не обмежуватися у використанні лише одним ШІ-інструментом типу ChatGPT, а бути відкритим до інших альтернативних сервісів. За словами Олексія, такий підхід не просто диверсифікує ризики, а ще й надасть доступ до особливих можливостей.
«OpenAI лише планують запустити в ChatGPT щось подібне найближчим часом», — згадує експерт.
Погоджуючись з тим, що у ШІ-перегонах у всіх виробників більшість функцій схожі, Олексій все ж зауважив, що є певні відмінності, які варті уваги. «У тому ж Gemini, наприклад, є деякі можливості, яких немає в ChatGPT, зокрема, витягування тез із відео на YouTube», — додав він і пояснив, що диверсифікація в такому випадку більше не про покупку платних пакетів, а саме про тримання в арсеналі декількох ШІ-сервісів з їх безоплатними можливостями.
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Хочете повідомити важливу новину? Пишіть у Telegram-бот
Головні події та корисні посилання в нашому Telegram-каналі