💳 Термінова новина! Trustee Plus — найкраще рішення для розрахунку криптою 👉

Значний стрибок в анімації зображень: Google представила ШІ-інструмент VLOGGER, який може оживляти фотографії

Дослідники з Google Research розробили нову систему штучного інтелекту VLOGGER, що може створювати реалістичні відео людей, які розмовляють, жестикулюють і рухаються — лише з однієї фотографії. 

Залишити коментар
Значний стрибок в анімації зображень: Google представила ШІ-інструмент VLOGGER, який може оживляти фотографії

Дослідники з Google Research розробили нову систему штучного інтелекту VLOGGER, що може створювати реалістичні відео людей, які розмовляють, жестикулюють і рухаються — лише з однієї фотографії. 

Згідно з дослідницькою роботою під назвою «VLOGGER: мультимодальна дифузія для синтезу втіленого аватара», для створення відео достатньо лише однієї фотографії та аудіозапису, з яких ШІ зробить аватара, що говорить відповідно аудіо, робить відповідні вирази обличчя, рухи головою і жести руками, пише VentureBeat.

Дослідники використали дифузійні моделі, які нещодавно показали чудову продуктивність у створенні дуже реалістичних зображень із текстових описів. Розширивши їх у сферу відео та навчившись на величезному новому наборі даних, команда змогла створити систему штучного інтелекту, яка може оживляти фотографії дуже переконливим способом.

Джерело: дослідницька робота Google Research

«На відміну від попередньої роботи, наш метод не вимагає навчання кожної людини, не покладається на розпізнавання обличчя та кадрування, генерує повне зображення (а не лише обличчя чи губи) і враховує широкий спектр сценаріїв (наприклад, видимі торс або різноманітні суб’єктні ідентичності), які мають вирішальне значення для правильного синтезу людей, які спілкуються», — пишуть автори.

Ключовим фактором стала підготовка величезного нового набору даних під назвою MENTOR, який містить понад 800 000 різноманітних ідентифікаторів і 2200 годин відео — на порядок більше, ніж було доступно раніше. Це дозволило VLOGGER навчитися створювати відео людей різної етнічної приналежності, віку, одягу, поз і оточення без упередженості.

Технологія може автоматично дублювати відео іншими мовами, просто замінюючи аудіодоріжку, легко редагувати й заповнювати відсутні кадри у відео, а також створювати повноцінні відеоролики про людину з одного кадру.

Джерело: дослідницька робота Google Research

Цю технологію також можна використовувати для створення фотореалістичних аватарів для віртуальної реальності та ігор, віртуальних помічників і чат-ботів, які будуть більш привабливими та виразними.

Google вважає, що VLOGGER допоможе створювати «розмовних агентів», які можуть взаємодіяти з людьми природним шляхом за допомогою мови, жестів і зорового контакту. «VLOGGER можна використовувати як самостійне рішення для презентацій, навчання, розповіді, спілкування в інтернеті з низькою пропускною здатністю, а також як інтерфейс для текстової взаємодії людини з комп’ютером», — пишуть автори статті.

Джерело: дослідницька робота Google Research

Однак ця технологія також має потенціал для зловживання, наприклад, для створення дипфейків. Оскільки створені штучним інтелектом відео стають більш реалістичними та їх легко зробити, це може загострити проблеми, пов’язані з дезінформацією та цифровими підробками.

VLOGGER все ж має обмеження. Згенеровані відео відносно короткі та мають статичний фон. Люди не пересуваються в 3D-середовищі. 

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Через санкції Microsoft Amazon та Google закривають доступ російським компаніям до своїх хмарних сервісів
Через санкції Microsoft, Amazon та Google закривають доступ російським компаніям до своїх хмарних сервісів
По темi
Через санкції Microsoft, Amazon та Google закривають доступ російським компаніям до своїх хмарних сервісів
Нова велика угода — Apple веде переговори з Google про додавання ШІ Gemini на iPhone
Нова велика угода — Apple веде переговори з Google про додавання ШІ Gemini на iPhone
По темi
Нова велика угода — Apple веде переговори з Google про додавання ШІ Gemini на iPhone
УЧАСТЬ В АЗАРТНИХ ІГРАХ МОЖЕ ВИКЛИКАТИ ІГРОВУ ЗАЛЕЖНІСТЬ. ДОТРИМУЙТЕСЯ ПРАВИЛ (ПРИНЦИПІВ) ВІДПОВІДАЛЬНОЇ ГРИ.
Ліцензія видана ТОВ "СЛОТС Ю.ЕЙ." на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 15.09.23 (рішення КРАІЛ №245 від 31.08.2023); ТОВ "СЛОТС Ю.ЕЙ." – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 26.04.2021 (рішення КРАІЛ №150 від 12.04.2021); ТОВ «СПЕЙСИКС» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 08.02.2021 (рішення КРАІЛ №34 від 02.02.2021); ТОВ «ГЕЙМДЕВ» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 16.02.2021 (рішення № 47 від 10.02.2021).
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Харківська художниця намалювала новий дудл для Google на День Незалежності України
Харківська художниця намалювала новий дудл для Google на День Незалежності України
Харківська художниця намалювала новий дудл для Google на День Незалежності України
Фахівців Google тепер годуватимуть роботи. Вони також уміють давати корисні (і не дуже) поради
Фахівців Google тепер годуватимуть роботи. Вони також уміють давати корисні (і не дуже) поради
Фахівців Google тепер годуватимуть роботи. Вони також уміють давати корисні (і не дуже) поради

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.