👁️👁️ 300 000 криптанів встановили собі Trustee Plus - гаманець з криптокарткою. Чого чекаєш ти? 👉

Значительный скачок в анимации изображений: Google представила ИИ-инструмент VLOGGER, который может оживлять фотографии

Исследователи из Google Research разработали новую систему искусственного интеллекта VLOGGER, которая может создавать реалистичные видео людей, говорящих, жестикулирующих и двигающихся — только по одной фотографии.

Оставить комментарий
Значительный скачок в анимации изображений: Google представила ИИ-инструмент VLOGGER, который может оживлять фотографии

Исследователи из Google Research разработали новую систему искусственного интеллекта VLOGGER, которая может создавать реалистичные видео людей, говорящих, жестикулирующих и двигающихся — только по одной фотографии.

Согласно исследовательской работе под названием «VLOGGER: мультимодальная диффузия для синтеза воплощенного аватара», для создания видео достаточно одной фотографии и аудиозаписи, из которых ИИ сделает аватара, говорящего соответственно аудио, делает соответствующие выражения лица, движения головой и жесты руками. VentureBeat.

Исследователи использовали диффузионные модели, недавно показавшие превосходную производительность в создании очень реалистичных изображений из текстовых описаний. Расширив их в область видео и научившись на огромном новом наборе данных, команда смогла создать систему искусственного интеллекта, которая может оживлять фотографии очень убедительным способом.

Исследовательская работа Google Research

«В отличие от предыдущей работы, наш метод не требует обучения каждого человека, не полагается на распознавание лица и кадрирование, генерирует полное изображение (а не только лица или губы) и учитывает широкий спектр сценариев (например, видимые торсы или различные субъектные идентичности), которые имеют решающее значение для правильного синтеза общающихся людей», — пишут авторы.

Ключевым фактором стала подготовка огромного нового набора данных под названием MENTOR, содержащая более 800 000 разнообразных идентификаторов и 2200 часов видео — на порядок больше, чем было доступно ранее. Это позволило VLOGGER научиться создавать видео людей разной этнической принадлежности, возраста, одежды, поз и свиты без предвзятости.

Технология может автоматически дублировать видео на других языках, просто заменяя аудиодорожку, легко редактировать и заполнять недостающие кадры в видео, а также создавать полноценные видеоролики о человеке из одного кадра.

Исследовательская работа Google Research

Эту технологию можно использовать для создания фотореалистичных аватаров для виртуальной реальности и игр, виртуальных помощников и чат-ботов, которые будут более привлекательными и выразительными.

Google считает, что VLOGGER поможет создавать «разговорных агентов», которые могут взаимодействовать с людьми естественным путём посредством языка, жестов и зрительного контакта. «VLOGGER можно использовать как самостоятельное решение для презентаций, обучения, рассказа, общения в интернете с низкой пропускной способностью, а также как интерфейс для текстового взаимодействия человека с компьютером», — пишут авторы статьи.

Исследовательская работа Google Research

Однако эта технология также имеет потенциал для злоупотребления, например для создания дипфейков. Поскольку созданные искусственным интеллектом видео становятся более реалистичными и их легко сделать, это может усугубить проблемы, связанные с дезинформацией и цифровыми подделками.

VLOGGER все же имеет ограничение. Сгенерированные видеоролики относительно короткие и имеют статический фон. Люди не передвигаются в 3D-среде.

Читайте главные IT-новости страны в нашем Telegram
Читайте главные IT-новости страны в нашем Telegram
По теме
Читайте главные IT-новости страны в нашем Telegram
Из-за санкций Microsoft Amazon и Google закрывают доступ российским компаниям к своим облачным сервисам
Из-за санкций Microsoft, Amazon и Google закрывают доступ российским компаниям к своим облачным сервисам
По теме
Из-за санкций Microsoft, Amazon и Google закрывают доступ российским компаниям к своим облачным сервисам
Новое крупное соглашение - Apple ведет переговоры с Google о добавлении ИИ Gemini на iPhone
Новое крупное соглашение — Apple ведет переговоры с Google о добавлении ИИ Gemini на iPhone
По теме
Новое крупное соглашение — Apple ведет переговоры с Google о добавлении ИИ Gemini на iPhone
УЧАСТЬ В АЗАРТНИХ ІГРАХ МОЖЕ ВИКЛИКАТИ ІГРОВУ ЗАЛЕЖНІСТЬ. ДОТРИМУЙТЕСЯ ПРАВИЛ (ПРИНЦИПІВ) ВІДПОВІДАЛЬНОЇ ГРИ.
Ліцензія видана ТОВ "СЛОТС Ю.ЕЙ." на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 15.09.23 (рішення КРАІЛ №245 від 31.08.2023); ТОВ "СЛОТС Ю.ЕЙ." – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 26.04.2021 (рішення КРАІЛ №150 від 12.04.2021); ТОВ «СПЕЙСИКС» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 08.02.2021 (рішення КРАІЛ №34 від 02.02.2021); ТОВ «ГЕЙМДЕВ» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 16.02.2021 (рішення № 47 від 10.02.2021).
Читайте также
Искусственный интеллект DALL-E научился дорисовывать картины. Как это выглядит
Искусственный интеллект DALL-E научился дорисовывать картины. Как это выглядит
Искусственный интеллект DALL-E научился дорисовывать картины. Как это выглядит
Головоломка киевлянина Quadline победила на фестивале инди-игр Google Play
Головоломка киевлянина Quadline победила на фестивале инди-игр Google Play
Головоломка киевлянина Quadline победила на фестивале инди-игр Google Play
Харьковская художница нарисовала новый дудл для Google в День Независимости Украины
Харьковская художница нарисовала новый дудл для Google в День Независимости Украины
Харьковская художница нарисовала новый дудл для Google в День Независимости Украины
Специалистов Google теперь будут кормить роботы. Они также умеют давать полезные (и не очень) советы
Специалистов Google теперь будут кормить роботы. Они также умеют давать полезные (и не очень) советы
Специалистов Google теперь будут кормить роботы. Они также умеют давать полезные (и не очень) советы

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментариев пока нет.