Європейські вчені створили ШІ-модель WANDR, яка може генерувати природні людські рухи для віртуальних аватарів
WANDR зможе згенерувати рухи, які дозволять аватарам взаємодіяти з їхнім віртуальним середовищем, наприклад, взяти чашку кави.
WANDR зможе згенерувати рухи, які дозволять аватарам взаємодіяти з їхнім віртуальним середовищем, наприклад, взяти чашку кави.
WANDR зможе згенерувати рухи, які дозволять аватарам взаємодіяти з їхнім віртуальним середовищем, наприклад, взяти чашку кави.
Нова ШІ-модель була розроблена командою вчених з Інституту інтелектуальних систем Макса Планка, Німеччина, та Швейцарської вищої технічної школи Цюриха, пише Tech Xplore.
Одна мета дослідження має більш глибинний характер — з’ясувати, що потрібно для створення віртуальних аватарів, здатних поводитися, як справжні люди. Що по суті означає, навчити міркувати про світ, пересуватися в ньому, ставити цілі та намагатися їх досягати.
Якщо говорити про практичну сторону застосування розробки, WANDR допоможе у майбутньому створювати контент для відеоігор, VR-додатків, анімаційних фільмів та розважальних програм, дозволяючи персонажам, схожим на людину, виконувати більш реалістичні рухи тіла.
Щоб згенерувати природні людські рухи для аватарів, вчені використовували два методи. Перше — навчання з підкріпленням (RL) для опанування аватарами нових навичок. Другий — створення набору даних, що містить людські демонстрації, а потім у використанні його для навчання моделі машинного навчання.
«RL, дуже простими словами, — це навчання навичок через досвід, отриманий шляхом спроб і помилок. Для нашого завдання агент повинен був би спробувати всілякі випадкові рухи на початку навчання, поки йому не вдасться спочатку правильно стояти, потім ходити, орієнтуватися на ціль, рухатися до неї й, нарешті, дотягнутися до неї рукою», — пояснює один з вчених Маркос Діоматаріс. — «Цей метод не обов’язково потребує набору даних, але він може вимагати великих обсягів обчислень, а також виснажливої розробки винагород для агента, щоб запобігти неприродній поведінці (наприклад, надавати перевагу повзанню, а не ходьбі під час пересування)».
На відміну від RL, навчальні моделі з використанням наборів даних надають віртуальному агенту багатшу інформацію про навичку, а не дозволяють йому з’ясовувати цю інформацію самостійно. Хоча зараз існують різні великі набори даних, що містять демонстрації рухів людини, дуже мало з них включають рухи дотягування, які команда також хотіла б відтворити в аватарах.
«Надаючи пріоритет реалістичності рухів, ми вирішили вивчати цю навичку на основі даних, — каже Діоматаріс. «Ми представляємо метод, який може використовувати як великі набори даних з різними загальними рухами, так і менші набори даних, які спеціалізуються на досягненні людиною мети».
Діоматаріс та його колеги вперше розробили навчальну задачу, яка була скептичною до існування міток цілей. Цей ключовий крок дозволив WANDR навчитися загальних навичок навігації на великих наборах даних, використовуючи при цьому марковані дані, отримані з менших наборів даних.
«Наразі не вистачає двох основних частин, які ми плануємо дослідити в майбутньому, — додав Діоматаріс. «По-перше, аватари повинні мати можливість використовувати великі та необроблені набори відеоданих, щоб навчитися рухатися та взаємодіяти зі своїм віртуальним світом, і на додаток до цього, вони повинні мати можливість досліджувати свій віртуальний світ та вчитися на власному досвіді. Ці два напрямки є основними способами, за допомогою яких люди також набувають досвіду: виконуючи дії й вивчаючи їх наслідки, а також спостерігаючи за іншими й навчаючись на їхньому досвіді».