Хостинг для будь-яких потреб — VPS від 135 гривень на місяць 👉

ШІ Gemini від Google впадає в паніку під час проходження старої гри Pokémon

Дослідники Google DeepMind виявили, що Gemini 2.5 Pro може впадати в режим паніки, коли грає в ранні версії ігор серії Pokémon. Цей стан погіршує продуктивність штучного інтелекту і його здатність до міркування.

Залишити коментар
ШІ Gemini від Google впадає в паніку під час проходження старої гри Pokémon

Дослідники Google DeepMind виявили, що Gemini 2.5 Pro може впадати в режим паніки, коли грає в ранні версії ігор серії Pokémon. Цей стан погіршує продуктивність штучного інтелекту і його здатність до міркування.

Про це повідомляє TechCrunch з посиланням на звіт Google DeepMind. На думку деяких дослідників вивчення того, як моделі ШІ грають у відеоігри, може принести користь.

Протягом останніх кількох місяців два розробники, не пов’язані з Google та Anthropic, створили стріми на Twitch під назвою «Gemini Plays Pokémon» та «Claude Plays Pokémon», де будь-хто може в режимі реального часу спостерігати, як ШІ намагається пройти дитячу відеогру, випущену понад 25 років тому. Стріми демонструють процес «роздумів» ШІ й відображають природною мовою те, як модель оцінює проблему і знаходить розв’язання.

Хоча прогрес цих моделей ШІ вражає, вони все ще не дуже добре грають у Pokémon. Gemini потрібно сотні годин, щоб розібратися в грі, яку дитина може пройти за набагато коротший час. Але дослідників цікавить не час проходження, а те, як саме ШІ поводиться під час гри.

«Під час проходження гри Gemini 2.5 Pro потрапляє в різні ситуації, які змушують модель імітувати «паніку», — йдеться у звіті.

Цей стан «паніки» може призвести до погіршення продуктивності моделі, оскільки ШІ може раптово припинити використовувати певні інструменти, що є в його розпорядженні, протягом певного періоду гри. Хоча ШІ не мислить і не відчуває емоцій, його дії імітують те, як людина може приймати неправильні, поспішні рішення під впливом стресу.

«Ця поведінка спостерігалася в достатній кількості окремих випадків, щоб учасники чату Twitch активно помітили її», — відзначають дослідники.

ШІ Claude також проявив деякі цікаві особливості поведінки під час своїх проходжень. В одному випадку він помітив закономірність: коли всі його покемони втрачають здоров’я, персонаж гравця «зникає» і повертається до Pokémon Center.

Коли Claude застряг у печері гори Мун, він помилково припустив, що якщо він навмисно змусить усіх своїх покемонів втратити очки здоров’я, то його перенесуть через печеру до центру у сусідньому місті. Однак гра працює не так. Коли всі покемони гинуть, гравець повертається до того центру, який використовував останнім, а не до найближчого географічно. Тому глядачі спостерігали, як ШІ фактично намагався вбити себе в грі без жодної користі.

Скриншот зі стріму Gemini 2.5 Pro, яка грає в Pokémon

Попри свої недоліки, ШІ може перевершити людських гравців у декількох аспектах. Наприклад Gemini 2.5 Pro ШІ здатний вирішувати головоломки з надзвичайною точністю. За допомогою людини ШІ створив агентні інструменти (підказки орієнтовані на конкретні завдання) для вирішення головоломок з камінням в грі та пошуку ефективних маршрутів до пункту призначення.

«Маючи лише підказку, що описує фізику валунів, та опис того, як перевірити правильний шлях, Gemini 2.5 Pro здатний одним рухом вирішити деякі з цих складних головоломок з каменюками, які необхідні для проходження Victory Road», — йдеться у звіті.

Оскільки ШІ виконав значну частину роботи самостійно, в Google припускають, що Gemini 2.5 Pro можливо зможе створювати ці інструменти й без втручання людини.

Раніше компанія Every, яка розробляє програмні продукти та надає навчальні послуги в галузі штучного інтелекту, створила переосмислення класичної історичної стратегічної гри «Дипломатія», в якій ШІ-моделі ChatGPT, Gemini, Claude, DeepSeek та інші грають за сім великих держав зразка 1901 року і змагаються за панування в Європі.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
«Чи спробує Gemini перехитрити своїх противників чи o3 вдарить Claude в спину і здобуде перемогу?». Компанія Every створила гру «Дипломатія» з ШІ-гравцями за якою можна спостерігати на Twitch
«Чи спробує Gemini перехитрити своїх противників, чи o3 вдарить Claude в спину і здобуде перемогу?». Компанія Every створила гру «Дипломатія» з ШІ-гравцями, за якою можна спостерігати на Twitch
По темi
«Чи спробує Gemini перехитрити своїх противників, чи o3 вдарить Claude в спину і здобуде перемогу?». Компанія Every створила гру «Дипломатія» з ШІ-гравцями, за якою можна спостерігати на Twitch
Sony запатентувала ШІ який може проходити гру замість гравця. Який сенс цієї функції
Sony запатентувала ШІ, який може проходити гру замість гравця. Який сенс цієї функції
По темi
Sony запатентувала ШІ, який може проходити гру замість гравця. Який сенс цієї функції
Ізраїльська ШІ-компанія Decart AI створили версію Minecraft зі штучним інтелектом. Ось що відомо про Oasis
Ізраїльська ШІ-компанія Decart AI створили версію Minecraft зі штучним інтелектом. Ось що відомо про Oasis
По темi
Ізраїльська ШІ-компанія Decart AI створили версію Minecraft зі штучним інтелектом. Ось що відомо про Oasis
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Головоломка киянина Quadline перемогла на фестивалі інді-ігор Google Play
Краса та меланхолія кінця світу. За що світ полюбив The Last of Us?
Краса та меланхолія кінця світу. За що світ полюбив The Last of Us?
Краса та меланхолія кінця світу. За що світ полюбив The Last of Us?
2 вересня 2022 — дата виходу ремейку The Last of Us, який отримав назву The Last of Us Part I. Доцільність випуску повного ремейку, який робили з нуля для не настільки старої гри ще стоїть під питанням. Але заслуг першоджерела він не зменшує. Адже 2013 року The Last of Us стала справжнім одкровенням для ігрової індустрії. Один із останніх ексклюзивів для PlayStation 3 остаточно вивів студію Naughty Dog у «вищу лігу», заодно продемонструвавши всьому світу, як можна робити ігри з акцентом на наратив. І на честь релізу рімейку ми вирішили згадати оригінал, який назавжди залишив слід у ігровій індустрії.
Професії у геймдеві. Хто такий левел-дизайнер і як ним стати?
Професії у геймдеві. Хто такий левел-дизайнер і як ним стати?
Професії у геймдеві. Хто такий левел-дизайнер і як ним стати?
Ми продовжуємо нашу рубрику, присвячену професіям у геймдеві. Тема нового матеріалу в ній — левел-дизайн. Його вважають підвидом геймдизайну, але все-таки практично кожна студія хоче окрему людину на позицію левел-дизайнера. Адже у цій спеціальності вистачає своїх нюансів та особливостей. Розібратися з ними всіма нам допоміг досвідчений левел-дизайнер зі студії Fractured Byte Дмитро Нестеренко. Також він веде свій блог Game Designer Notes про геймдизайн в цілому, в якому розбирає багато цікавих нюансів розробки ігор.
1 коментар

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.