Олександр КузьменкоГоряченькое
3 июля 2023, 18:33
2023-07-03
Ученый неделями пытался заставить Midjourney сгенерировать один банан. Что он хотел доказать
Современные нейросети способны создавать фантастические изображения, особенно, если им задать правильную команду. Но ИИ все еще может сталкиваться с проблемами буквально на ровном месте.
Как в случае, когда доктор Дэниел Хук попросил нейросеть Midjourney сделать «один банан, отбрасывающий тень на серый фон», но ИИ каждый раз выдавал изображение с двумя бананами.
Современные нейросети способны создавать фантастические изображения, особенно, если им задать правильную команду. Но ИИ все еще может сталкиваться с проблемами буквально на ровном месте.
Как в случае, когда доктор Дэниел Хук попросил нейросеть Midjourney сделать «один банан, отбрасывающий тень на серый фон», но ИИ каждый раз выдавал изображение с двумя бананами.
Эта простая погрешность настолько заинтересовала ученого, что он провел несколько недель, бомбя нейросети разными вариациями своего запроса, пытаясь получить один единственный банан. И ему это в конце концов удалось.
Почему этот эксперимент был важен, Хук написал в публикации для журнала Digital Science, вышедшей под названием «Проблема одинокого банана».
Какие запросы использовались для генерации
По словам ученого, когда все 4 первичных изображения содержали более одного банана, он подумал, что допустил ошибку, и начал пробовать другие формулировки.
Изображение с сайта digital-science.com
Но ни «идеальный спелый банан на чистом сером фоне, отбрасывающий легкую тень, гиперреалистичный», ни и «один идеальный спелый банан на чистом сером фоне, отбрасывающий легкую тень, гиперреалистический фотографический» и даже «ОДИН идеальный банан на однородном светло-сером» поверхности, снятой сверху, «гиперреалистический фотографический» не дали необходимого результата. На всех фотографиях были изображены два или более бананов.
Просьба добавить «невидимых обезьян», которые держали бы один банан, также не помогли. Еще и обезьяны получались очень даже заметными, а иногда имели банановый цвет. Инопланетяне тоже не поменяли ситуацию.
Желаемое количество бананов дал лишь промт «Один банан сам по себе отбрасывает тень на сером фоне» (A single banana on its own casting a shadow on a grey background).
Почему один банан так важен
По мнению Дэниела Хука, это яркий пример того, насколько современные генеративные нейросети несовершенны. Результаты их работы могут поразить, но такие ошибки указывают на существенные пробелы в технологии.
«ИИ на нынешнем уровне развития не воспринимают объекты так, как это делаем мы — они понимают часто встречающиеся закономерности. Их реальность принципиально отличается от нашей — она рождается не в физическом мире, а в логическом», — объясняет Хук.
По его словам, с развитием ИИ людям становится все легче с ними взаимодействовать, создается впечатление, что они понимают. И все же, «без ощущения физического мира ИИ испытывает проблемы с концепцией одного банана».
«Осознание того, что ИИ не понимает реальный мир и людей так, как мы, важный шаг», — говорит Дэниел Хук. Это необходимо для взятия на себя ответственности за развитие этих технологий при создании новых инструментов.
P. S. Почему «проблема одинокого банана» Дэниела Хука может быть преувеличена
В качестве эксперимента мы попросили нейросеть DALL-E сгенерировать «A single banana casting a shadow on a grey background». И ИИ, значительно уступающий Midjourney в создании изображений, сразу издал картинку с четырьмя замечательными бананами.
Roosh запускает новую образовательную платформу AI HOUSE CLUB для ML/AI-специалистов и дата сайнтистов. Рассказываем, как подать заявку и чему будут учить
Как нейросети видят свободную и независимую Украину? Тест dev.ua
Нейронные сети для генерации изображений видят мир по-своему, их логику понять порой совершенно невозможно. Но все-таки хочется. И в честь Дня Независимости Украины редакция dev.ua решила провести небольшой эксперимент.
Мы задали четырем разным нейронным сетям пять одинаковых запросов: «флаг Украины», «День Независимости Украины», «украинский Крым», «победа Украины» и «украинцы». Получившимися результатами мы делимся с вами ниже.
В TikTok теперь можно генерировать фон при помощи нейросети. Мы протестировали ее и делимся результатами
В TikTok появилась новая функция «Умный фон». С ее помощью в качестве фонов для тиктоков можно подставлять сгенерированные нейросетью изображения. Редакция dev.ua протестировала эту возможность и делится своими впечатлениями.