💰🚀 USDT, BTC, ETH - це все просто купляється в Trustee Plus в пару кліків. Встановлюй 👉

Учений тижнями намагався змусити Midjourney згенерувати один банан. Що він хотів довести

Сучасні нейромережі здатні створювати фантастичні зображення, особливо якщо їм задати правильну команду. Але ШІ все ще може стикатися з проблемами буквально на рівному місці.

Як у випадку, коли доктор Деніел Хук попросив нейромережу Midjourney зробити «один банан, що відкидає тінь на сірий фон», але ШІ щоразу видавав зображення з двома бананами.

Залишити коментар
Учений тижнями намагався змусити Midjourney згенерувати один банан. Що він хотів довести

Сучасні нейромережі здатні створювати фантастичні зображення, особливо якщо їм задати правильну команду. Але ШІ все ще може стикатися з проблемами буквально на рівному місці.

Як у випадку, коли доктор Деніел Хук попросив нейромережу Midjourney зробити «один банан, що відкидає тінь на сірий фон», але ШІ щоразу видавав зображення з двома бананами.

Ця проста похибка настільки зацікавила науковця, що він провів кілька тижнів, бомбардуючи нейромережу різними варіаціями свого запиту, намагаючись отримати один єдиний банан. І йому це зрештою вдалося.

Чому цей експеримент був важливий, Хук написав у публікації для журналу Digital Science, яка вийшла під заголовком «Проблема самотнього банана». 

Які запити використовувалися для генерації

За словами вченого, коли всі 4 первинних зображення містили більше одного банана, він подумав, що припустився помилки, і почав пробувати інші формулювання.

Зображення з сайту digital-science.com

Але ні «ідеальний стиглий банан на чистому сірому тлі, що відкидає легку тінь, гіперреалістичний», як і «один ідеальний стиглий банан на чистому сірому тлі, що відкидає легку тінь, гіперреалістичний фотографічний» та навіть «ОДИН ідеальний банан на однорідній світло-сірій поверхні, знятий зверху, гіперреалістичний фотографічний» не дали необхідного результату. На всіх фотографіях зображено два або більше бананів.

Прохання додати «невидимих мавп», які б тримали один банан, також не допомогли. Ще й мавпи виходили дуже навіть помітними, а інколи мали банановий колір. Інопланетяни також не міняли ситуацію. 

Бажану кількість бананів дав лише промт «Один банан сам по собі відкидає тінь на сірому тлі» (A single banana on its own casting a shadow on a grey background).

Чому один банан такий важливий

На думку Деніела Хука — це яскравий приклад того, наскільки сучасні генеративні нейромережі недосконалі. Результати їхньої роботи можуть вражати, але такі помилки вказують на істотні прогалини в технології.

«ШІ на нинішньому рівні розвитку не сприймають об'єкти так, як це робимо ми — вони розуміють закономірності, що часто зустрічаються. Їхня реальність принципово відрізняється від нашої — вона народжується не у фізичному світі, а в логічному», — пояснює Хук

За його словами, з розвитком ШІ людям стає все легше з ними взаємодіяти, виникає враження, що вони розуміють. Та все ж, «без відчуття фізичного світу ШІ має проблеми з концепцією одного банана».

«Усвідомлення того, що ШІ не розуміє реальний світ і людей так, як ми, є важливим кроком», — говорить Деніел Хук. Це необхідно для взяття на себе відповідальності за розвиток цих технологій при створенні нових інструментів.

P. S. Чому «проблема самотнього банану» Деніела Хука може бути перебільшена

Як експеримент ми попросили нейромережу DALL-E згенерувати «A single banana casting a shadow on a grey background». І ШІ, який значно поступається Midjourney в створенні зображень, одразу видав картинку з чотирма чудовими бананами.

Висновки лишаємо на ваш розсуд.

DALL-E
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Не тільки Midjourney. Розробник створив добірку з семи безплатних альтернатив нейромережі для AI-генерації картинок
Не тільки Midjourney. Розробник створив добірку з семи безплатних альтернатив нейромережі для AI-генерації картинок
По темi
Не тільки Midjourney. Розробник створив добірку з семи безплатних альтернатив нейромережі для AI-генерації картинок
OpenAI випустила нейромережу Point-E яка генерує 3D-моделі. Ось як це працює
OpenAI випустила нейромережу Point-E, яка генерує 3D-моделі. Ось як це працює
По темi
OpenAI випустила нейромережу Point-E, яка генерує 3D-моделі. Ось як це працює
Вийшла друга покращена версія нейромережі Stable Diffusion що перетворює текст в зображення
Вийшла друга покращена версія нейромережі Stable Diffusion, що перетворює текст в зображення
По темi
Вийшла друга покращена версія нейромережі Stable Diffusion, що перетворює текст в зображення
Нейромережам пророкують що вони вб’ють мистецтво. Але чи так це якщо поки що роботи можуть лише копіювати та красти?
Нейромережам пророкують, що вони вб’ють мистецтво. Але чи так це, якщо поки що роботи можуть лише копіювати та красти?
По темi
Нейромережам пророкують, що вони вб’ють мистецтво. Але чи так це, якщо поки що роботи можуть лише копіювати та красти?
Розробник з Австралії створив інтерактивну гру-виставку на основі зображень від нейромереж
Розробник з Австралії створив інтерактивну гру-виставку на основі зображень від нейромереж
По темi
Розробник з Австралії створив інтерактивну гру-виставку на основі зображень від нейромереж
УЧАСТЬ В АЗАРТНИХ ІГРАХ МОЖЕ ВИКЛИКАТИ ІГРОВУ ЗАЛЕЖНІСТЬ. ДОТРИМУЙТЕСЯ ПРАВИЛ (ПРИНЦИПІВ) ВІДПОВІДАЛЬНОЇ ГРИ.
Ліцензія видана ТОВ "СЛОТС Ю.ЕЙ." на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 15.09.23 (рішення КРАІЛ №245 від 31.08.2023); ТОВ "СЛОТС Ю.ЕЙ." – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 26.04.2021 (рішення КРАІЛ №150 від 12.04.2021); ТОВ «СПЕЙСИКС» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 08.02.2021 (рішення КРАІЛ №34 від 02.02.2021); ТОВ «ГЕЙМДЕВ» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 16.02.2021 (рішення № 47 від 10.02.2021).
Читайте також
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент. Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok з’явилася нова функція «Розумний фон». З її допомогою як фон для тіктоків можна підставляти згенеровані нейромережею зображення. Редакція dev.ua протестувала цю технологію і ділиться своїми враженнями.
3D-модель людини тепер можна створити за допомогою смартфона. Усе завдяки нейромережі NeuMan
3D-модель людини тепер можна створити за допомогою смартфона. Усе завдяки нейромережі NeuMan
3D-модель людини тепер можна створити за допомогою смартфона. Усе завдяки нейромережі NeuMan

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.