Нейромережам пророкують, що вони вб’ють мистецтво. Але чи так це, якщо поки що роботи можуть лише копіювати та красти?
Середина 2022 року у сфері технологій проходить під активне обговорення нейромереж і їхніх можливостей. Поки користувачі з усього світу генерують зображення сотнями за допомогою DALL-E 2 та аналогічних сервісів, усе частіше виникають розмови про те, що машини незабаром залишать людей творчості без роботи. Мовляв, художників, фотографів, дизайнерів та інших фахівців, які працюють із зображеннями в різних форматах, уже можна замінити на нейромережі.
Навіть звучать заяви, що подібні нейромережі вб’ють мистецтво в принципі. Що, звісно, зовсім не так. Адже нейромережі та мистецтво — це поняття із зовсім різних світів, нехай результат у них нібито один. Про різницю між ними й ітиметься в цьому тексті.
Витоки подібних гучних заяв лежать у банальному факті: сучасні нейромережі для генерації зображень справді роблять гарний контент. Та ж DALL-E 2 створює гідні картинки навіть за найскладнішими запитами. Щось подібне роблять і Midjourney з Dream.
До комерційного використання результатів нейромереж справа також доходить. Найяскравіший приклад — обкладинка Cosmopolitan, на створення якої пішло «лише 20 секунд». Тож практичне застосування в нейромереж теж знайшлося.
Утім, уже в цьому прикладі прихована омана. Адже 20 секунд пішло на генерацію фінального результату, а йому передували кілька днів підбору правильного запиту та складання ідеї, яку нейромережа зможе адекватно зрозуміти. У результаті дизайнерка Карен Ченг, яка займалася обкладинкою, прийшла до висновку, що поки DALL-E 2 — лише забавний інструмент, що допомагає креативному мисленню, не більше.
Аналогічних думок дотримується й автор Midjourney Девід Хольц. Він порівняв свою нейромережу з потоком води, тоді як суспільство бачить її хижаком. Вода теж здатна заподіяти шкоду, але все залежить від того, як її використати.
Хольц бачить у Midjourney «двигун креативу», а не заміну. Лише один із безлічі інструментів для людей творчості, нехай і досить незвичайний.
Якщо говорити виключно з технічної точки зору, то поки що нейромережі ніяк не можуть тягатися з творіннями художників навіть середньої руки. Адже роботам роботів просто не вистачає деталей та опрацювання. Сучасні художники можуть витрачати години на маленький клаптик тканини, що займає від сили відсотків п’ять від усього малюнка. Нейромережам подібні нюанси поки невідомі.
Але окей, адже здається, що виправлення цього нюансу — лише питання часу. Уже є вузькоспеціалізовані нейромережі в дусі ThisPersonDoesNotExist від Nvidia (генерує обличчя вигаданих людей), що видають фотореалістичні результати. Так що розрив у технічному плані ставатиме все менше та менше.
Однак справа не в ньому, а в ідейній складовій зображень. І тут варто трохи згадати, як узагалі працюють нейромережі.
Відтворюючи високе
Будь-яка нейромережа заснована на роботі штучних нейронів, кожен з яких визначає вагу якогось коефіцієнта, що генерує результат. Скажімо, стать людини на фотографії або вид тварини.
Усі нейромережі навчають за допомогою прикладів, причому важливий момент: їм не говорять конкретно, що означає той чи інший результат. Якісь внутрішні зв’язки між категоріями нейромережі вибудовують самостійно.
Тому для нейромереж ключове значення має вибірка матеріалів, на якій проходить навчання. У нейромереж для генерації зображень це, власне, самі зображення. Десятки тисяч, сотні, мільйони. Завдяки ним і DALL-E 2 здатна зрозуміти, коли ви хочете побачити від неї пшеничне поле, а коли — безкрайнє море.
Тільки сама нейромережа умовну різницю між двома морями ніколи не зрозуміє. Для неї всі вони — лише чисельні параметри, чіткий зв’язок між коефіцієнтами нейронів, що призводить до стабільного результату. У той час як для людини навіть найдрібніші відмінності в переданні картини моря можуть призвести до різного сприйняття.
Найкраще для ілюстрації цієї тези порівнювати стилі різних за сенсом, але схожих за зовнішніми ознаками художників. Наприклад, Бексіньського та Ґігера. Їхну похмуру творчість часто об’єднують у різноманітних проявах, а в основних мотивах їхніх картин можна знайти помітні паралелі. Тільки ось думки всередині в них разюче відрізняються.
Для нейромереж особливої ж різниці немає. Вони чіпляються за якісь умовні зовнішні ознаки, повністю ігноруючи, чому саме художники творили саме так. Через це щось нове створити в машин ніколи не вийде.
А те, що нам у нейромереж здається новим, насправді лише об’єднання кількох уже відомих параметрів. Лише вкрай ускладнені запити на кшталт «Х плюс Y», не більше.
Звідси і велике поширення графічних нейромереж, які наслідують усілякі стилі й арттечії. Адже в нинішніх реаліях не так складно згодувати алгоритмам усі картини умовного Сальвадора Далі, а потім дозволити людям генерувати обкладинки альбомів, голлівудських зірок і героїв мультфільмів у дусі його робіт.
Утім, ще Пабло Пікассо казав, що «великі художники крадуть», тож якоїсь надтрагедії в подібному підході нейромереж до творчості немає. Однак саме слово «творчість» у високому значенні має на увазі наявність якихось ідей. А ось із ними в нейромереж серйозні проблеми.
Порожнє всередині
Будь-яке мистецтво завжди варто розглядати в контексті історії, тому повернімося трохи назад — у середину 20 століття. Світове мистецтво тоді переживало чергову кризу думок. І вона спричинила появу двох важливих тенденцій.
Перша — це домінування жанру поп-арту, тобто популярного мистецтва. Його суть полягає в поваленні творів мистецтва з розваг для еліти до чогось для найширших мас. Прості форми, зрозумілі явища, максимальна доступність — усе це добре характеризує поп-арт.
Друга — спроби творців уникнути стовідсоткових результатів у творчості, прагнення розбавити процес творення елементами випадковості. Наприклад, художники розливали фарбу відрами на полотнища або малювали патьоками акварелі, зовсім їх не контролюючи. У результаті цінність картин підвищувалася, адже їх створювали не лише люди, а й наче сама доля з волею нагоди.
Сучасні нейромережі для генерації зображень узяли важливі складові двох цих тенденцій. Вони розвивають ідеї поп-арту, перетворюючи вже не просто споглядання, а й створення мистецтва на максимально доступне заняття. Адже жодних технічних навичок не треба, щоб скласти простенький запит та отримати на його основі набір зображень різного ступеня краси. А неможливість повністю контролювати генерацію вносить у все елементи випадковості.
Тільки ось і поп-арт, і прагнення художників до випадковостей засновані на довгих роздумах і багатовіковій історії мистецтва. Обидва підходи підкреслюють низку проблем суспільства на той час. Адже той самий поп-арт на рівні підтексту ставив питання деградації мистецтва, яка незмінно йшла за його популяризацією.
У разі зображень від нейромереж нічого такого немає. Вони лише намагаються відповідати вашим запитам, прораховуючи за внутрішніми коефіцієнтами відповідність кожного нейрона. Будь-який випадковий результат — це, найімовірніше, якийсь збій, під час якого вийде щось не дуже виразне, але ніяк не витвір мистецтва.
Будь-які абстрактні запити там призводять лише до результатів, які виявилися найближчими до заданої абстракції на етапі навчання мережі. Жодної магії тут немає.
Найсмішніше, що з такої точки зору, самі нейронні мережі, а не результати їхньої роботи, — це цілком собі сучасне мистецтво. З незвичайною реалізацією та грамотною ідеєю про тиражування високого, зведення його цінності до нуля.
Утім, у такому контексті нейромережі практично не розглядають. Зараз це швидше бізнес і демонстрація технологічного прогресу. Що, утім, також певною мірою впливає на них як на об’єкт мистецтва.
Прозаїчність
1984 року вийшла книжка «Борода поліцейського наполовину сконструйована». Це збірка поезії, написана повністю за допомогою програми Racter. Тоді ж пішли розмови, що скоро комп’ютери самі писатимуть поезію, прозу та публіцистику, а вся робота, пов’язана з текстом, зникне.
З того часу минуло майже сорок років. І в 2022 році максимум, на який здатні текстові нейромережі в побутовому застосуванні, — це скласти актуальну коротеньку відповідь на електронний лист або в LinkedIn. Звичайно, деякі експериментальні тексти від нейромереж трапляються, але лише як цікава забава, а не стабільна індустрія.
Розмови про те, що роботи скоро знищать якусь творчу професію, у принципі йдуть мало не з тих часів, коли з’явилася сама концепція роботів. Але щось жодна з таких спеціальностей так і не зникла.
І це з огляду на те, що будь-яку творчість можна розкласти до набору конкретних параметрів. Представити картини у форматі пікселів, музику — послідовністю звукових хвиль різних частот, поезію — строгою структурою із заданої кількості складів у певному ритмі.
На цих параметрах можна натренувати нейромережу — і ось уже готовий контент. Так уже, скажімо, роблять музику.
Тільки такий підхід завжди буде заганяти творчість у межі зазначених параметрів, від яких нейромережам ніяк не втекти. Так, вона нескінченно об’єднуватиме їх у найхимерніших комбінаціях, але за межі свого навчання вийти не зможе.
Тобто навіть якщо нейромережі стануть стандартом для створення зображень, мистецтво полягатиме в тому, щоб створювати їх як завгодно, але тільки не за допомогою нейронних мереж. Ця вічна гонитва творців до недосяжних вершин новизни триває вже багато століть — і кінця їй ніколи не буде.
Ви не подумайте нічого такого, ніхто тут не хоче принижувати переваги нейронних мереж для створення контенту. Адже написати програмний код, який зможе пояснити машинам абстрактні поняття на кшталт стилю та настрою, — це вже велике досягнення.
Імовірно, саме його велич і підкупила багатьох настільки, що тепер вони бачать у нейромережах велику істину та порятунок для всіх. Тільки ось майстри творчості та навіть автори самих нейронок ставляться до них в рази більш прозаїчно. Лише як до ще одного способу виявити людського генія у всій його красі.
Адже нехай нескінченно круто перетворювати фразу на зображення, але справжня творчість — це набагато більше, ніж картинки на запити.
УЧАСТЬ В АЗАРТНИХ ІГРАХ МОЖЕ ВИКЛИКАТИ ІГРОВУ ЗАЛЕЖНІСТЬ. ДОТРИМУЙТЕСЯ ПРАВИЛ (ПРИНЦИПІВ) ВІДПОВІДАЛЬНОЇ ГРИ.
Ліцензія видана ТОВ "СЛОТС Ю.ЕЙ." на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 15.09.23 (рішення КРАІЛ №245 від 31.08.2023); ТОВ "СЛОТС Ю.ЕЙ." – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 26.04.2021 (рішення КРАІЛ №150 від 12.04.2021); ТОВ «СПЕЙСИКС» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 08.02.2021 (рішення КРАІЛ №34 від 02.02.2021); ТОВ «ГЕЙМДЕВ» – на провадження діяльності з організації та проведення азартних ігор казино у мережі Інтернет від 16.02.2021 (рішення № 47 від 10.02.2021).
Робочий інструмент, арттерапія або «скляна стеля». Чи може нейромережа Midjourney замінити художників і в чому її цінність
Проєкт американського вченого Девіда Хольца спричинив хайп світового масштабу. Його нейромережа Midjourney генерує зображення та картинки за текстовим запитом. І зараз її тестують як професійні художники, так і звичайні люди.
Артдиректорка у GrandMA Studios Беата Куркуль також приєдналася до руху та розповіла про особливості нейронки, чи зможе вона замінити художників і що вже вміє Midjourney, а також — де її можна застосовуватися.