Рабочий инструмент, арт-терапия или «стеклянный потолок». Может ли нейросеть Midjourney заменить художников и в чем ее ценность
Проект американского ученого Дэвида Хольца поднял хайп мирового масштаба. Его нейросеть Midjourney генерирует изображения и картинки по текстовому запросу. И сейчас ее тестируют как профессиональные художники, так и обычные люди.
Арт-директор в GrandMA Studios Беата Куркуль тоже присоединилась к движению и рассказала об особенностях нейронки, сможет ли она заменить художников и что уже умеет Midjourney, а также — где может применяться.
На главной странице сайта тут, создатели описывают Midjourney как независимую исследовательскую лабораторию, которая изучает новые способы мышления и расширяет творческие способности человечества.
Проект возник в феврале 2022 года. Сейчас над ним работает команда из 11 человек, включая Дэвида Хольца, и большое количество консультантов, которые занимаются дизайном, человеческой инфраструктурой и искусственным интеллектом.
Как происходит работа с Midjourney
Работа с нейросетью происходит в Discord через личный аккаунт пользователя.
Профиль в Midjourney содержит документацию, короткий, но, как говорит Беата, очень толковый гайд, все работы, которые пользователь генерит с помощью нейронки, и подборку работ других пользователей. Что хорошо, работы сохраняются с так называемым промтом, с текстовым запросом, по которому они сгенерировались.
После перехода в Join the beta и регистрации на сайте нейронки новые пользователи получают приглашения и попадают на главный канал в Discord, где описаны правила и содержаться объявления.
В левой части меню пользователям нужно выбрать newbies, дальше в чате написать /imagine и написать текстовый запрос на английском языке. Он может быть любого содержания, кроме откровенно запрещенных вещей.
По промту бот выдает 4 эскиза, из которых необходимо выбрать, с какими будет дальнейшая работа. Есть возможность выбрать опцию, когда на выбранные варианты могут быть даны еще по 4 иллюстрации на каждый. Но на то, как нейросеть развивает эти варианты, пользователь влиять не может.
Все эти варианты можно скачать в профиль. В финальном варианте можно дать команду боту увеличить изображение максимально и его сохранить в профиль.
Сформированный промт не корректируется, нейросеть работает с тем, что есть или необходимо сгенерировать новый. Кроме того, на один и тот же текстовый запрос нейросеть не выдаст одно и то же изображение и каждый арт нейронки дается в единственном экземпляре, повторить она не может.
В настоящее время у Midjourney есть несколько режимов работы:
бесплатный — право на генерацию 25 изображений;
платные планы: basic — $10 в месяц и 200 картинок, standart — $30 в месяц и план для корпоративных клиентов с сильно большей ценой.
Чтоб не ждать следующего месяца, после исчерпания пакета можно приобрести дополнительное время работы с нейросетью.
Кроме того, в планах учитывают и количество сгенеренных картинок, и время, проведенное в работе с нейросетью.
Начало работы происходит в серии каналов для новичков. После того как пользователь нагенерировал определенное количество работ, бот предлагает присоединиться к более продвинутым пользователям и добавляет в канал GENERAL.
Как сформировать промт
Запросы для нейросети формируются на английском без ограничения в количестве слов. И недавно в качестве дополнительного референса разработчики добавили возможность добавлять к запросу картинки.
В текстовом запросе можно указывать не только существительные и конкретное описание предметов, а конкретизировать, какое необходимо освещение, время года, под какого художника нужна стилизация и можно даже задать размеры работы. Все это описано в гайде.
Некоторые энтузиасты отдельно разработали приложения, которые генерят текстовые промты для нейросети, где можно выбрать в приложении опции света, рендер, стилизация и другое, а потом просто скопировать готовый запрос боту. Это делает их создание более комфортным и понятным. Время сбора промта может занять часы в зависимости от результата, который нужно получить в итоге.
Где используют Midjourney
Арт-художница говорит, что некоторые художники используют завершенные изображения, работая над текстовыми промтами нейросети.
Как она считает, если нужна эпичная красивая картинка, тогда подойдет и арт Midjourney без доработки, либо есть задачи рассказать историю или что-то проиллюстрировать, и в голове автора уже сформировалась своя визия, тогда следом за генерацией идет художественная доработка.
По ее словам, иллюстрации нейронки могут быть применимы в геймдеве в первую очередь для концепт-художников, причем для разработки практически всего, от персонажей до техники и пропсов.
«Конечно, вот так сразу сгенерить и пустить в игровой арт — скорее всего, нет. Хотя я не удивлюсь, если найдутся энтузиасты, которые соберут какую-то небольшую игру, опираясь только на арт, сделанный нейросетью. По крайней мере комиксы и мангу уже начали делать», — прогнозирует Беата.
Она говорит, что сама за три недели тестирования нейросети уже начала использовать сгенерированные Midjourney изображения для своей работы. А это облегчает до 70–80% работы арт-специалиста в зависимости от цели, которую он преследует.
Нейросеть или художники
На вопрос, заменит ли нейросеть художников, Беата ответила, однозначно нет, хотя первоначально такой страх возник.
Кроме того, нейросеть пока недостаточно умная, чтоб самостоятельно, без участия художника генерить арты, акцентирует Беата.
Да и собрать нормальный текстовый промт это тоже отдельная фундаментальная задача. Ведь если иллюстрация нужна для работы, а не только ради эксперимента, то конечный результат нужно визуализировать, и только после этого приступать к текстовому запросу.
«Зловещая долина»
Многие люди делятся впечатлениями про тягостное впечатление от изображений нейросети, и не только Midjorney. Его называют эффектом «зловещей долины», то есть, как сформулировал японский ученый-робототехник Масахиро Мори, робот или, в данном случае, изображение, сделанное роботом, вызывает отталкивающие ощущение у людей. Причиной этого он называет мелкие несоответствия, которые вызывают чувство страха и дискомфорт.
Беата отмечает, что у художников такое ощущение возникает редко в силу того, что они с подобными работами сталкиваются и взаимодействуют гораздо чаще.
Плюсы
Все пользователи нейросети могут видеть все сгенерированные работы, а также сохранить любое изображение и посмотреть текстовые запросы к ним.
«В основном она может помогать на стадии концептирования. На стадии рендера уже сильно вряд ли, потому что игровая графика требует большей четкости и аккуратности. Мы в кэжуал-играх себе такого не можем позволить, потому что игроки взвоют», — говорит Беата.
Но если использовать выданную Midjorney картинку как основу, дорисовав только зум-зоны и все, что нужно для взаимодействия, то это вполне возможно.
Кроме того, художница отмечает, что существенная полезность такого инструмента в том, что он стимулирует фантазию. По словам арт-дитектора, в этом контексте нейронка выдает иногда очень необычные ракурсы, формы, комбинации цвета, текстуры и композиции. Это полезно для иллюстраторов, которые в поиске незаезженных и более свежих подходов к изображению темы. Для обычных художников в личном творчестве нейросеть может значительно ускорить процесс.
Кроме того, Беата считает, что нейросеть — отличный инструмент для арт-терапии и для людей, которые находятся в творческом кризисе.
За три недели, в течение которых Беата тестирует Midjorney, нейросеть уже научилась лучше работать со светом, распознает контражур, искусственное освещение различных видов, ночное освещение. Она уже лучше работает с ракурсами.
Лучше всего у нейросети получается стилизация под разных художников.
Минусы
Работы в Midjourney, как ни крути, все одинаковые по стилистике, отмечает Беата, поэтому специалист, если решает использовать их, дорабатывает изображения.
Беата рассказывает, что остаются еще вопросы технического плана, чтоб создатели Midjorney немного облегчили интерфейс, возможно, инкорпорировали сразу генератор промтов, потому что сейчас, в процессе генерации своей картинки в общем канале, чтоб добраться до своей картинки, нужно пролистать еще 20–30 чужих. Это раздражает.
Работа с ботом в приватном режиме периодически прерывается, отмечает Беата.
Менее дисциплинированных людей нейросеть может расслабить. То есть, художники могут углубиться в текстовый запрос, брать сгенерированные нейросетью арты и больше ничего не делать.
«Для кого-то она может сработать как стеклянный потолок, художник может подумать, что и так хорошо, и больше не развивать эту идею. Но, я думаю, что такие люди отсеются».
Кроме того, она затягивает и, опять же, без четкого тайм-менеджмента, на работу с ней можно потратить очень много времени.
Есть нюанс, как нейросеть Midjourney генерит изображения с персонажами. А тут, по словам Беаты, случаются баги именно в анатомии.
«Чуть покосившееся лицо, нарушенная линия глаз, один глаз больше другого, оно не так сильно бросается в глаза, но эффект от этого раздражающий и в любом случае, это нужно подправлять»
С точки зрения художницы, нейронка выдает арты с нечеловеческой анатомией, убер-четкостью текстур или наоборот запыленностью и грязью. Конечно, тут зависит от выбора стилизации.
Кроме того, точно попадаются баги с грязноватыми текстурами, черными прожилками. Но это может корректироваться текстовым запросом.
Резюме
В ближайшем будущем нейросеть точно не заменит художника, а даже арты с хорошо прописанным промтом требуют доработки. Нейросеть уже может использоваться как инструмент для арт-специалистов разных направленностей.
По сути, нейросеть работает как конструктор, иллюстратор накидывает туда кубики из идей, но для этого идея должна сформироваться в голове.
И в итоге художник должен будет брать стилус и подрисовывать, вносить полутона и другие корректировки, которые ему нужны, в арт от нейронки.
Как нейросети видят свободную и независимую Украину? Тест dev.ua
Нейронные сети для генерации изображений видят мир по-своему, их логику понять порой совершенно невозможно. Но все-таки хочется. И в честь Дня Независимости Украины редакция dev.ua решила провести небольшой эксперимент.
Мы задали четырем разным нейронным сетям пять одинаковых запросов: «флаг Украины», «День Независимости Украины», «украинский Крым», «победа Украины» и «украинцы». Получившимися результатами мы делимся с вами ниже.
В TikTok теперь можно генерировать фон при помощи нейросети. Мы протестировали ее и делимся результатами
В TikTok появилась новая функция «Умный фон». С ее помощью в качестве фонов для тиктоков можно подставлять сгенерированные нейросетью изображения. Редакция dev.ua протестировала эту возможность и делится своими впечатлениями.
Нейросетям пророчат, что они убьют искусство. Но так ли это, если пока роботы могут всего лишь копировать и воровать?
Середина 2022 года в сфере технологий проходит под активное обсуждение нейросетей и их возможностей. Пока пользователи со всего мира генерируют изображения сотнями при помощи DALL-E 2 и аналогичных сервисов, все чаще возникают разговоры о том, что роботы скоро оставят людей творчества без работы. Мол, художников, фотографов, дизайнеров и прочих специалистов, работающих с изображениями в разных форматах, уже можно заменить нейросетями.
Даже звучат заявления, что подобные нейросети убьют искусство в принципе. Что, конечно, совсем не так. Ведь нейросети и искусство — это понятия из совсем разных миров, пускай результат у них якобы один. О разнице между ними и пойдет речь в этом тексте.
Хотите сообщить важную новость? Пишите в Telegram-бот
Главные события и полезные ссылки в нашем Telegram-канале