Как (не) сгенерировать нейроарт за 1 минуту
Многие видели множество примеров чудесного нейроарта, с сочными цветами, отличной детализацией и интересным дизайном персонажей (включая фурри), здесь, на любимом реакторе.
Но когда смотришь подборки нейроарта паками, начинаешь замечать некоторую шаблонность:
1. Персонаж часто стоит в полу/полный рост в кадре, строго на переднем фоне, строго по середине.
2. Персонаж обычно имеет нейтральное или "игривое" выражение лица.
3. "Руки" персонажа или в нейтральной позиции или держат какой то предмет.
4. Персонаж всегда смотрит на "зрителя".
5. Задний фон не имеет никакой ценности - он или размыт или заполнен чем получится (в лучшем случае это будет пейзаж или будет использована лора для создания толпы).
Я не умоляю заслуг тех кто потратил время и силы и сгерировал данные изображения - пожалуйста продолжайте в том же духе (я - дерьмовый нейронщик и большую часть своих работ отправляю в корзину).
В 2023 существует несколько инструментов которые позволяют не просто делать бесконечные паки с портретами персонажей, а реализовывать целые сюжеты, так же как это сделал художник в классическом понимании этого слова.
Правда это намного сложнее чем кажется и чаще всего ничего кроме фрустрации чувствовать вы не будете.
К тому же результат скорее всего окажется среднего или низкого качества по сравнению со священным, простым и предпочтительным путем которым является подгонка промта, набора лор/ликорисов и текстуальных инверсий (боже храни masterpiece, best quality, high quality, highres, high res, absurdres, absurd res, 4k, 2k, intricate, high detail, shaded - даже если половина из этого не делает ничего).
Если у вас все выходит и без выкрутасов ниже - вы очень удачливый и скорее всего настоящий мастер нейрогенерации, надеюсь у вас есть канал на ютубе и приватный дискорд с курсами, пожалуйста киньте мне ссылку в комментариях.
Начну с того, что так же как классический художник должен делать стадики, учить анатомию и разные виды проекций, не забывая рисовать в любое свободное время, так и нейронщик должен делать ровным счетом тоже самое и извлекать опыт даже же из дерьмовых работ. Разница лишь в том что нейронщик может ошибаться быстрее.
Название/тема нейроарта - "Корпоратив"
Условия - несколько персонажей в кадре в разных позах, взаимодействие персонажей, общая идея (сюжет) изображенного.
Это будет странно, но когда я думаю о корпоративах единственный образ который у меня возникает в голове Stańczyk (он же "Шут в красном"). Почему бы не использовать это как референс? Нам лишь надо придумать как обыграть дополнительных персонажей и создать хоть какое то слабое подобие конфликта происходящего на холсте шедевра на который мы ссылаемся.
Пусть наша вариация шута в красном будет также в полном отрешении от вечеринки (корпоратива) происходящего вокруг него. Пусть для контраста с ним в комнате будет кто-то еще кто дух безудержного веселья поддерживает целиком и полностью и как бы противопоставляет его персонажу слева.
Мое грубое приближение этого описания вышло таким
Шут занимает левую часть изображения, празднующие левую, действие происходит на кухне (что неловко показано кофе машиной и столешницей). Как видно я решил пойти по пути композиции, причем решил сгенерировать все 3 части финального изображения отдельно.В ретроспективе это было ошибкой - нужно было использовать latent couple и объединить 2 (пара празднующих) и 3 (кухня как задний фон) просто поделив изображение на две зоны и создав два подзапроса через AND. Возможно бы тогда даже вышло inpaintнуть всего шута или разбить на 3 зоны вместо двух и добавить еще один подзапрос. Но я решил что 3 отдельных изображения будет легче контролировать, ведь всё слепить на одном холсте в редакторе и потом заапскейлить не составит труда. Я ошибся и я признаю это.Технические детали и процесс.Модель - yiffymix v34Семлер DPM++ 2M Karras, 50 шаговПервое изображение "шута" далось довольно легко.2 control net unit:1. Изображение шута кропнул и загнал в препроцессор openpose_hands - с "сидеть" проблем не было, а вот в районе пальцев вышло месило, удалил их, создал болванки и переделал вручную, заняло минут 10 - 15.2. Reference, сила 0.45, balanced, тот же кропнутый шут что и в первом юните.Результаты почти сразу вышли +- приличными Промт позитивный: uploaded on e621, 1girl, solo, female fox, office lady, white body, white fur, ((black long hair)), ((red blouse)), spread legs, dark red thighhighs, zettai ryouiki, black shoes, high heels, fluffy tail, ((sad)), sitting, wooden brown chair, small breasts, cleavage, (((simple background))), masterpiece, best quality, high quality, highres, high res, absurdres, absurd res, 4k, 2k, intricate, high detail, shadedПромт отрицательный: deformityv6, bwu, boring_e621_v4, multiple tails, blur, depth of field(первые три это текстуальные инверсии).Второе изображение "празнующие" было еще проще поскольку тут хватило промта, я потратил некоторое время на различные комбинации лор для поцелуя, потому что бедные никак не попадали друг другу в рот, но в итоге лучшие версии вышли без них просто через сотню мусорных изображений.Промт позитивный: uploaded on e621, 2girl, ((female furry fox)), standing, full body, yuri, side view, looking at each other, kissing, french kiss, braid, couple, office lady, white shirt, red skirt, santa hat, claws, detailed fluffy fur, neck tuft, ((barefoot)), cleavage, groping, (((simple background))), masterpiece, best quality, high quality, highres, high res, absurdres, absurd res, 4k, 2k, intricate, high detail, shaded, no humans
Промт негативный: deformityv6, bwu, boring_e621_v4, multiple tails, blur, depth of field, human, human ears
Изображение три: долгая и мучительная подборка промта, попытки использования других моделей для интерьеров, я так с ним замучился что даже не сохранил промты.
Модель упорно рисовала каких то людей, фурей, химер - они пили кофе, сидели в венчике из гирлянд, везде были раковины и какие то артефак так что никакой инпейт или удаление не помог бы.Таким образом имея 3 картинки в своих мерзких человеческих руках я пошел совершать военное преступление и объединять это все в photopea.
Даже неискушённый может указать на сколько плохо это получилось.
Пара выглядело плоско, они стояли не под тем углом, на них неправильно падал свет, единственный их плюс была не такая отвратительная обводка как у шута, заинпейтинная шапка тоже была ни туда ни сюда, задник не сочетался с персонажами... Вероятно в этот момент нужно было отправить все в корзину и начать за нового уже с latent couple, да чёрт с ним пусть будет 4 под запроса еще и шапку через зону сделаем!
Но я решил продолжить и выставив denoising streight где то в районе 0.5 принял волевое решение использовать oil medium, oil painiting в img2img с ultimate upscale s/d скриптом в надежде что ну вот щас изображение побьется по плиточкам, каждая плиточка апскельнится, применится новый стиль и все само станет хорошо и все сразу впишется. В реальности такого не произошло и пришлось около 3х часов делать различные варианты такого апскейла и руками править артефакты постоянно то добавляя то удаляя стиль художников и насилуя denoising streight полнузок.
Апскейл тайлами упорно ничего не делал где хотелось бы, изменял или перевирал детали, но отступать было уже не куда.
Где то 2 часу страданий я понял что пара в дальнем углу всегда будет выглядеть неверно с точки зрения перспективы чтобы я не делал, поэтому я подвинул их в ближний угол, это не слишком уж помогло но имело хоть какой то эффект на общую композицию.
Что по итогу?
Довольно странная картинка которую можно было сделать намного легче.
(хотя я всё ещё считаю что фотобаш и img2img работают довольно эффективно если применены прямыми руками).
Мне довольно стыдно за качество этой работы, но не жаль потраченного времени.
Это дерьмовый арт, но это все равно мой "Деловой (нейро) стиль - Корпоратив"