Эти изображения были созданы Stable Diffusion (SD) и так называемой Checkpoint Merge или, говоря по-русски, модели Deliberate с помощью множества моих текстовых подсказок, кучи времени, некоторого опыта работы в Adobe Photoshop (хотя в этих изображениях он и аналоги не применись ни разу), а также встроенного использования контроля диффузии при помощи ControlNet, OpenPose и Inpaint для ежедневного "Нейро-Челенджа" в одной группе в Telegram.
К сожалению, я пока ни разу не победил, но можно видеть, как я учусь давать "художнику" Stable Diffusion нужные подсказки, чтобы создать что-то, что мне наконец понравится. Я это пока так называю, так как нельзя сказать, что рисовал я, но и нельзя сказать, что работу выполняла только SD. Это совместная работа. И большую часть выполняет, несомненно, SD.
Вообще, хочется написать свои ощущения и мысли по поводу Stable Diffusion, Midjourney, DALL·E 2, ChatGPT, Notion AI (с некоторыми из которых я начал знакомство ещё в сентябре прошлого года), пока всё это бурно кипит во мне. Надеюсь написать текст побольше чуть попозже.
А пока оцените, насколько SD и я удачно соединили вместе наборы тем для ежедневного "Нейро-Челенджа":
2.03.23. Цветущая сакура, капибара, робот (потрачено ок. 45 минут; только учился использовать SD, получил 4 лайка),
3.03.23. Рыцарь, болото, готика (потрачено ок. 6 часов; было тяжело, лицо молодой Бабы Яги так и не удалось показать, а поза с её выставленной левой ногой многими участниками группы даже не распозналась; получил 3 лайка).
5.03.23. Пират, пустыня, скелет (потрачено ок. 5 часов; было легче, но идеально сделать не получилось, лица всё ещё делались с трудом, а корабль был не в нужном масштабе; не получил ни одного лайка, хотя мне в целом понравилось).
8.03.23. Женщина, цветы, праздник (потрачено всего ок. 20 минут; не желал тратить больше, так как предыдущую работу вообще никто не оценил, это расстроило; внезапно получил 5 лайков - расстроился сильнее; благо, расстраиваюсь несерьёзно, скорее по-детски).
9.03.23. Турист, инопланетянин, город (потрачено ок. 4 часов; решил взяться хоть и за близкую для меня тему, но тем не менее нехотя из-за отсутствия оценок за пирата; просто влился в работу и не смог не завершить её, хотя делал в ночь, как и предыдущие работы, кроме девушки; в конце концов, с удивлением для себя обнаружил перед собой невероятно хорошую по моим ощущениям работу, и вскоре был вознаграждён... 7-ю лайками (хотя до победителя было далеко: у него было 15); ну хоть так).
Последняя работа, как мне кажется, отлично показывает, как мой мозг обучился понимать, как разговаривать с SD, чтобы получались достойные оценок работы. Но, повторюсь, без дополнительного контроля диффузии с помощью ControlNet, OpenPose и Inpaint такие работы практически невозможно сгенерировать обычными текстовыми запросами случайно. Это действительно можно назвать творчеством: нужно выставить сцену (Canny и (или) Depth в ControlNet), персонажей (OpenPose там же в ControlNet), нужно рассказать, "чего не надо тут, а что вот нужно тут" (Inpaint), какие цвета и эффекты нужно использовать, а какие нет, и что вообще должно быть в целом (Positive & Negative prompts) и т. п... В общем, продолжу свои мысли и ощущения позже в следующем посте.
А если среди вас есть те, кто тоже практикуется в генерации изображений, особенно используя контроль диффузии, ведь с ним вся работа больше похожа на творческий процесс, чем без (когда вы буквально подбрасываете монету в ожидании хорошей картинки), то напишите в комментариях, можете прикрепить свои работы, буду рад оценить и подписаться, если не подписан. А о генерации текста и моём опыте "общения" с ChatGPT я скорее напишу в следующем посте.
#SD #StableDiffusion #MJ #Midjourney