Вернуться к содержанию номера: «Горизонт», № 7(45), 2023.
Что делать, если вам нужен рисунок, но нет желания платить несколько тысяч иллюстратору? Раньше пришлось бы окончить художественную школу, потом училище, а затем и профильный вуз (потому что квалификации, полученной в училище, чаще всего не хватит); теперь же всего-то и надо дочитать текст до конца.
Цель этой статьи — в двух словах показать, как призвать на помощь научный прогресс и сделать нейросеть своим инструментом и надёжным соратником. Покорять роботов будем на примере проекта Leonardo.ai. Тут многие зададутся вопросом — почему же не всем известный Midjourney? Ответ простой: не так давно Midjourney перешла на платную подписку. Хорошо, что не все разработчики такие жадные, а то плакало бы наше обещание халявных рисунков.
Для регистрации понадобится почтовый ящик, в идеале гугл, немного терпения и…
Учётная запись в «Дискорде». Не спешите закрывать эту статью! Все те, кто считает «Дискорд» местом для гиков, могут не волноваться. Он понадобится только для одного действия — зайти и нажать на ссылку, общаться или просить помощи не придётся. Стоит заметить, что Leonardo — просто оболочка, которая использует другую нейросеть Stable diffusion. Разница в удобном интерфейсе и настройках от разработчиков. Но если вы сами способны установить и настроить Stable diffusion, то зачем вообще это читаете?
Начнём регистрацию с заглавной страницы leonardo.ai:

Выбираем «Get Early Access» и в открывшемся окне вводим почту. Если укажете Google, потом можно будет войти через его учётную запись. «На этом всё!» — хотелось бы написать, но нет:

Переходим к наиболее тяжёлой части операции — жмём «Join Discord». И смело принимаем приглашение:

Если вы готовы общаться с кожаными мешками, а не только с нейросетью, стоит сюда вернуться. На канале можно выведать секреты мастерства роборабовладельчества или поучаствовать в еженедельных заданиях. Но это потом и по желанию, сейчас нужно найти бота и перейти куда следует:

Ищем слева папку «priority-early-access». Внутри ждёт сообщение с приветствием от бота и нужной ссылкой в конце. После перехода откроется форма регистрации:

Пишем почту и подтверждаем, что уже присоединились к сообществу. Теперь внимательно! Нужно корректно ввести имя пользователя в «Дискорде», иначе дело не выгорит. Прозвище можно указать любое:

Отправив заполненную форму, возвращаемся на leonardo.ai и жмём «Launch App»:

И во всплывшем окне подтверждаем принадлежность культу «Белого листа», нажав на «Yes, I am whitelisted»:

Далее заходим через Google или, в очередной раз вбив всё ту же почту, попадаем куда надо:

Давайте разбираться. Справа сверху находятся «Featured Models», что на человеческом означает набор настроек для робота — назовём их моделью. В зависимости от варианта результат будет разным. Обладая знанием английского или умением копировать слова в переводчик, можно прочитать аннотацию к каждой модели.
Например, RPG 4.0, которую мы будем использовать в примере, хороша для рисования фотореалистичных РПГ-героев:

Там же, справа находятся популярные работы других пользователей. Скажу по секрету, их можно самым наглым образом тырить. Выбирайте любую и копируйте всё, что угодно: начиная от концепции и заканчивая картинкой целиком. Или используйте для подражания, если хотите такую же, но немного другую.
Но самое интересное спряталось справа. Без подробностей это выглядит следующим образом:
- Home — дом, начальная страница.
- Community feed — рисунки сообщества.
- Personal feed — ваши рисунки.
- Training & Datasets — тренировка нейросети, если вам мало базовых моделей.
- Finetuned Models — готовые модели.
- Al Image Generation — самое вкусное, создание картинок.
- Al Canvas — а это приятная добавка, возможность редактировать рисунок.
- Texture Generation — изготовление текстуры.
Не отвлекаясь на изображения анимешных тяночек, уверенно следуем в «Al Image Generation». И попадаем в жутко сложный на первый взгляд редактор. Не стоит пугаться и паниковать. В правой части находится окно запроса «prompt». Это область для ввода ключевых слов, по которым нейросеть поймёт, что вы от неё хотите.
Чтобы наладить контакт с бездушной машиной, потребуется определённая сноровка. Вот пара важных принципов:
1. Задайте основной объект. Опишите его первыми ключевыми словами. Если хотите что-то более точное, не скупитесь на описания. Больше деталей и прилагательных. В нашем случае это будет не просто «Дракон», а «Страшный зубастый дракон летит над городом будущего». Вы уже догадались, что будем рисовать дракона? Почему? Это элементарно — всем нравятся драконы!
2. Используйте архетипы и бренды. Смело включайте их в запрос. Чтобы не писать: «летающий ящер с гребнем», воспользуйтесь словом «дракон» — или, если хотите получить «бородатого скандинавского мужчину с топором», употребите «варвар». Для придания стилизации включайте в запрос названия брендов, например: «дракон Микки Маус» или «дракон работник КФС».
3. Задайте стиль. Если вы хотите получить рисунок в манере Валеджо или Гигера, так и пишите: «стиль Валеджо». Можно совмещать имя творца и художественное направление, например: «картина в стиле футуризма рисовал Шишкин».
4. Думайте как фотограф. Вы можете задать любые условия. Описать, каким будет освещение: «яркий голубой свет», указать положение камеры: «близкое расстояние», её расположение: «вид с высоты птичьего полёта». Если вы профи, можно задать тип объектива, фокусное расстояние, выдержку и т. д.
5. Учите английский. Шутка, просто используйте переводчик, робот иностранный — русский язык не разумеет.
Кроме ключевых слов «prompt», есть возможность задать набор отрицаний «negative prompt», нажав специальную галочку. Здесь перечисляем то, что видеть не хотим. У нейросети проблемы с рисовкой конечностей и подсчётом необходимых частей тела. Поэтому полезным будет вписать сюда: «сросшиеся пальцы, три руки, три глаза, лишние руки, третья нога, мутации».
Для большего понимания вопроса можно изучить чужие подборки в галерее работ «Community feed».
Кроме ключевых слов, в окошке рядом выбираем модель:

Пробежимся по другим настройкам и возможностям в левой части редактора:
- Number of images — сколько рисунков делать за раз.
- Prompt Magic — включение авторского рендера от разработчиков, улучшает результат, но удваивает стоимость.
- High contrast — повышение контрастности, если всё во тьме.
- Prompt Magic Strength — настройка силы воздействия рендера разработчиков на результат.
- Image Dimension — разрешение картинки, влияет на стоимость рисования.
- Guidance Scale — насколько точно нейросеть следует ключевым словам.
- ControlNet — возможность загрузить свою картинку как эталон.
- Tilling — рисование текстур.
- Image to image и image prompt — инструменты для использования собственных изображений в качестве образца или концепции.
Кроме базовых, есть ещё пара платных опций. Раз уж вспомнили про деньги — подписка тут по желанию. За любые действия — расчёт в местных токенах, которых насыпают по сто пятьдесят в день. Рисунок без дополнительных прибамбасов стоит один. После покупки подписки все ваши работы можно сделать частными. Тогда по условиям пользовательского соглашения права на них принадлежат вам. Но, если планируете коммерческое применение, лучше дополнительно проконсультироваться, автор — не юрист.
Давайте уже наконец рисовать нашего ящера! Пользуясь фишками, описанными выше, создаём запрос «prompt»: «полёт дракона, город будущего, стиль Гигера, зубастый, страшный, высокая детализация, хорошее качество, уменьшение масштаба (zoom out)».
Задаём отрицание «negative promt»: «две головы, лишние глаза, лишние конечности, плохое качество, двойное изображение, грубые пропорции, нечёткое изображение». Не забываем — сперва перевести на английский!
Модель возьмём RPG 4.0 с разрешением по умолчанию. Все остальные эффекты отключаем ради экономии авторских токенов. «Guidance Scale» ставим на рекомендованное значение «7». Жмём «Generate» и смотрим на парад драконов-мутантов. Понадобилось с десяток попыток, прежде чем нашёлся приемлемый результат. Слова «стиль Гигера» сбивают робота, нейросеть не может понять, почему глупый человек хочет рисунок в гигеровском стиле, но без второй головы и костей по всему экрану. Остановимся на таком варианте:

Уже неплохо, но качество текстур, третье крыло из спины, нога из попы и лишняя пасть не позволяют признать результат успешным. Давайте для начала улучшим качество при помощи рендера. Жмём на одну из иконок в левом нижнем углу, я выбрал «Upscale Image Alternate». Всего рендера четыре, с разными свойствами, а ещё можно стереть фон или отдалить изображение.

Рисунок стал более чётким, теперь находим иконку «Edit in canvas» и попадаем в редактор изображений. Нам нужно найти «Draw Mask» — слева на панели инструментов. При помощи кисти закрашиваем лишнее крыло:

В строке «prompt» вводим: «задний план, город», жмём генерировать:

Крыло исчезло, но дракон получился какой-то надкусанный. По той же схеме закрашиваем область спины, только в «prompt» пишем: «спина дракона, кожа дракона, хребет, высокое качество, чешуя».

Время заняться пятой ногой, выделяем, вводим: «задний фон, небо», генерируем. Дополнительно обрабатываем место у второй лапы со словами: «крыло дракона, кожа, чешуя».

Так же можно поступить с лишней пастью и дополнительно поработать со спиной. Но мы-то знаем, что лучшее — враг хорошего, поэтому оставим так!
Подведём итог. Как и было обещано — потратив примерно час, мы смогли создать уникальную иллюстрацию! Профессиональные художники рвут волосы с головы, ведь они навсегда потеряли потенциального клиента. Ну и как не анонсированный бонус — можно устроиться работать иллюстратором в сериал «Дом дракона» и нарисовать им наконец нормальных ящеров ко второму сезону!
Небольшое послесловие. В статье я вскользь упоминал о проблемах нейросети с адекватным изображением некоторых частей тела и их количеством. Над этим работают, и каждая новая версия программы справляется всё лучше и лучше. Но всё же, если вам надоело по десять раз жать «генерировать» в поисках приемлемого результата, можно взять на вооружение ещё несколько приёмов. Для начала вообще отключить рисование кистей — такая опция есть, например, в Midjourney. Потом можно попробовать поместить в руки какой-то предмет или добавить описание в ключевые слова: «в руках портфель», «пальцы нормальной длины пять штук». Так же следует поступить с остальными частями тел, которые не получаются. Нейросеть пихает вам трехглазых гоблинов — напишите: «гоблин двуглазый». Часто помогает смена ракурса, при виде сбоку роботу надо рисовать всего один глаз и одну руку, что снижает вероятность ошибки. А главный совет — не стесняйтесь экспериментировать, тогда рано или поздно обязательно станете настоящим нейрохудожником!