ТОП полезных и мусорных токенов
Зачастую можно увидеть применение одних и тех же токенов при генерации изображений, например: 4K, by greg rutkowski, adobe lightroom, masterpiece, Ultra-sharp focus, HDR и другие. Что же они значат и нужны ли они вообще, постараемся разобраться в данном материале.
Prompt слева
1girl,
cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting, trending on artstation
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
1girl, beautiful eyes, expressive smile, great skin, nice makeup, awesome hairstyle, pleasant appearance
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Важные замечания:
Самое важное, всё ниже сказанное - чисто субъективное мнение полученное на конкретной модели.
Токены применяемые повсеместно, в конечном счёте, несмотря на свою бесполезность могут с переменным успехом влиять на генерацию в каждом конкретном случае. Решающую роль будет играть обучение модели, а точнее - описание сопоставляемое изображениям, исходная модель, подмешиваемые Lora и прочие настройки. Поэтому однозначно утверждать о пригодности токенов и их влиянию нужно на конкретном примере.
Помимо субъективной оценки зависящей от человека оценщика, большую роль будет оказывать композиция.
В рядом расположенном примере Вы можете проверить себя на субъективность, вкус и цвет на одинаковой композиции и настройках. И если в левом примере использованы топ токенов используемых при генерациях на популярных ресурсах, то во второй генерации использовались обычные токены перечисляющие части композиции (в данном случае девушки) в позитивном ключе.
Перед дальнейшим ознакомлением с материалом, я рекомендую удерживать в уме простые правила:
1) нейросеть - скотина ленивая, не пнёшь не полетит! Поэтому, простое перечисление элементов композиции заставляет нейросеть стараться лучше.
2) Если Вы сами не понимаете что пишите, а бездумно копипастите всё подряд, то в случае применения билебердовых токенов нейросеть будет уходить в сторону увеличения детализации, повышения степени реалистичности и цветовой коррекции например в стиль типа Midjourney дабы угодить мешку с костями, и это вводит в заблуждение о необходимости применения тех или иных токенов. Следует повторить, степень полезности токенов определяется моделью, а точнее векторами весов в облаке параметров данных.
3) Если вы не знаете что делает токен - лучше не применяйте его. А если знаете и можете описать более чем двумя словами - то как раз лучше прописать эти самые слова. Таким образом вы получите контролируемый, конкретный эффект.
История
На ранних этапах применение токенов было обусловлено применяемыми моделями и источниками датасетов. В будущем необходимость в этом отпала, но привычка осталась. И если старенькие модели SD1.5 всё ещё требовательны к популярным токенам, то с выходом новых моделей с детальным описанием картины с помощью ИИ эта традиция постепенно уходит, а точнее переходит в плоскость человекоподобного языка без необходимости применения абстрактных токенов.
топ 100 применяемых токенов
На основе статьи из интернетов получим топ 100 применяемых токенов:
1 highly detailed 6062
2 sharp focus 3942
3 concept art 3539
4 intricate 3240
5 artstation 2841
6 digital painting 2840
7 smooth 2599
8 elegant 2574
9 illustration 2300
10 cinematic lighting 2152
11 octane render 2090
12 trending on artstation 2049
13 8 k 1864
14 dramatic lighting 1322
15 cinematic 1253
16 volumetric lighting 1242
17 greg rutkowski 1118
18 unreal engine 1046
19 realistic 1029
20 4 k 952
21 digital art 942
22 sharp 941
23 unreal engine 5 879
24 pulp fiction 875
25 focus 792
26 hyper realistic 779
27 colorful background 745
28 vray 726
29 qled 720
30 finely detailed features 710
31 detailed 678
32 perfect art 627
33 trending on pixiv fanbox 627
34 beautiful 621
35 ominous 614
36 artgerm 608
37 peter mohrbacher 605
38 fantasy intricate elegant 599
39 studio lighting 599
40 craig mullins 592
41 photorealistic 581
42 digital airbrush 570
43 gaston bussiere 561
44 hyper realism 555
45 intricate details 553
46 sakimi chan 546
47 studio quality 545
48 magical illustration 540
49 ornate 540
50 matte painting 535
51 insanely detailed 527
52 wayne barlowe 526
53 atmospheric 515
54 by rossdraws 504
55 hypermaximalist 499
56 pop surrealist 498
57 boris vallejo 489
58 by james jean 478
59 frank franzzeta 470
60 mcbess 470
61 brosmind 470
62 steve simpson 470
63 krenz cushart 470
64 decadent 468
65 ilya kuvshinov 463
66 by kyoto animation 462
67 art by ruan jia and greg rutkowski 461
68 mucha fantasy art artifacts 460
69 hajime sorayama 456
70 aaron horkey 456
71 hyperrealistic 452
72 natural raw unreal tpose 448
73 akihiko yoshida 444
74 by greg rutkowski 438
75 ultra realistic 435
76 cosmic horror 416
77 ultra detailed 415
78 high detail 414
79 8k 386
80 studio ghibli 385
81 ray tracing 382
82 colorfully 372
83 photo realism 368
84 matte 361
85 intricate sharp details 335
86 dynamic compositiom 321
87 volumetric light 312
88 colorful 310
89 photorealism 308
90 ultra - detailed 308
91 hand coloured photo 306
92 high definition 303
93 concept art artgerm 298
94 natural lighting 297
95 collodion wet paint photo 296
96 4 k post - processing 291
97 oil painting 290
98 photoreal 289
99 old scratched photo 286
100 cgsociety 283
Бегло пробежавшись взглядом по токенам можно выделить как полезные в определённых композициях токены изменяющие стиль в сторону 3D или реализма или повышающие детализацию, а так же влияющие на цвета/свет/тени, так и мусорные токены влияющие на подсознательное чувство удовлетворения творца произведения.
В качестве вывода к вышеуказанной статье указывалось сочетание токенов, так сказать "выжимка" концентрата крутости супердупер токенов: cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting, trending on artstation
В переводе: кинематографичный, красочный фон, концепт-арт, эффектное освещение, высокая детализация, высокодетализированный, гиперреалистичный, сложный, с замысловатыми четкими деталями, октановый рендеринг, плавный, студийное освещение, в тренде на artstation
Однако, проведём коротенький тест, проверим влияние токена trending on artstation и только что придуманного токена syaskimasyaski, посмотрим на результат с учётом влияния веса (на XL модели вес желательно крутить до 3, а на SD1.5 вес более 1.4 крутить не стоит)
В качестве напрашивающегося вывода сделаю заключение о том, что оба токена меняют центральный объект не в лучшую, а в "другую" сторону. Насколько правильная эта "другая" сторона, решать уже Вам. По мне, любая непредсказуемость повышает бесполезность токена, а в данном случае происходит либо изменение стиля, либо изменение возраста. справедливости ради. Поэтому применение топовых токенов по отдельности целесообразно только при полном понимании сути вносимых изменений. В данном случае токен trending on artstation - уводит стиль в сторону 3D на модели juggernautXL_v9Rundiffusionphoto2. Попробуем исключить данный токен из перечня выжимки токенов ввиду его абстрактности и протестировать оставшуюся совокупность токенов более или менее отвечающих требованию конкретных вносимых изменений, а именно мы должны получить Арт с уклоном в детализированное кинематографическое 3D в ярко сочных тонах, заодно проверим влияние веса на XL модели:
Вывод: картинка поменялась полностью, согласно предположениям исходя из назначения токенов. И если задача стоит в получении подобного стиля - то совокупность данных токенов имеет место быть и в целом приводит к положительному результату от применения. Однако нужно учитывать, что при использовании топовой совокупности токенов полностью меняется стиль исходника и его композиция.
Тест влияния композиций
Тест композиций
Проверим тестами применение "стиля" на композициях со своим собственным стилем:
Полностью меняет стиль
Prompt слева
crazed, young Korra, anime, manga,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
crazed, young Korra, anime, manga,
cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Меняет вид
Prompt слева
Superman, Emo fashion style, characterized by dark colors, layered clothing, punk and gothic styles,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
Superman, Emo fashion style, characterized by dark colors, layered clothing, punk and gothic styles,
cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Вроде лучше.
Prompt слева
Excited energetic, girl, smile, freckles, long hair, looking down, thick eyebrows, ginger hair,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
Excited energetic, girl, smile, freckles, long hair, looking down, thick eyebrows, ginger hair,
cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Эм...
Prompt слева
Little Red Riding Hood, bra, (portrait), (adult woman), (revealing dress), ((muscular)), abs, navel, (blue eyes), (sensual, seductive), freckles, detailed skin, soft bark, bedroom, underwear,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
Little Red Riding Hood, bra, (portrait), (adult woman), (revealing dress), ((muscular)), abs, navel, (blue eyes), (sensual, seductive), freckles, detailed skin, soft bark, bedroom, underwear,
cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Явно красивее, но менее реалистично
Prompt слева
Little Red Riding Hood, closeup portrait photography, beautiful eyes, capturing emotion, personality, flattering lighting, professional, engaging, compelling composition,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
Little Red Riding Hood, closeup portrait photography, beautiful eyes, capturing emotion, personality, flattering lighting, professional, engaging, compelling composition,
cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Можно спутать где и что применялось
Prompt слева
Epic Creative Scene a scarlett johansson with detailed face and cozy eyes, epic, beautiful lighting, inpsiring,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
Epic Creative Scene a scarlett johansson with detailed face and cozy eyes, epic, beautiful lighting, inpsiring,
cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Меняет стиль уходя от реализма в артовость
Prompt слева
bugatti,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
bugatti,
cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Опять из реализма уходит в арт, но красиво
Prompt слева
Gothic style, woman with a venom face and mouth looking at camera, Dark, mysterious, haunting, dramatic,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
Gothic style, woman with a venom face and mouth looking at camera, Dark, mysterious, haunting, dramatic,
cinematic, colorful background, concept art, dramatic lighting, high detail, highly detailed, hyper realistic, intricate, intricate sharp details, octane render, smooth, studio lighting
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Краткие выводы и рекомендации:
- применять токены нужно с умом, в зависимости от того что Вам нужно и способна ли используемая модель реализовать потенциал применяемых токенов. Лучше всего, применять каждый токен по отдельности.
- определённо стиль из топовых токенов влияет как на композицию, так и на стиль.
- стиль состоящий из совокупности топовых токенов уводит генерацию в некую сторону явно меняющую стиль исходника. Мульт уводит в 3D, фото в арт, но в целом картинка становится интереснее. Эффект от применения топовых токенов сопоставим с эффектом применения любого другого стиля в котором есть упор на детализацию, повышения цветастости и кинематографичности. Таким образом волшебства не происходит, а более интересный и предсказуемый результат можно достичь применяя токены по отдельности или прописав например Художника.
- так же следует немного подумать перед применением полной последовательности Топ токенов, может быть лучше будет дать более подробные указания по элементам композиции.
Тест подробного описания
Тест подробного описания
Для примера пропишем более подробно лицо, например вот так: beautiful eyes, expressive smile, great skin, nice makeup, awesome hairstyle, pleasant appearance
Ну а вывод делайте сами...
Prompt слева
crazed, young Korra, anime, manga,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
crazed, young Korra, anime, manga,
beautiful eyes, expressive smile, great skin, nice makeup, awesome hairstyle, pleasant appearance
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt слева
Excited energetic, girl, smile, freckles, long hair, looking down, thick eyebrows, ginger hair,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
Excited energetic, girl, smile, freckles, long hair, looking down, thick eyebrows, ginger hair,
beautiful eyes, expressive smile, great skin, nice makeup, awesome hairstyle, pleasant appearance
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt слева
Little Red Riding Hood, bra, (portrait), (adult woman), (revealing dress), ((muscular)), abs, navel, (blue eyes), (sensual, seductive), freckles, detailed skin, soft bark, bedroom, underwear,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
Little Red Riding Hood, bra, (portrait), (adult woman), (revealing dress), ((muscular)), abs, navel, (blue eyes), (sensual, seductive), freckles, detailed skin, soft bark, bedroom, underwear,
beautiful eyes, expressive smile, great skin, nice makeup, awesome hairstyle, pleasant appearance
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt слева
Epic Creative Scene a scarlett johansson with detailed face and cozy eyes, epic, beautiful lighting, inpsiring,
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Prompt справа
Epic Creative Scene a scarlett johansson with detailed face and cozy eyes, epic, beautiful lighting, inpsiring,
beautiful eyes, expressive smile, great skin, nice makeup, awesome hairstyle, pleasant appearance
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1, Size: 1024x1024, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.8.0
Токены паразиты
Тест паразитов
Для себя я выделил следующее описание: токен обладающий свойством неопределённого влияния - есть паразит. Это отнюдь не означает что их запрещено применять, мало того, их применение действительно "улучшает" генерацию. Только вот вместе с этим "улучшением" зачастую теряется контроль, что в целом очень вредно. Как вредно? По ощущениям это как если бы свежую еду доставали из мусорки, а не брали с полки - вроде и то и другое еда, но контекст получения, и дальнейшего самочувствия разный. Предложите такую еду детям? А заказчику картину из мусора продадите?
Для себя я выделил следующий список мусора: adobe lightroom, photolab, professional photograph, magical photography, masterpiece, HD, 4K, 8K, highres, Ultra-sharp focus, Deep color accuracy, Crystal-clear image, HDR imaging, Lifelike textures, Realistic texture, Realistic object structures, Realistic tones, 8K wallpaper, Fine art quality, High bit depth, Precision exposure, Optimal white balance, State-of-the-art optics, Large sensor size, Perfect composition, High-end retouching, Color grading, Advanced post-processing
Я уверен что каждый сможет дополнить его своими супертокенами.
Вот буквально первые две генерации с подсказкой состоящей из мусора:
И в принципе - неплохо, если не учитывать того факта, что я не просил девушку рисовать, а он мысли мои прочитал и нарисовал. Если продолжить генерировать далее, мы увидим в небольшом количестве машины, еду и прочие мои мысли в течении дня, но в основном няш мяшки. Что в свою очередь говорит о умении нейросети читать мои мысли, либо просто такие изображения были использованы в большинстве случаев при обучении модели.
Вот первые 10 генераций на таком стиле из мусора:
Отлично, теперь попробуем сгенерировать конкретные композиции в мусорном стиле, постепенно расширяя подсказку, а потом попробуем удалить весь мусор и посмотрим что выйдет. Итак, начнём с райского зимнего острова, для чистоты эксперимента всё на одинаковых настройках и Seed, и постепенно будем добавлять в начало подсказки новые токены (указаны под картинкой):
Так, хорошо - получили некий результат. А теперь давайте удалим (с особой жестокостью) всю мусорную часть. Сгенерируем изображение и сравним результаты:
И как видно, на генерации без мусора лучше читается композиция:firework, night, hypercar, paradise winter island. Конечно развернуло машину, но я и не указывал сторону.
А теперь внимание вопрос: какую картинку будет легче изменить в случае необходимости? Если немного поВанговать, то при значительных правках мы получим затык на первой картинке гораздо раньше, т.к. вес каждого нового токена будет "растворяться" в общей массе подсказки.
Итак, ещё раз, для закрепления, сравним результаты. Для большего удобства я разверну машину и сравним подсказки олицетворяющие сюжет с фейерверком, ночью, белый гиперкар, райский зимний остров:
Prompt с мусором (слева)
firework, night, hypercar, paradise winter island, adobe lightroom, photolab, professional photograph, magical photography, masterpiece, HD, 4K, 8K, highres, Ultra-sharp focus, Deep color accuracy, Crystal-clear image, HDR imaging, Lifelike textures, Realistic texture, Realistic object structures, Realistic tones, 8K wallpaper, Fine art quality, High bit depth, Precision exposure, Optimal white balance, State-of-the-art optics, Large sensor size, Perfect composition, High-end retouching, Color grading, Advanced post-processing
Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 1, Size: 1216x832, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.9.4-192-gebe8be90
Prompt (справа)
firework, night, white hypercar, paradise winter island, front view
Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 1, Size: 1216x832, Model hash: c9e3e68f89, Model: juggernautXL_v9Rundiffusionphoto2, Version: v1.9.4-192-gebe8be90
Применение токенов паразитов
применение паразитов
На самом деле есть у мусорных токенов одно замечательное свойство - они заставляют нейросеть думать. И если нейросеть не понимает или не знает контекст применения токена, то начинает уводить генерацию в основной жанр модели. Например, для универсальной модели juggernautXL_v9Rundiffusionphoto2 - это реализм. Следовательно, чем больше такого мусора у нас в подсказке, тем больше реализма мы получим. А следовательно, это свойство можно использовать, вот пример в сравнении с оригиналом и ещё 6 генераций, дабы показать что это не случайность:
Но всё же, я бы не рекомендовал такой способ. Есть альтернативный подход.