Potg 🎨 Lumina-Image 2.0

详情

模型描述

这个模型我不能称之为成功,它的效果时好时坏。有时,那位独特艺术家特有的数字噪声纹理会缺失,可能会退化为非绘画风格。梦幻般的童话插画风格捕捉得不错,但存在许多解剖学错误。因此,它仍可使用,但依然带有一定实验性。我可能会稍后重新训练它,因为我将所有失败归因于数据集选择不当。

描述

Potg 是一位日本自由插画师,以其引人入胜的艺术作品而闻名,作品常以年轻女性为主题,背景精细且富有氛围。其风格巧妙融合了传统日本美学与当代数字技法,营造出充满温暖与魅力的怀旧场景。

2024年5月,他发布了一本名为 《Hikage Potg Works(插画制作与视觉书)》 的画册,收录了过往作品及新插画。

通过富有感染力的图像,potg 持续为当代日本艺术界做出重要贡献,以其独特的传统与现代融合风格吸引着观众。

使用方法

LoRA 的触发词为 "Potg style"。即使不使用该词也可能生效,但仍建议包含它。

图像在 ComfyUI 中生成,主要使用默认设置,包括:

shift: 6.0
steps: 40
cfg: 4.0
sampler: gradient_estimation
scheduler: sgm_uniform

训练

使用 111 张图像进行训练,使用 Molmo-7B-O 进行标注(我使用了 cyan2k 的 4-bit 量化版本)。标注提示为:

请尽可能详细地描述这张图像,不要描述风格细节。

所有标注均以前缀 "You are an assistant designed to generate high-quality images based on user prompts. Potg style." 开头。

训练使用 ai-toolkit 完成(RTX 3090,Windows 11)。大多数超参数保持默认,值得注意的设置包括:

network.linear: 32
network.linear_alpha: 32
optimizer: adamw8bit
optimizer_params.betas: [0.95, 0.98]
optimizer_params.weight_decay: 0.01
lr: 5e-5
noise_offset: 0.1
lr_scheduler: constant

训练持续至 50000 步,经过若干测试后,选择第 42000 步的 LoRA 检查点作为发布版本。

此模型生成的图像

未找到图像。