DnD Rogue woman with a horse [Flux] [Concept]

详情

模型描述

这个LoRA的灵感来源于许多主题,主要是《暗黑破坏神IV》和《龙与地下城》电影。

灵感与核心理念

当我玩《暗黑破坏神IV》时,我想重现游戏中的一些角色,特别是他们的风格。这个特定的LoRA受到波西米亚风格和大地色系主题的启发,同时融合了黑暗奇幻元素,主要参考了《龙与地下城》(如《博德之门2》和《龙与地下城》电影)以及《暗黑破坏神》的美学。因此,我尝试创造一个具有写实风格的角色图像,使其能够同时融入《暗黑破坏神》和《龙与地下城》两个世界。需要注意的是,我的目标并不是完全复制上述作品的实际风格与氛围,而更像是一种角色扮演(COSPLAY)的表现,或像是为这些作品(如《暗黑破坏神》和《龙与地下城》)创作的一幕电影场景。

数据集准备

我的数据集基于从我的MidJourney账户上传的14张原始图像,并用于后续生成。首先,所有图像都通过水平翻转进行了增强。接着,我采用了更高级的技术来创建颜色增强和图像变化。

为此,我使用了Controlnet(canny)配合Xlabs采样器和Xlabs controlnet depth v3(链接:XLabs-AI/flux-controlnet-canny)。我使用了与训练时相同的检查点——Atomix FLUX Unet (v.1.0)。这使我能够生成更多颜色变化,从而扩展数据集。

我使用了LoRA标签工作流配合Florence 2标注器,并将图像调整为512x672(宽x高)。

最终的数据集包含14×2×2=56张图像,包含翻转和颜色增强。

训练工作流

现在介绍训练流程。我使用了Kijai发布的官方工作流(GitHub - kijai/ComfyUI-FluxTrainer),基于Kohya脚本。我使用以下参数训练LoRA:56张图像,训练步数为1000(我发现最佳效果出现在1000步和400步,其他步数效果较弱但仍有潜力。根据我的观察,这些数值分别对应约19轮和9轮训练。由于其他步数的训练结果不稳定,未来我可能会上传其他版本的模型)。

关于使用的检查点,我使用了Atomix FLUX Unet (v.1.0)进行训练。训练参数方面,我使用了fp8训练格式,不启用卸载启用梯度检查点

LoRA部署与测试

现在介绍模型部署。我使用与训练时相同的Unet和文本编码器进行测试(目前仍在持续测试以排查问题):

迄今为止的最佳效果使用以下参数:

  • LoRA模型权重 — 1.0
  • LoRA CLIP权重 — 1.0
  • 步数 — 15
  • CFG — 1.5
  • 采样器:Euler
  • 调度器:simple

由于该LoRA是基于初始训练图像的标签进行训练的,请不要使用触发词,而是使用示例提示中的标签部分:

"一张从正面视角拍摄的写实照片,一位年轻女性身着传统服饰,自信地站在森林中的马旁,手持弓箭。画面中央是一位20岁、深色皮肤的女性,留着爆炸式卷发,直视观者,表情严肃。她身穿一件长款飘逸长裙,饰有精致的金色刺绣,肩上披着红色斗篷。头发盘成复杂发髻,佩戴着耳环、项链和一把剑。右侧是一匹棕色马,黑色鬃毛,额头有一块白色心形斑记。背景虚化,有树木与绿植,光线柔和自然,营造出宁静氛围。

全身肖像,站立姿势,写实风格,非洲风,奇幻,女性,弓箭手,D&D角色,全身肖像,写实,垂坠斗篷,弓,Greg Rutkowski风格,腰带,背包,电影感肖像,发髻,深色皮肤,细节丰富,卷发,马,荒野,森林,泥泞小路,磨损靴子,精致配饰,部落服饰,服装纹理细腻,景深,自然阳光,优雅的部落珠宝,耳环,珠串项链,胸针或吊坠,D&D,奇幻超级英雄,盗贼"

鸣谢

感谢所提及模型和ComfyUI节点的开发者,为提示词和工作流提供了灵感。所有使用的模型和工作流的版权归属其原始作者(AlexLai, kijai)。也感谢未在此列出但对本作品制作至关重要的其他优秀节点、模型和工具的作者。

内容免责声明

由于检查点仍处于早期测试阶段,若与某些检查点(如去蒸馏版本)配合使用并输入特定提示,可能生成不适合所有受众的内容。该LoRA不描绘任何真实人物,仅用于测试目的。

训练数据合理使用声明

训练数据(14张图像)均在个人MidJourney账户中生成,无意复制或模仿MidJourney模型或其输出。通过增强、ControlNet、蒸馏、过滤和合并等转化性处理,使模型输出与原始图像显著不同。最终模型仅用于研究目的,并具有非商业许可,可用于生成、创建或再现任何内容。所有版权归属原MidJourney模型作者。

许可证

该LoRA继承自训练工作流中使用的Atomix Flux的许可协议:

FLUX.1 [dev] 非商业许可

FLUX.1 [dev] 模型由Black Forest Labs, Inc.根据FLUX.1 [dev] 非商业许可授权。版权所有 © Black Forest Labs, Inc.

在任何情况下,Black Forest Labs, Inc. 均不对因使用本模型而引起的任何索赔、损害或其他责任承担任何责任,无论该责任源于合同、侵权行为或其他形式。

此模型生成的图像

未找到图像。