Woman with a snake - Orientalist photography style [Flux]
详情
下载文件
关于此版本
模型描述
此 LoRA 受到即将来临的蛇年相关比赛的启发。
(有关比赛的更多详情,请参见:“征稿启事:蛇年资源!”)
灵感与核心理念
在使用 exLlama 提示增强器和 OneButtonPrompt 生成图像时,我被装饰艺术风格的插画深深吸引。这个特定的 LoRA 是通过构建一个关于“一位与蛇相伴的女性”的提示而创建的。随后,我使用该提示生成了 20 张训练图像,并在网站上进行测试,以确认它们是否符合比赛要求。目前该 LoRA 处于测试版,我仍将在可能的情况下尝试对其进行改进。
训练数据:
待定。
技术配置
以下是技术细节。我使用了以下模型的简单工作流:
以及 CLIP 的正向/负向提示。
我共生成了约 50 张图像,但在上传时仅有 20 张通过了筛选。待 LoRA 上传至网站后,我将一并上传训练图像。请注意,尽管我已尽最大努力确保内容不违反比赛要求,但部分图像可能仍存在其他评级。为保持透明,我仍将它们一并上传。因此,我可能考虑再进行几次训练以获得更佳效果。
我使用了 Florence 2 标记工作流,并将图像调整为 512x768(宽×高)。
训练流程
接下来是训练流程。我使用了 Kijai 官方工作流(GitHub - kijai/ComfyUI-FluxTrainer)),其基于 Kohya 脚本。我使用以下参数训练 LoRA:20 张图像,训练步数为 1000(我发现最佳效果出现在 200 至 400 步之间,更多步数(如 500、600 等)似乎导致模型过拟合)。根据我的观察,这些数值对应约 10 至 20 个训练轮次。此数值可能因数据集而异,但对我而言,大致在此范围。
关于使用的检查点:我使用了 Atomix FLUX Unet (v.1.0) 进行训练,因为这是我在 Unet 格式和 FP8 精度下唯一拥有的写实风格检查点,其他检查点可能不适合写实风格训练。关于训练参数,我使用了 fp8 训练格式,未启用卸载 和 b。更多细节请参见训练工作流。
我在多个步数节点生成了 LoRA:200、400、500、600、800、1000。超过 400 步的模型出现 glitch 和变形,因此我决定舍弃它们。200 步的 LoRA 因面部细节更精细而表现良好,但手部问题较多。
LoRA 部署与测试
现在是模型部署。我使用与训练时相同的 Unet 和文本编码器进行测试(仍在持续测试以排查问题):
来自 Hugging Face Flux-dev 仓库的 clip-L:black-forest-labs/FLUX.1-dev at main
T5xxl fp8 编码器:FLUX.1 T5 Text Encoder
截至目前,我获得最佳效果的参数如下:
- LoRA 模型权重 — 1.0
- LoRA CLIP 权重 — 1.0
- 步数 — 15
- CFG — 1.5
- 采样器:Euler
- 调度器:simple
由于 LoRA 是基于初始训练图像的标签进行训练的,请勿使用触发词,而应使用示例提示中的标签部分:
"一张从正面相机角度拍摄的写实照片,展现一位女性坐在椅子上,一条蛇缠绕在她的双腿周围,身着黑色无肩带礼服并佩戴多条项链。画面中还呈现一位深色皮肤、黑发女性,位于图像中央,上半身正对观众,目光直视镜头。她神情自信,涂着红色口红,身材纤瘦,双肩裸露。她坐在一间光线昏暗的房间里的木椅上,背景为棕色窗帘和雕花拱门。光线极具戏剧性,投下阴影,凸显她的曲线。她佩戴黑色珠宝,包括项链和耳环,赤足。蛇缠绕在她身上,鳞片清晰可见。整体氛围黑暗神秘,焦点集中在女性与蛇身上。
score_9, score_8_up, score_7_up, Stylized reinterpretation of Orientalist photography, masterpiece, best quality, 1girl, solo, breasts, looking at viewer, black hair, dress, jewelry, bare shoulders, sitting, full body, earrings, black eyes, necklace, barefoot, spread legs, feet, lips, toes, chair, black dress, curly hair, arm support, snake, interspecies"
鸣谢
感谢所提及模型及 ComfyUI 节点的开发者,为我的提示与工作流提供了灵感。所有使用的模型与工作流的版权归属原作者(AlexLai, JayNL, kijai)。也感谢未在此列出但对本作品创作至关重要的其他优秀节点、模型与工具的作者。
特别致谢。我还要感谢 JayNL ,因为他的检查点被用于生成我的 LoRA 图像,我也将本 LoRA 的创作归功于他。
内容免责声明
由于该检查点尚处于早期测试阶段,若单独使用(如与 dedistilled 检查点结合)并配合特定提示,可能生成不适合所有受众的内容。该 LoRA 并不描绘真实人物,仅用于测试目的。
许可证
该 LoRA 继承自训练工作流中使用的 Atomix Flux 许可证:
FLUX.1 [dev] 模型由 Black Forest Labs, Inc. 根据 FLUX.1 [dev] 非商业许可证授权。版权所有 © Black Forest Labs, Inc.
在任何情况下,Black Forest Labs, Inc. 均不对因使用本模型而引起的任何索赔、损害或其他责任负责,无论该责任源于合同、侵权或其他原因。



