ID Sign - Flux
详情
下载文件
模型描述
这并非首次尝试建模ID标志概念,最初的尝试基于SDXL,但均未能充分再现该概念。SDXL版本仅使用单张图像,而非完整三联图。在看到OnOff及其与其他LoRA结合的优异表现后,再次尝试变得必要。本模型的提示文本与OnOff类似,因其效果良好,本尝试予以模仿。
在最严格的意义上,ID标志或验证标志需为一张皱褶纸片,其上印有特定信息。此外,该标志必须在多张图像中显示,以确保图像未被编辑或修改。同时生成三张视图有助于保持图像间的一致性,特别关注标志文本与纸张褶皱的统一性。
本模型为适用于flux1-dev的LoRA,基于flux1-dev检查点训练而成。训练使用了从网络上收集的33张图像,这些图像被统一缩放至标准高度,然后每三张合并为一组,形成11组训练图像。
训练标签格式如下:
“一名女性从三个视角手持一张皱褶的白色纸签,左图[SCENE],中图[SCENE],右图[SCENE]”
其中SCENE是对图片的简洁描述。
SCENE示例:“赤身站立”、“侧面穿着内裤跪地”、“赤身仰卧”、“侧面裸体”
推荐设置
该模型在以下设置下表现良好:
- 强度:1
- 蒸馏CFG:3–3.5
- 步数:30
- 采样器:Euler Simple
- 检查点:fluxunchainedArtfulNSFW
- 分辨率:1408x768
提示词
采用以下提示格式可获得良好效果:
“一名女性从三个视角手持一张皱褶的白色纸签,纸签上写着(“TEXT”:1.3),描述所有照片的共同特征,左图SCENE_1,中图SCENE_2,右图SCENE_3 lora:idsign_flux_v1:1”
整个场景可基于图像的共同要素进行提示,这些提示可使用完整句子,例如:“卧室里的黑发女性”、“海滩上”、“穿着大胸连衣裙的女性”。
各个场景同样可单独提示;简短的提示更有利于保持标志一致性,例如:“躺在床上”、“坐在椅子上”、“站在户外”。
其他提示方式也可能有效。
优势
- 生成具有正确文本的ID标志
- 生成文本与褶皱保持一致的ID标志
- 允许为每张图像单独提示
- 适用于多种主题
- 可生成超过三张视图(非训练数据所含,归功于flux)
劣势
- 图像一致性仅在2–10%的情况下出现(高度依赖提示)
- 非简单视角持签的图像无法正常生成
- 图像并非完全一致
版本2
曾尝试使用更小尺寸的LoRA,但效果不佳。该模型若能拥有更多样化的训练图像将更有利,未来可能会推出新版本。
















