ID Sign - Flux

详情

下载文件

模型描述

这并非首次尝试建模ID标志概念,最初的尝试基于SDXL,但均未能充分再现该概念。SDXL版本仅使用单张图像,而非完整三联图。在看到OnOff及其与其他LoRA结合的优异表现后,再次尝试变得必要。本模型的提示文本与OnOff类似,因其效果良好,本尝试予以模仿。

在最严格的意义上,ID标志或验证标志需为一张皱褶纸片,其上印有特定信息。此外,该标志必须在多张图像中显示,以确保图像未被编辑或修改。同时生成三张视图有助于保持图像间的一致性,特别关注标志文本与纸张褶皱的统一性。

本模型为适用于flux1-dev的LoRA,基于flux1-dev检查点训练而成。训练使用了从网络上收集的33张图像,这些图像被统一缩放至标准高度,然后每三张合并为一组,形成11组训练图像。

训练标签格式如下:

“一名女性从三个视角手持一张皱褶的白色纸签,左图[SCENE],中图[SCENE],右图[SCENE]”

其中SCENE是对图片的简洁描述。

SCENE示例:“赤身站立”、“侧面穿着内裤跪地”、“赤身仰卧”、“侧面裸体”

推荐设置

该模型在以下设置下表现良好:

  • 强度:1
  • 蒸馏CFG:3–3.5
  • 步数:30
  • 采样器:Euler Simple
  • 检查点:fluxunchainedArtfulNSFW
  • 分辨率:1408x768

提示词

采用以下提示格式可获得良好效果:

“一名女性从三个视角手持一张皱褶的白色纸签,纸签上写着(“TEXT”:1.3),描述所有照片的共同特征,左图SCENE_1,中图SCENE_2,右图SCENE_3 lora:idsign_flux_v1:1

整个场景可基于图像的共同要素进行提示,这些提示可使用完整句子,例如:“卧室里的黑发女性”、“海滩上”、“穿着大胸连衣裙的女性”。

各个场景同样可单独提示;简短的提示更有利于保持标志一致性,例如:“躺在床上”、“坐在椅子上”、“站在户外”。

其他提示方式也可能有效。

优势

  • 生成具有正确文本的ID标志
  • 生成文本与褶皱保持一致的ID标志
  • 允许为每张图像单独提示
  • 适用于多种主题
  • 可生成超过三张视图(非训练数据所含,归功于flux)

劣势

  • 图像一致性仅在2–10%的情况下出现(高度依赖提示)
  • 非简单视角持签的图像无法正常生成
  • 图像并非完全一致

版本2

曾尝试使用更小尺寸的LoRA,但效果不佳。该模型若能拥有更多样化的训练图像将更有利,未来可能会推出新版本。

此模型生成的图像

未找到图像。