PVC STYLE for FLUX.1 D.
详情
下载文件
模型描述
推荐分辨率:短边1152+,长边1920+。横版侧重场景,竖版侧重人物。Hirs修复可开启至1.5至2(可选),无需触发词。
用于训练的基础模型为Flux.1-Dev,
本模型的训练方式
本模型使用kohya-ss/sd-scripts进行训练,图像由lllyasviel/webui-forge生成。
我们自动选择的训练步数为200 epoch,以在模型的保真度与可控性之间取得平衡。
为何不直接使用更精选的图像?
我们的模型从数据爬取、训练、生成预览图像到发布,全过程100%自动化,无人工干预。这是我们的团队进行的一项有趣实验,为此我们开发了一套完整的软件基础设施,包括数据过滤、自动训练与自动化发布。因此,若可能,我们非常欢迎更多反馈或建议,因为它们对我们而言极为宝贵。
为何无法精确生成期望的艺术风格?
我们当前的训练数据来源于多个图像网站。在全自动化流程中,准确预测官方图像中所包含的具体艺术风格极具挑战性。因此,艺术风格的生成依赖于对训练数据集中标签的聚类分析,力求实现最佳复现。我们将持续改善这一问题并寻求优化,但它仍是一个无法完全解决的挑战。艺术风格复现的准确性,也难以达到人工训练模型的水平。
以下群体不建议使用本模型,我们深表遗憾:
对原始艺术风格有任何细微偏差都无法容忍者。
所处应用场景对艺术风格复现精度要求极高者。
无法接受基于Stable Diffusion算法生成图像中潜在随机性者。
不适应使用LoRA进行全自动艺术风格模型训练流程者,或认为艺术风格训练必须完全依赖人工操作以维持原始艺术愿景完整性者。
认为生成图像内容违背其价值观者。
为何我们使用自动训练框架?
我只需将图像放进去,其余步骤全自动完成,无需任何监督。我可以去打游戏或闲逛,完全不必处理繁琐的数据清洗与标注工作,且数据处理与训练速度极快。这种模型训练方式对我来说是一种彻底的享受。


















