The Wire: Baltimore Photography
16
202
详情
下载文件
模型描述
V1.1 中数据集标签已全面优化,明确区分了第一季至第五季。
1.0 的标签过于笼统,1.1 全面优化了标签,区分了第一季到第五季的标签。
这个 LoRA 模型致力于复现 HBO 经典剧集《火线》(The Wire)的独特视觉风格。它学习了纪实电影感、低饱和度的色彩、独特的街景构图以及光影氛围。模型成功捕捉了巴尔的摩标志性的红砖排屋、破败的小巷和充满街头氛围的场景。
提供的预览图使用了特定提示词生成,可作为实现类似效果的参考(也可参考训练数据中的 txt 文件)。
这个 LoRA 训练时的一些挑战:
在数据集选取过程中,尽量避免了主要角色,但是这座城市的故事中,人又是不可或缺的,因此选取的带有人物的图像基本都是背景人群图像,人与这座古老城市建筑的互动,才能有效模仿《火线》特有的镜头叙事感觉。
整个训练过程中我遇到了140张离散主题图像难以拟合的问题,最开始训练 1024 分辨率,仅仅能学到基础的建筑风格,查阅了下 GitHub,类似案例(Flux Lora training seems not to converge with big dataset(140 images))中,另外一个人 1024 训练分辨率需要 4x4x 3500 steps 才能较好拟合,最后我选择了 512 训练分辨率,训练了大概 10000 steps。



















