1930s photography mode - FLUX

详情

模型描述

1930年代摄影模式

这是我研究的一部分,也是我“羊毛流”工作的延伸。通过后续测试,我已接近为训练中的几个主要用例实现“一套通配”解决方案。

这次使用的是TensorArt的在线训练工具进行训练。

此LoRA使用了50张图像进行训练,其中30张使用了我自定义的专业标注格式,如下所示:

1930s photography mode, glamorous lighting, satin textures, era 1930s Hollywood fashion, satin gown with flowing train, solo, glamorous eveningwear, Rating SFW, a woman in a luxurious satin gown stands with effortless poise in a vintage living room,¬ the fabric catching the light as her gown’s long train pools elegantly on the floor,¬ the warm glow of the setting amplifying the timeless glamour of her ensemble, dramatic lighting filter.

--

接下来的10张图像使用自然语言标注,如下所示:

在深夜,暴雨倾盆而下,雨点击打坚硬地面与周围金属物体,发出响亮而有节奏的声音。镜头聚焦于一根粗大的工业柱或灯杆,其底座稳固地插入潮湿的人行道上。雨水沿着柱身倾泻而下,在底部汇聚成池,细小的水流奔向最近的排水口。所有表面都湿滑发亮,映照着远处街道上昏黄朦胧的路灯灯光。

整条街道似乎空无一人,唯有无休止的雨声。偶尔远处灯光一闪,暗示有车辆驶过,但看不到任何人影。地面散落着湿漉漉的树叶与杂物,在急流中打着旋涡。除了持续不断的雨声,场景异常寂静,营造出一种孤独与忧郁的氛围。

--

最后10张图像使用大量标签标注,如下所示:

rotary telephone, vintage phone, woman on phone, old telephone, analog phone, black and white, high contrast, soft lighting, woman, sweater, 1930s hairstyle, retro fashion, rotary dial, old technology, casual conversation, candid pose, old-style phone cord

--

我仍在持续优化,但如果你希望开始制作自己的风格LoRA,这个组合似乎已接近理想状态。

尤其是我的标注风格,是我倾注心血的成果:

理解标注结构及其作用

模型通过结构化的标注来解读视觉提示,这些标注以精确方式定义风格、角色与场景元素。每个标注部分都提供特定信息,引导模型生成准确且连贯的结果。


模式(Mode)

  • 作用:指定图像应呈现的艺术媒介或风格(例如:油画、数字绘画、3D渲染)。

  • 目的:通过决定颜色、纹理和形状的呈现方式,确立输出的整体美学基调


附加标签(Additional Tags)

  • 作用:描述在选定模式下所使用的技法(例如:平滑渐变、粗犷轮廓)。

  • 目的:精炼艺术表现方式,允许自定义笔触、阴影或纹理应用。


时代(Era)

  • 作用:定义特定的历史时期或艺术运动(例如:17世纪巴洛克、2020年代赛博朋克)。

  • 目的:通过引用历史或未来主义风格,建立视觉氛围,影响人物设计、建筑与情绪基调。


时尚风格(Fashion Style)

  • 作用:描述角色所穿着的服装或服饰(例如:街头风、中世纪盔甲)。

  • 目的:通过聚焦服饰,塑造角色的外观与身份,呼应主题或场景设定。


主体数量(Subject Count)

  • 作用:指定场景中人物或主体的数量(例如:单人、双人)。

  • 目的:控制构图与场景动态,明确是聚焦单一主体,还是涉及多个角色间的互动。


独特风格标识(Unique Style Identifier)

  • 作用:识别使图像脱颖而出的鲜明视觉主题或风格(例如:奇幻 whimsical、未来战士)。

  • 目的:为场景增添标志性元素,引导模型朝向特定情绪或创意方向。


评级(Rating)

  • 作用:标明内容评级(例如:Rating SFW、Rating NSFW)。

  • 目的:确保生成图像符合预期用途的规范标准,区分是否适合工作场合使用。


提示(Prompt)

  • 作用:详细描述场景本身,分解为具体的视觉元素(例如:“一名角色站在霓虹灯照耀的城市中,手持等离子剑”)。

  • 目的:提供生成内容的核心描述,聚焦角色、物体及其在场景中的互动关系。


滤镜(Filter)

  • 作用:定义应用于最终图像的视觉效果(例如:柔光滤镜、棕褐色调)。

  • 目的:通过添加特定的视觉处理(如色彩平衡、对比度或氛围调整),改变输出的外观。


各部分协同工作方式:

标注的每一部分都发挥着独特作用,共同引导模型。模式奠定艺术风格的基础,标签时代进一步细化场景细节。时尚风格主体数量塑造人物形象,独特风格标识确保主题清晰连贯。最终,提示滤镜赋予叙事性与完成度,共同打造出符合预期视觉方向的完整、细致的输出。

这种结构化方法确保了艺术生成的灵活性与精准性,为多样化创意表达提供了广阔空间。

此模型生成的图像

未找到图像。