Floating Heads HiDream
详情
下载文件
模型描述
漂浮头部 HiDream
漂浮头部 HiDream LoRA 基于 LyCORIS 构建,训练数据为风格化、以人物为中心的 3D 半身渲染图。我注意到 Sora 探索页面上一个流行提示,便萌生了以此为方向进行训练的想法。目标是精准构图,聚焦头部与颈部,搭配自然配饰、精细面部结构和柔和的影棚灯光。
使用画廊首图中嵌入的工作流生成的结果分辨率为 1760x2264。该工作流优先考虑视觉丰富度、一致性和质量,而非批量输出。
总体而言,输出效果非常干净、锐利且细节丰富,角色定位一致,光照行为可预测。此模型最适合用于富有表现力的角色设计、编辑素材,或任何需要高质量面部渲染的项目,特别适用于 img2vid、LivePortrait 或唇形同步。
工作流说明
画廊首图中嵌入了多通道工作流,按顺序使用多种调度器与采样器,以最大化面部结构、配饰清晰度和纹理保真度。画廊中的所有图像均通过此流程生成。虽然该 LoRA 并未专门针对此工作流进行训练,但我同时开发了模型与多通道流程,因此尚未在单通道设置下广泛测试。最终通道的 CFG 设置为 2,可获得更清晰的细节与更明确的质感,如皱纹和毛孔;若输出显得过于锐利,可将 CFG 调整为 1。
该过程并不快速 —— 在 RTX 4090 上完成全部三通道扩散预计耗时 300 秒(有时第二通道已足够)。我仍在探索缩短推理时间的方法,欢迎您自行调整参数以达成理想效果。若您有所突破,请在评论区分享您的设置,供他人尝试。
我不需要您告诉我这很慢——请预期它就是慢的(三通道总共 300 秒)。
触发词:
h3adfl0at,3D floating head
推荐强度:0.5–0.6
推荐 Shift:5.0–6.0
版本说明
v1: 训练聚焦于不同年龄、面部结构和种族的孤立颈上部渲染,具备良好的主体多样性(年龄、种族、性别范围)与一致风格。
v2(进行中): 我计划将 v1 的成果整合进 v2,以进一步提升一致性。
训练参数
训练 3,000 步,2 次重复,学习率 2e-4,使用 SimpleTuner(耗时约 3 小时)
数据集包含 71 张生成的合成图像,分辨率为 1024x1024
训练与推理均在 RTX 4090 24GB 上完成
标注通过 Joy Caption Batch,使用 128 个 token
我使用 HiDream Full 搭配 SimpleTuner 训练了此 LoRA,并在 ComfyUI 中使用 HiDream Dev 模型进行推理。
若您欣赏其质量,或希望支持未来类似的 LoRA 开发,欢迎通过以下链接支持我:
🔗 https://ko-fi.com/renderartist
🔗 renderartist.com



















