HunyuanVideo - Ginny Ishuzoku Reviewers
详情
下载文件
关于此版本
模型描述
正在开发中 - 请尝试使用并分享你的结果,我很想看看人们能创造出什么。
即将更新。如果你有兴趣,请告诉我。
此LoRA旨在生成角色Ginny的写实风格图像,该角色灵感来源于《异种族风俗娘评鉴指南》,具有牛角和巨大的胸部。它兼容HunyuanVideo的视频转视频和图像转视频工作流。该模型使用PonyXL和Ginny Pony LoRA在1092张分辨率为1024 x 1440的Ginny写实图像上训练而成。虽然训练不足,但因需求而作为开发中版本发布。
可与“弹跳胸部”HunyuanVideo LoRA配合使用。但请注意图像质量会有显著下降,且由于我的LoRA训练不足,可能被其压倒。
""\_(:3)_/""
无需Kling。
使用方法:
在你偏好的Hunyuan工作流中加载LoRA(V2V或I2V)。(我的部分早期帖子包含工作流示例)
加载一段女性胸部丰满的短视频,最好有明显弹跳效果。我调整的分辨率是800 x 1120。
使用触发词提示:“Ginny,一个长着牛角和巨大胸部的女人”。
添加场景描述,并根据需要调整CFG设置。
示例提示风格:
“Ginny,一个长着牛角和巨大胸部的女人,身体前倾,胸部轻柔晃动,电影级灯光突显了胸部的运动”——类似这样的表达……请保持在248个token以内。
大部分生成结果为97帧,800 x 1120分辨率,CFG为1,步数25。使用24GB显存的显卡,可尝试扩展至129帧,但需交换所有块:Double Block交换20,Single Block交换40,以节省内存。每次生成耗时约45分钟。
快速运行:步数10-15,CFG为1,49帧,约耗时7分钟。推理步数越高,模型越能聚焦视频中由提示词语义交互所定义的视觉特征,从而提升语义理解——我推测这能带来更高质量和更自然的动作,但会消耗更多内存。
CFG设置:
- CFG尺度:1
- 此范围内的CFG值能显著提升动画质量和连贯性。更高的CFG值需要更多显存,并可能导致模型过度约束,产生僵硬或不自然的运动。若生成较小分辨率(如544 x 720),可尝试CFG为2,帧数为49。
负面提示:
低质量、手部错误、牙齿错误、眼睛错误、肢体错误、扭曲、说话、发声
训练洞察
数据集规模与质量
小数据集(<100张图像):
结果“尚可”,但在胸部物理模拟与整体真实感方面缺乏一致性。提示风格多样,但模型难以泛化。
大数据集(约1000张图像):
目前最佳效果来自一个庞大且多样化的数据集,搭配交错的详细提示。
大数据集的多样性似乎有助于模型学习更优的动态运动与解剖细节。
尤其对于大胸部的弹跳效果,精确建模非常困难,模型常会出现过度或不足的运动。
一种可能的解决方案是:先用包含大胸部弹跳视频的素材进行预训练,以教会模型真实的物理规律。
小数据集整合:预训练后,我将使用针对Ginny的精选小数据集进行微调。
待验证结果:根据进展,我可能会进一步扩充数据集。
下一步计划
基于视频的预训练:专注于胸部物理与自然运动。
微调:融入更小但高质量的Ginny专属图像数据集。
这仍是一个开发中项目,我非常期待你的反馈!请测试这个LoRA并分享你的成果:哪些有效?哪些无效?如果你有更好的胸部物理模拟方法,请告诉我!
即将更新。
