Cinema Diffuso XL
详情
下载文件
模型描述
Cinema Diffuso
Cinema Diffuso(CD)是一种旨在生成仿佛直接来自电影画面的图像的模型,其角色常处于动态之中,表情丰富,并与周围环境及他人互动。
我的目标是让CD成为电影制作人使用生成式AI时的首选模型,与img2vid模型配合使用。
CD版本0.3基于约1800至1900张图像进行训练,随后与RealvisXL v5进行了合并。
关于采样器设置,我推荐使用任何标准的dpmpp_sde/karras组合。对于CFG,我通常使用5以上,扰动注意力引导(Pertubed Attention Guidance)范围在0.5至1.5之间。
展示图均为txt2img生成,旨在呈现CD训练中所涵盖的部分标签,这些标签经过挑选,但未进行如外绘(outpainting)等复杂修正,仅作简单细节处理。为充分发挥此模型的潜力,我强烈建议充分利用区域条件化、ControlNet和IPAdapter等推理技术。
作为测试版本,CD目前仍远未达到我理想中的状态,但令人惊讶的是,已非常接近我最初决定开发自己的模型时的初衷。未来的版本将包含更多姿势、动作、场景等元素。
在一段时间内,我可能会继续使用SDXL进行本项目,因为SDXL拥有优秀的ControlNet模型,且相比一些更新的模型更加节省资源。
















