wan2.2_5B_lora_lab
详情
下载文件
关于此版本
模型描述
■这是我用于测试 wan2.2_5B LoRA 的试验场。
■我的 LoRA 主要基于静态图像训练,专为在 T2I → I2V 工作流中与 wan2.2_5B 搭配使用而设计。
它们的重点不在于单一概念,而在于学习广泛的未知概念。
■我认为 wan2.2_5B 的主要特点是,尽管拥有 5B 参数,但仍保持轻量高效,使训练和推理都更为轻松。
■它作为视频训练的实际方案尤其具有前景,静态图像训练也同样轻量且易于实现。
将 T2V 和 I2V 集成于单一模型中,使其结构紧凑而卓越。其架构在质量与效率之间取得了极佳的平衡,让我深刻感受到它的潜力。训练未知概念也非常容易。
■如果你是首次使用 wan2.2_5B,可以从以下链接获取所需的模型和工作流——请尝试一下:
https://comfyanonymous.github.io/ComfyUI_examples/wan22/
■每个 LoRA 的详细说明列在各个标签页中,工作流也一并提供,可作为推理参考。
■在我的测试中,即使在 1920x1728 或 1280x1728 等较高分辨率下,静态图像推理也表现良好,极少出现问题,充分展现了模型的灵活性。因此,我的工作流默认使用 1920x1280 像素。纵向分辨率也能获得不错效果,但我发现更接近视频比例的横屏宽高比看起来更吸引人。
■该模型在纹理等精细细节方面表现优异,但存在一些 VAE 特有的伪影。使用如 SD1.5 等模型进行 i2i 修复是一个不错的方案。若由 wan2.2_5B 负责构图,而其他模型优化细节,效果会更佳。
我的工作流中也整合了以下模型的 i2i 功能,可作为参考。提供写实与动漫两种风格,可自由选择。当然,若 VRAM 充足,SDXL 也是绝佳选择。
■我使用 AI Toolkit 训练了这些 LoRA。如果你有兴趣尝试训练,开发者已提供了详细教程,你会发现它比你想象的更容易。




















