WAN 2.1 Lora Trainer - ComfyUI VSCode Full - T1.0

详情

模型描述

易于使用的 LoRA 训练器 (:3000),配合 ComfyUI (:8000) 进行测试,以及 VsCode (:8888)。

https://runpod.io/console/deploy?template=9j2tjwyxys&ref=0eayrc3z

容器中已预装 diffusion-pipe。

文件管理 UI 尚需优化以简化流程,但可通过以下步骤运行:

1. cd /workspace/file-manager
2. source /workspace/bcomfy/bin/activate
3. npm install
4. node app.js

访问 https://xxxxxxxxxxx-3000.proxy.runpod.net/


当前功能

文件管理器的当前功能:

  1. 从 Hugging Face 上选择一个 Wan 模型名称,粘贴到文件管理器中,即可下载至文件(需改进加载 UI)

  2. 上传训练数据 = 图像和文本文件

  3. 设置可修改 TOML 配置文件。请确保你添加的模型也已添加至 ckpt_path = 'Wan2.1-14b'

  4. 可手动运行训练,但未来希望创建一个完整 UI 以实现全自动操作

目前推荐使用以下方法:

强烈建议观看此 YouTube 教程,了解如何设置训练数据。本模板已全面配置好所有必要内容,只需直接跳至训练部分即可。

📁 文件管理器 - 快速入门指南

  1. 下载 Wan 模型

    • 从 Hugging Face 选择一个模型名称(例如:Wan-AI/Wan2.1-T2V-14B

    • 将其粘贴到文件管理器的下载输入框中

    • 点击下载(注意:未来更新将改进 UI 加载指示器)

  2. 上传训练数据

    • 使用文件管理器上传你的训练图像和文本文件

    • 文件将自动放置于正确的输入目录中

  3. 配置设置

    • 使用“设置”标签页修改 TOML 配置文件

    • 确保配置中模型路径正确设置

    • 示例:验证 ckpt_path = '/workspace/diffusion-pipe/models/wan2.1-14b' 是否与你的模型一致

  4. 手动启动训练

    • 目前训练必须通过命令行启动

    • 导航至正确目录并运行训练命令:

    cd /workspace/diffusion-pipe
    NCCL_P2P_DISABLE="1" NCCL_IB_DISABLE="1" deepspeed --num_gpus=1 train.py --deepspeed --config examples/wan_video.toml
    

未来更新将包含完整的 UI 以支持所有训练功能。

此模型生成的图像

未找到图像。