RMHF
详情
下载文件
关于此版本
模型描述
我将我的简单算法命名为“RMHF - 基于人类反馈的强化合并”,该算法会生成当前附近的新型合并配方,并让用户选择哪个更好,从而“学习”最佳的权重合并比例。
https://github.com/TkskKurumi/DiffusersFastAPI/blob/main/rmhf_v2.py
我将我的简单算法命名为“RMHF - 基于人类反馈的强化合并”,该算法会生成当前附近的新型合并配方,并让用户选择哪个更好,从而“学习”最佳的权重合并比例。
https://github.com/TkskKurumi/DiffusersFastAPI/blob/main/rmhf_v2.py