RMHF
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
私は、現在の状況近くで新しいマージレシピを生成し、ユーザーがどの比率が優れているかを選択できるようにするシンプルなアルゴリズムを、誇張された名前「RMHF - Reinforcement Merging on Human Feedback」と名付けました。
https://github.com/TkskKurumi/DiffusersFastAPI/blob/main/rmhf_v2.py
私は、現在の状況近くで新しいマージレシピを生成し、ユーザーがどの比率が優れているかを選択できるようにするシンプルなアルゴリズムを、誇張された名前「RMHF - Reinforcement Merging on Human Feedback」と名付けました。
https://github.com/TkskKurumi/DiffusersFastAPI/blob/main/rmhf_v2.py