モデルLoRA 18 MB
新しいトレーニング
希望の詳細を得るために、以下のスコアを調整して実験してください:
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,
注意:DPO技術を用いた特定のモデルでのみ動作します。他のXLモデルでは動作しないため、使用しないでください。