通过调整分数以获得所需细节,使用以下提示:
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,
阅读:仅适用于具备dpo技术的特定模型,不要尝试用于其他xl模型,否则将无法工作。