通过调整分数以获得所需细节:
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,
阅读:仅适用于具备 dpo 技术的具体模型,不要尝试用于其他 xl 模型,否则无效