通过调整分数以获得期望的细节,使用以下提示:
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,
阅读:仅适用于具备 DPO 技术的特定模型,不要尝试在其他 XL 模型上使用,否则无效