通过调整以下评分以获得提示所需的细节:
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,
注意:该模型专为使用 DPO 技术的特定模型设计,请勿在其他 XL 模型上尝试,否则将无法工作。