通过调整以下评分来获得提示所需的细节:
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,
阅读:这些模型专为使用DPO技术的特定模型设计,不要尝试在其他XL模型上使用,否则将无法正常工作: