프롬프트와 함께 점수를 실험하여 원하는 세부 사항을 얻어보세요:
score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up,
읽기: DPO 기술을 사용하는 특정 모델과 호환되며, 다른 XL 모델에서는 시도하지 말아야 합니다. 작동하지 않습니다.