Wan2.2-Fun-A14B-InP-high-noise-MPS (rewards lora)
세부 정보
파일 다운로드
모델 설명
HuggingFace에서 전송
https://huggingface.co/alibaba-pai/Wan2.2-Fun-Reward-LoRAs/tree/main
워크플로우 예시: https://www.runninghub.ai/post/1966777795378655234
이 파일은 LoRA 집합의 일부로, 다른 LoRA와 함께 사용해야 합니다. 다운로드 및 사용 전에 예시 워크플로우를 참조하는 것이 권장됩니다.
소개
우리는 Wan2.2-Fun이 생성한 동영상이 인간의 선호도와 더 잘 일치하도록 하기 위해, 보상 역전파(Reward Backpropagation) 기술 1 2를 탐구했습니다. 우리는 다음 사전 훈련된 모델(즉, LoRA)과 함께 훈련 스크립트를 제공합니다. 이러한 LoRA를 사용하여 해당 기본 모델을 플러그인 형태로 향상시키거나, 자체 보상 LoRA를 훈련할 수 있습니다.
자세한 내용은 우리의 GitHub 저장소를 참조하세요.
Wan2.2-Fun-A14B-InP(높은 잡음)용 공식 MPS 보상 LoRA(rank=128 및 network_alpha=64). 배치 크기 8로 5,000단계 동안 훈련되었습니다.
