Wan2.2-Fun-A14B-InP-low-noise-HPS2.1 (rewards lora)
세부 정보
파일 다운로드
모델 설명
HuggingFace에서 전송
https://huggingface.co/alibaba-pai/Wan2.2-Fun-Reward-LoRAs/tree/main
워크플로우 예시: https://www.runninghub.ai/post/1966777795378655234
이 파일은 LoRA 세트의 일부이며, 다른 LoRA와 함께 사용해야 합니다. 다운로드 및 사용 전에 예제 워크플로우를 참조하는 것을 권장합니다.
소개
우리는 Wan2.2-Fun이 생성한 비디오가 인간의 선호도와 더 잘 일치하도록 하기 위해 보상 역전파(Reward Backpropagation) 기술 1 2를 탐구했습니다. 이에 따라 다음 사전 훈련 모델(즉, LoRA)과 훈련 스크립트를 제공합니다. 이러한 LoRA를 기본 모델의 플러그인으로 사용하거나 자체 보상 LoRA를 훈련할 수 있습니다.
자세한 내용은 우리 GitHub 저장소를 참조하세요.
Wan2.2-Fun-A14B-InP(낮은 노이즈)용 공식 HPS v2.1 보상 LoRA(rank=128 및 network_alpha=64). 배치 크기 8로 2,700단계 동안 훈련되었습니다.
