Wan2.2-Fun-A14B-InP-low-noise-MPS
세부 정보
파일 다운로드
모델 설명
HuggingFace에서 전송
https://huggingface.co/alibaba-pai/Wan2.2-Fun-Reward-LoRAs/tree/main
워크플로우 예시: https://www.runninghub.ai/post/1966777795378655234
소개
우리는 생성된 비디오를 Wan2.2-Fun을 통해 인간의 선호도에 더 잘 맞추기 위해 보상 역전파(Reward Backpropagation) 기법 1 2를 탐구했습니다. 이를 위해 다음 사전 학습된 모델(즉, LoRAs)과 학습 스크립트를 제공합니다. 이 LoRAs를 플러그인 형태로 기본 모델을 향상시키거나, 자체 보상 LoRA를 학습할 수 있습니다.
자세한 내용은 우리의 GitHub 저장소를 참조하세요.
Wan2.2-Fun-A14B-InP(낮은 노이즈)용 공식 MPS 보상 LoRA(rank=128, network_alpha=64). 배치 크기 8로 4,500단계 동안 학습되었습니다.
