Wan2.2-Fun-A14B-InP-low-noise-HPS2.1 (rewards lora)

세부 정보

모델 설명

HuggingFace에서 전송

https://huggingface.co/alibaba-pai/Wan2.2-Fun-Reward-LoRAs/tree/main

워크플로우 예시: https://www.runninghub.ai/post/1966777795378655234

이 파일은 LoRA 세트의 일부이며, 다른 LoRA와 함께 사용해야 합니다. 다운로드 및 사용 전에 예제 워크플로우를 참조하는 것을 권장합니다.

소개

우리는 Wan2.2-Fun이 생성한 비디오가 인간의 선호도와 더 잘 일치하도록 하기 위해 보상 역전파(Reward Backpropagation) 기술 1 2를 탐구했습니다. 이에 따라 다음 사전 훈련 모델(즉, LoRA)과 훈련 스크립트를 제공합니다. 이러한 LoRA를 기본 모델의 플러그인으로 사용하거나 자체 보상 LoRA를 훈련할 수 있습니다.

자세한 내용은 우리 GitHub 저장소를 참조하세요.

Wan2.2-Fun-A14B-InP(낮은 노이즈)용 공식 HPS v2.1 보상 LoRA(rank=128network_alpha=64). 배치 크기 8로 2,700단계 동안 훈련되었습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.