Wan2.2-Fun-A14B-InP-high-noise-HPS2.1 (rewards lora)

세부 정보

모델 설명

HuggingFace에서 전송

https://huggingface.co/alibaba-pai/Wan2.2-Fun-Reward-LoRAs/tree/main

워크플로우 예시: https://www.runninghub.ai/post/1966777795378655234

이 파일은 LoRA 세트의 일부이며, 다른 LoRA와 함께 사용해야 합니다. 다운로드 및 사용 전에 예제 워크플로우를 참조하는 것을 권장합니다.

소개

우리는 Wan2.2-Fun이 생성한 비디오가 인간의 선호도와 더 잘 일치하도록 하기 위해 보상 역전파 기법1 2을 탐구했습니다. 다음 사전 학습 모델(즉, LoRA)과 함께 학습 스크립트를 제공합니다. 이러한 LoRA를 사용하여 기본 모델을 플러그인 방식으로 향상시키거나, 자체 보상 LoRA를 학습할 수 있습니다.

자세한 내용은 our GitHub 저장소를 참조하세요.

Wan2.2-Fun-A14B-InP(고임의)용 공식 HPS v2.1 보상 LoRA(rank=128network_alpha=64). 배치 크기 8로 5,000단계 학습되었습니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.