Anime style lora M1 | Wan2.1 & 2.2 T2V 14B
세부 정보
파일 다운로드
모델 설명
트리거 단어: 애니메이션 스타일 소녀.
학습 데이터: musubi-tuner, 20~30장의 AI 일러스트 이미지
캡션: Qwen2.5-VL-3B에서 조정된 캡션 (배경 설명 포함)
lr: (2e-4, flow_shift3.0)
epoch: 100
train_step: 3000
lora_strength: 0.8
샘플 프롬프트: Hatsune Miku, anime-style girl. (she is playing bass guitar:1.2) in bedroom.
액션은 강조 프롬프트에 따라 조정해야 합니다. 또는 모션 LoRA를 병행 사용하세요.
Action prompt should be adjusted depending on emphasis prompt. Or motion lora use together.
-----------------------------------------------
・kijai의 Causvid v2_lora를 사용하여 step=20, cfg=6.0에서 step=10, cfg=1.0으로 변경했을 때
동영상 생성 속도는 4배로 증가했지만 생성 품질이 좋지 않았고, 프롬프트의 모션이 반영되기 어려웠다.
프롬프트 모션이 잘 반영되지 않는 문제는 프롬프트 강조 배수를 높이면 프롬프트에 따라 움직이는 것으로 해결되었다.
캐릭터 LoRA에서도 프롬프트가 잘 반영되지 않는 경우가 있어 같은 문제일 가능성이 있다.
반면 생성 품질이 좋지 않아, 시도 차원에서 스타일 LoRA를 만들어 보기로 했다.
일단 cfg>1을 설정하면 품질은 향상되지만 생성 시간이 두 배로 늘어난다. cfg=1.0을 유지하면서 품질을 높이고 싶다.
이미지 생성 AI로 생성된 이미지를 모아 세 가지로 분류하고, 각각에 대해 세 개의 LoRA를 학습시켰다.
M1은 애니메이션 스타일, M2는 간단한 귀여운 일러스트, M3는 복잡하고 아름다운 일러스트.
기본적으로 Causvid LoRA와 병용하는 것을 권장합니다.
또한 여러 LoRA를 사용하는 탓에 LoRA 로딩 중 일시적인 버그가 발생한 경우 ComfyUI를 재시작해야 했습니다.
・When using kijai's Causvid v2_lora with step=20,cfg=6.0 to step=10,cfg=1.0, the video generation speed was increased by a factor of 4, but the quality was not good and it was difficult to see the prompt motion.
The problem of the prompt motion not showing up well was solved by increasing the magnification of the prompt emphasis, which made the motion follow the prompt.
The same problem may have occurred with the character LoRA, since it was sometimes difficult to see the prompt motion.
On the other hand, the quality of the generated images was not good, so I decided to create a style LoRA to try it out.
I wanted to keep cfg=1.0 to improve the quality.
I collected images created by the image generation AI and classified them into three categories to train three lora.
M1 is an animation style, M2 is a simple cute illustration, and M3 is a complex beautiful illustration.
Basically, it is recommended to use with Causvid lora.
