[Negative LoRA] for RouWei - v0.6.1 vpred

경고: 이 LoRA는 v-pred 체크포인트에서만 작동하며, 전용으로 RouWei v0.6.1 v-pred용입니다.

긍정 프롬프트에 다음을 입력하세요:

lora:rouwei_neg_by_pfc:1

부정 프롬프트에 다음을 입력하세요 (선택 사항):

(by pfc:1.0)

권장 강도: 0.1에서 1.0

이것은 RouWei를 사용하여 출력의 미적 품질을 향상시키려는 실험적 시도입니다. 이 LoRA를 적용하면 세부 사항을 개선하고 해부학적 세부 정보를 수정하며 배경 세부 정보를 향상시키는 데 도움이 될 수 있습니다.

v2 버전은 첫 번째 버전이며 여전히 개선의 여지가 있습니다.

데이터셋은 CivitAI에서 가져온 360장의 AI 생성 이미지로 구성되며, 주로 Pony Diffusion XL / Animagine 파생 모델에서 유래했습니다.

가설은, RouWei가 보유한 방대한 예술가 지식을 활용하여 "포니" 스타일을 고유한 토큰과 연결하여 부정 토큰으로 사용할 수 있다는 것입니다.

학습에 사용된 이미지의 대부분은 다음 중 하나 이상의 문제를 겪습니다:

이미지들은 모두 "by pfc"로 캡션 처리되었습니다. 이는 학습 전에는 희귀 토큰이며 거의 영향이 없었기 때문입니다.

추가 정보:

RTX 4090에서 배치 크기 8, 그라디언트 누적 단계 8로 60 에포크(약 2시간) 학습 (총 100 에포크 중)
100 에포크에 도달하기 전에 학습을 중단했기 때문에 아마도 미숙한 상태입니다.
U-Net만 학습됨
네트워크/Conv 랭크 8, 알파 4로 효과를 완화
가장 최신이자 최고의 ProdigyWithScheduleFree 최적화기(https://github.com/kohya-ss/sd-scripts/issues/1796) 사용 (v-pred 모델은 학습이 어려움)
Debiased Estimation Loss가 Min Gamma SNR보다 더 우수함

계획: