(BanG Dream!) Yamabuki Saaya F.1 Dev LoRA Model

세부 정보

파일 다운로드

모델 설명

Yamabuki Saaya F.1 Dev LoRA 모델

FLUX.1 Dev 베이스 모델을 기반으로 한 LoRA 모델입니다.

훈련에 투명 이미지만 사용했습니다. 따라서 배경은 단일 색상이 되며 유연하지 않을 것 같습니다.

사용 방법

LoRA는 단일 단어 'hanazono tae'로 트리거할 수 있습니다. 그러나 여전히 트리거 단어 뒤에 '1girl, solo, blue eyes, long hair, brown hair'를 추가하는 것을 추천합니다. (nunchaku 워크플로우를 사용한다면, 이所谓 트리거 단어조차 필요하지 않습니다)

또한 LoRA의 가중치가 1.25인 경우만 테스트했습니다. 더 낮은 값이 출력을 정상적으로 만들 수 있는지 확신할 수 없습니다. (자신이 테스트해보시고 댓글로 알려주세요)

svdquant를 활용한 테스트 결과, LoRA 가중치를 1로 설정해도 사용 가능하며, 프롬프트 입력에 LoRA 파일 이름을 추가할 필요가 없습니다.

캐릭터 소개

Danbooru 게시물

Wikipedia


이전 LoRA 출시 이후 또 또 또 거의 육조 년이 흘렀습니다(bushi). (이유는 다들 아시겠죠. 학생 기숙사의 전력 공급 상태가 매우 나쁘고, 종종 ‘과도한 전력 사용’이라는 이유로 반복적으로 정전됩니다)

기본 훈련 파라미터

자료는 주로 캐릭터 카드 이미지로 구성되었고, 제가 보유한 카드 이미지 모두 투명 배경이기 때문에 최종 출력물의 배경은 기본적으로 단색입니다(물론 항상 그렇지는 않지만, 배경을 특별히 강조하지 않는 한 배경은 불확정적입니다. 배경 관련 프롬프트는 여러분이 직접 실험해보세요). 후속 작업에서 이미지 배경 제거가 편리하도록 말이죠(확신합니다).

훈련 스크립트는 sd-scripts의 SD3 브랜치를 직접 사용했고, fluxgym의 스크립트 작성 방식에서 영감을 받아 수작업으로 스크립트와 데이터 설정을 구성했습니다.

제 노트북 사양이 열악하기 때문에 매번 훈련 효율이 낮고, 지금까지 avr_loss를 효과적으로 낮출 수 있는 방법을 찾지 못했습니다(스텝 수를 늘리면 가능하지만, 그건 더 시간이 오래 걸립니다).

이 LoRA 사용법

SD 1.5 LoRA와 동일하게 FLUX.1 Dev 베이스 모델을 사용하고, 트리거 단어 'yamabuki saaya'로 LoRA를 활성화하세요(작은 팁: nunchaku 워크플로우를 사용한다면, 이所謂 트리거 단어조차 쓰지 않고, 바로 캐릭터의 핵심 특징만 작성해도 됩니다). 현재까지 테스트한 가중치는 1.25뿐이며, 그보다 낮거나 높은 값은 테스트하지 않았습니다. 가중치 1도 가능합니다. 물론 캐릭터 특징이 정확히 표현되도록 "1girl,solo,blue eyes,long hair,brown hair" 등의 기본 특성 단어를 추가하는 것을 추천하며, 가능한 한 DeepBooru 어휘사전의 단어만 사용하세요.

직면한 도전

이 LoRA는 새로운 캐릭터에 대한 훈련에만 집중했기 때문에, 사지 등 세부적인 부분에서 여전히 큰 한계를 가지고 있습니다. 아쉽게도 F.1은 SD 1.5처럼 임시로 신체 문제를 극복할 수 있는 embeddings를 자유롭게 추가할 수 없습니다. 제 평가는, 계속 뽑아보세요(;

(물론 더 나은 해결책이 있으시다면 댓글로 알려주세요. 진심으로 감사드립니다 x)

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.