Bowsette Lora Wan 2.2 14B T2v / I2V
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
요약
저의 ko-fi 페이지에서 기부하거나 구독해 주세요.
(모든 기부금은 더 많은 LoRA 제작에 바로 재투자됩니다.)
이 LoRA는 캐릭터 보셋테(Bowsette)를 생성하기 위한 것으로, 애니메이션 및 실사 버전 모두에 사용할 수 있습니다. 현재 버전은 노출 콘텐츠를 위한 학습은 하지 않았지만(NSFW 생성에는 큰 문제가 없음), 다음 버전에서는 해당 데이터셋으로 추가 학습을 진행할 예정입니다. 이 LoRA는 매우 유연하며, 다른 LoRA와도 잘 작동합니다(예: CausVID LoRA 사용 시 12스텝, 1CFG, SLG/TeaCache 비활성화 추천). 이 LoRA는 t2v 14B 모델로 학습되었으므로 i2v 모델 LoRA로도 사용할 수 있습니다.
이 버전(2.2 WAN 14B)에 대해
WAN 14 T2V 모델의 고급 및 저급 버전 모두로 학습되었습니다.
자세한 설명은 하지 않겠습니다. WAN 2.2가 처음 출시되었을 때 3번 시도했지만 항상 나쁜 결과만 나왔습니다. 그 과정에서 배운 점:
고급 모델은 캐릭터 LoRA에 매우 중요합니다. 기본 모델이 학습하지 않은 요소는, 고급 모델에서 학습되지 않으면 생성되지 않습니다. 받은 조언들이 서로 모순되는데, 캐릭터의 실제 외모(예: 실제 사람의 얼굴)를 학습할 때는 고급 모델을 과소 학습하는 것이 좋다고 하지만, 보usette처럼 새로운 개념(예: 왕관, 뿔 등)을 학습하고 싶다면, 잘 학습된 고급 모델이 필요합니다.
고급 및 저급 모두 약 100 에포크로 학습되었습니다. 정확한 스텝 수는 기억나지 않지만, 각각 약 10,000 스텝 정도일 것 같습니다. 저급 모델은 포기하기 전까지 3번 학습했고, 그 후 제 마지막 두 LoRA를 위해 WAN 학습에 대해 배우고 나서 문제의 원인을 발견했습니다.
고급 모델의 에포크 50과 에포크 100은 서로 다른 결과를 낳습니다. 덜 학습된 고급 모델은 다음을 제대로 생성하지 못했습니다:
- 분홍색 상단과 얼굴이 있는 왕관, 머리를 세 갈래로 갈라진 앞머리, 가슴에 있는 보석 위치.
따라서 저급 LoRA가 세부 사항을 포착할 수 있도록, 고급 LoRA가 이러한 기본 요소를 먼저 생성해야 합니다.
이 LoRA는 2.1 버전과 동일한 데이터셋으로 학습되었으며, 제 처음 시도 중 하나였습니다. 이후 캡션을 정리(예: 왕관, 뿔, 머리카락 캡션 제거)해 자동으로 생성되도록 개선해야 할 것 같습니다. 이 LoRA는 2.1 버전과 동일한 기능을 수행하므로, "live action"을 프롬프트에 넣고 "animated"를 네거티브에 넣거나, 그 반대로 하면 애니메이션 버전을 얻을 수 있습니다.
일부 예시 생성물이 흐릿한 이유는 제가 재미로 함께 사용한 Gurren Lagann LoRA의 설정 때문입니다. 향후 더 많은 예시 생성물을 올릴 예정입니다. 이 LoRA를 먼저 공개하고 다른 작업으로 넘어가고 싶었습니다.
DPM++_SDE cfg 3.5 + 5 shift(6-8 shift도 괜찮음) 사용, 고급과 저급에 각각 11/9 스텝 분할. 제대로 활성화하려면 메인 페이지의 설명을 참고하여 프롬프트에 태그를 붙이세요.
오래된 2.1 버전에 대해
V1과 V1.1의 차이점 (둘 다 좋음):
V1은 애니메이션 스타일로 전환하기 더 쉽습니다.
V2는 추가 NSFW 데이터로 학습되었으며, 기본적으로 실사 스타일로 생성되는 경향이 있지만, 프롬프트에 몇 단어만 추가하면 수정 가능합니다(트리거 단어 섹션 참조).
필수 트리거 단어: BowsetteLORA, Bowsette
권장 강도: 1.0
(프롬프팅에 대한 자세한 내용은 아래 참조)
데이터셋
보셋테 전용 51장의 균형 잡힌 데이터셋(실사 코스프레 사진 및 팬 일러스트 포함). V1.1은 추가로 7장의 NSFW 이미지와 두 배의 학습 스텝을 포함합니다.
해상도: 512x768
주요 트리거 단어
필수 트리거 단어: BowsetteLORA, Bowsette
스타일용 선택적 트리거 단어: animated, live action
저는 일반적으로 프롬프트 시작에 "BowsetteLORA"를 넣고, 이후에는 "Bowsette"라고 불러줍니다.
애니메이션 스타일을 원하면 "animated" 또는 "anime"를 사용하고, 실사 버전을 원하면 "live action"을 사용하세요. 학습 데이터는 코스플레이어의 의상 기반으로 구성되어 있어, 실사 버전은 대부분 전문 코스프레 스타일로 나옵니다. 3D CGI 스타일도 가능합니다.
V1.1 애니메이션 스타일 참고:
V1.1은 애니메이션 스타일을 얻기 위해 추가 프롬프팅이 필요할 수 있습니다. 긍정적 프롬프트 끝에 다음을 추가해 보세요:
anime style, highly detailed traditional animation, 2D character, bright lineart, stylized lighting
네거티브 프롬프트에는 다음을 추가하세요:
realistic, photo, photorealistic, live action, skin pores, DSLR
선택적 설명적 트리거 단어
일반적으로 "Bowsette"만으로도 왕관, 뿔 등 일반적인 요소를 인식하지만, 특정 옷이나 외모 요소가 나타나지 않거나, 특별히 원할 경우 명시적으로 프롬프트에 추가할 수 있습니다. 때로 색상이 달라질 수 있습니다(예: 흰색 뿔 vs 노랑색 뿔). 그녀의 모든 요소가 캡션으로 기록되어 있어 쉽게 수정할 수 있습니다. 아래에 프롬프트에 유용한 단어들을 정리해 놓았습니다(예: "Her tail" 또는 "Green shell on back visible"라고만 쓰면 자동으로 적용됩니다). 기본 모델이나 다른 LoRA에 있는 옷으로 그녀를 입힐 수도 있고, 네거티브 프롬프트에 넣어 특정 요소가 나오지 않도록 할 수 있습니다.
캐릭터 특징
- 머리: 금발
- 귀: 길고 뾰쪽한 엘프 모양
- 눈: 크고 밝은 파란색, 종종 진하게 강조됨
- 입/이빨: 날카로운 강한 송곳니가 드러난 웃는 얼굴
- 손톱: 길고 검은색, 뾰족함
- 표정: 장난꾸러기, 교활함, 자신감, 또는 미친 듯한 표정
- 귀고리: 파란색 눈물방울 모양, 원형 자석형, 또는 큰 구슬형
- 왕관: 금색, 분홍색 돔형 상단, 보통 빨간 보석, 때로 별 또는 하트 문양 포함
- 뿔: 두 개의 큰 부드러운 위로 휘어진 뿔(연한 갈색 또는 흰색), 머리카락에서 나옴
- 등껍질: 등에 있는 녹색 가시 달린 거북 등껍질, 흰색 테두리 및 연한 갈색 또는 흰색 뾰족한 가시
- 꼬리: 두꺼운 파충류 꼬리, 주황색 또는 갈색, 규칙적으로 간격을 둔 연한 갈색 또는 회색 가시
의상 요소
- 상의: 블랙 스트랩리스 버스티어 또는 바디수트, 심플한 하트 모양 네크라인, 일반적으로 비닐/가죽 질감, 중앙에 타원형 보석(보통 파란색 또는 녹색)
- 하의: 하이컷 레오타드, 짧은 주름 치마, 투명한 흐르는 치마, 주름 잡힌 층층 치마 등
- 스타킹: 블랙 히프 스타킹(투명 또는 불투명), 때로 무늬 있거나 두꺼운 상단 밴드
- 신발: 하이힐 샌들, 스틸레토, 또는 부츠 — 종종 가시 달린 발목 스트랩
- 목장식: 블랙 초커, 실버 가시 장식
- 팔장식: 블랙 가시 달린 손목밴드 및 팔찌; 때로 팔꿈치까지 길고 반짝이는 장갑
학습 정보
3090 GPU에서 Diffusion Pipe를 사용해 로컬에서 학습되었습니다.
기본 설정 외:
- LR: 2e-5, Repeats: 5, transformer dtype: float8, save_dtype: bfloat16, blocks_to_swap: 8
- V1: 1400 스텝 (에포크 22), V2: 2700 스텝 (에포크 41)
"training data" 섹션에 모든 캡션과 예시 워크플로우가 첨부되어 있습니다.
모든 이미지는 Birme 웹사이트를 사용해 자르고 크기 조정했고, GIMP로 워터마크나 텍스트를 제거한 후, 5장씩 배치로 Google의 Gemini 2.5 Pro에 입력했습니다(이미지 캡션 생성이 놀라울 정도로 뛰어납니다). seruva19의 프롬프트를 기반으로 하여 Gemini와 함께 모든 캡션을 작성했습니다. 캡션이 자세할수록 옷, 스타일, 디자인 등을 유연하게 조절할 수 있으나, 왕관, 가시 팔찌 등 핵심 요소는 유지되도록 했습니다. 초기 프롬프트를 조정한 후 캡션 품질이 매우 높았고, 거의 수정이 필요하지 않았습니다. 약 40장 이상부터는 너무 많은 맥락을 포함해 다시 프롬프트를 수정해야 했습니다. 대부분 수작업으로 진행했지만 자동화 가능할 것이라 생각합니다. 하지만 저는 신경 쓰지 않아도 되어서 좋았고, 약 2~3시간 정도 걸렸고, 이전에 만든 페니스 LoRA 캡션 작업보다 훨씬 덜 지루했습니다.
예시 캡션
BowsetteLORA, 평범한 밝은 따뜻한 핑크 배경. 실사 보셋테는 높게 묶인 볼륨감 있는 금발 머리카락을 지니고 있다. 그녀는 자주색 돔형 상단과 분홍색 보석 디테일이 보이는 금색 왕관을 쓰고 있다. 머리카락에서 두 개의 크고 부드러운 연한 갈색으로 위로 휘어진 뿔이 솟아 있다. 귀에는 파란색 구형 귀걸이가 있다. 목에는 실버 가시가 달린 블랙 초커가 둘러져 있다. 그녀의 복장은 흰색 트림이 있는 블랙 광택 스트랩리스 바디수트이며, 팔꿈치 위까지 길게 뻗은 블랙 장갑을 착용하고 있다. 장갑 상단에 실버 단추 디테일과 팔뚝에 흰색 가시 문양이 있다. 또한, 흰색 가시 밴드가 달린 블랙 히프 스타킹과 블랙 스틸레토 힐을 신고 있다. 등에는 흰색 트림과 긴 흰색 뾰족한 가시가 있는 녹색 등껍질이 있으며, 그 아래에서 흰색 뾰족한 가시가 달린 두꺼운 황색 꼬리가 나와 있다. 그녀는 몸을 약간 기울이고 한 손은 발톱처럼 들어 올린 채 카메라를 응시하고 있다. 전체 사진.
큰 감사의 말씀
항상처럼 seruva19, Ghibli, Red Line LoRA 및 학습 데이터는 제게 끊임없는 영감과 지식의 원천이 되었습니다.
학습 관련 질문에 항상 답해주는 Banodoco 디스코드 커뮤니티.
멋진 노드와 사용법에 대한 조언을 주신 Kijai에게도 감사드립니다.
