Wilykit v3 - (Thundercats 2011)
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
Wilykit v3 - Thundercats 2011
v3의 미리보기 이미지는 adetailer 확장 를 사용하여 더 높은 해상도로 얼굴을 생성 및 보정합니다.
이것은 Thundercats 2011 리부트 버전의 Wilykit을 모티브로 한 LoRA입니다. v3는 훈련 프로세스를 완전히 재작성한 버전으로, 보다 유연하고 강력하며 정확한 캐릭터 재현을 제공할 수 있습니다.
TL:DR
트리거 단어로 다음을 사용하세요:
Wilykit, 꼬리
기본 옷차림을 사용하려면 (구성에 따라 필요에 따라 제거):
wkoutift, 크롭 톱, 단일 스트랩, 팔밴드, 중음, 단일 팔보호대, 유틸리티 벨트, 벨트 포켓, 치마, 발자국, 분리형 레깅스
처음에는 1.5 정도의 가중치를 권장합니다 (훈련 방법 때문에 보통보다 높은 가중치가 필요함). 더 인간적인 느낌을 원하신다면 0.8로도 충분하지만, 얼굴 상징물과 신체 그림자 표현은 손실되지만 유연성은 늘어납니다. 아티팩트 없이 2.5~2.8까지도 끌어올릴 수 있습니다.
가중치가 높을수록 더 선명한 상징물 표현이 가능합니다.
이 LoRA는 대부분의 모델과 스타일 LoRA와도 잘 어울립니다.
심지어 사실적인 모델에서도 꽤 잘 작동합니다!
TL:DR 끝, 아래는 더 상세한 정보입니다!
v2에서 v3로의 훈련 프로세스에서 변경된 점은 다음과 같습니다.
훈련을 완전히 새로 시작하며, 데이터셋 규모를 크게 확장했습니다. v2는 오직 팬아트 40장 정도로 구성되어 있었고, v3는 팬아트와 공식 아트를 합쳐 170장 이상으로 구성되어 있습니다. 머리 부분 자르기 이미지를 추가하면 총 250장 이상이 됩니다. 이 훈련 방법은 제가 제작한 Mereoleona LoRA와 동일합니다 (훈련 과정의 자세한 설명은 해당 LoRA 설명 참고 혹은 아래 설명 참조).
이전 버전이 자동 생성 태그를 사용한 것과 달리, 모든 이미지에 대해 수동으로 태그를 지정했습니다.
Wilykit의 상징적인 옷차림을 특별히 훈련하고 태그화했습니다. 또한 다양한 옷차림에 넣을 수 있는 유연성과, 기본 옷차림의 색상이 프롬프트된 다른 옷차림에 번지지 않도록 주의했습니다.
이전 버전에서 보였던 눈에 띄는 문제점(프롬프트 없이 기본 옷차림 색상 번짐, 훈련 이미지 스타일의 번짐, 꼬리가 보이지 않음, 얼굴/신체 상징물 보이지 않음)은 거의 사라졌습니다.
단, 제가 발견한 오직 한 가지는 꼬리가 때때로 몸에서 분리되어 보일 수 있고, 꼬리가 정확하지 않을 때도 있으며, 때로는 여러 개의 꼬리가 동시에 나타나는 경우가 있다는 점입니다. 하지만 이미지 생성 경험상, 이는 그 자체로 흔한 현상이며, LoRA를 사용하지 않아도 꼬리가 정확하게 생성되는 경우는 흔하지 않습니다.
기본 옷차림의 색상이 다른 옷차림으로 번지는 문제는 대부분의 경우 줄어들었을 것입니다. 만약 다른 색상을 프롬프트하지 않으면 여전히 일부 색상이 보일 수 있지만, 이번에는 색상 변경이 훨씬 수월해졌습니다. dark blue/purple 외의 색상을 원할 땐 기존처럼 많이 힘들게 맞추지 않아도 됩니다.
스타일의 번짐 문제는 더 이상 걱정할 필요가 없으며, 관찰 결과 스타일 측면에서 매우 중립적인 수준입니다. 일부 태그는 약간의 영향을 줄 수 있지만, 이전 버전보다 훨씬 더 중립적일 것입니다.
위에서 언급했듯이, 사용된 훈련 방법에 따라 카라의 세부 묘사가 잘 드러나기 위해 일반적인 가중치보다 높은 가중치가 필요합니다. 얼굴 상징물이나 신체 그림자(흰 배, 갈색 몸체, 팔꿈치와 다리 아래쪽이 흰색)가 중요하지 않다면, 일반적인 가중치로도 문제없습니다. 이 모델은 고가중치일지라도 스타일에 영향을 주지 않도록 훈련되었으며, 훈련의 주요 목표 중 하나가 스타일 번짐을 최소화하는 것이었기 때문입니다.
이러한 점에서 고가중치는 이미지에 긍정적인 영향을 줄 수 있는데, 높은 가중치는 신체 상징물을 더 강조하고 선명하게 만들며, 그들 사이의 대비를 더 뚜렷하게 만들어줍니다. 일반적으로 LoRA를 사용하기 위해 더 높은 가중치가 필요하지만, 저는 이는 자결하는 체크박스처럼 신체 상징물을 켜고 끌 수 있다는 점에서 오히려 긍정적인 측면이라고 생각합니다.
훈련 방법에 관심이 있다면 (여기서 계속 언급하고 있으니), Mereoleona LoRA에 사용된 것과 정확히 동일합니다. 곧 더 깊이 있는 가이드를 제공할 예정이지만, 간단한 요약을 소개합니다.
공식 아트만을 사용해 LoRA를 생성합니다. (fancaps.net가 가장 유용합니다).
공식 아트만 사용하지만, 머리 부분만 잘라낸 이미지들로 훈련된 또 하나의 LoRA를 생성합니다.
두 LoRA를 0.7:0.3 비율로 병합합니다 (신체: 0.7, 머리: 0.3)
팬아트만 사용해 동일한 방식으로 다른 LoRA 두 개를 생성합니다.
최종 팬아트 LoRA와 최종 공식 아트 LoRA를 다시 0.7:0.3 비율로 병합합니다 (팬아트: 0.7, 공식 아트: 0.3)
최종적으로 생성된 LoRA는 구성 요소들의 합보다 훨씬 우수한 성능을 보이며, 유연한 캐릭터 모델을 제공하면서도 캐릭터 고유의 세부 사항을 유지합니다 (항상 켜진 공식 아트 이미지 포함 덕분).
오직 하나의 상충점은, 4개의 LoRA를 병합한 데다가 전체 강도가 떨어진다는 점입니다. 따라서 보상 차원에서 프롬프트 가중치를 높여야 합니다 (그러므로 여기서 2.0을 사용함).
저는 과도하게 훈련된 에포크를 사용해 더 높은 병합 실험도 시도했지만, 소수의 경우에 차이가 거의 없었습니다.




