kegant

세부 정보

파일 다운로드

모델 설명

kegant


워크플로우(ComfyUI):

✨ v4 ✨ /model/1856037?modelVersionId=2100596

✨ v1-v3: ✨ /model/861472?modelVersionId=963859

ComfyUI를 사용하지 않는 경우, 행운을 빕니다!


V4 업데이트: V4는 V3 데이터셋의 대부분을 포함하지만 일부 이미지가 필터링되었고, 무엇보다도 기반 모델로 pony에서 noobai-vpred로 전환되었습니다. 따라서 noobai가 학습된 방식에 맞는 적절한 danbooru 태그를 사용하세요. 도움이 필요하면, 제가 프롬프트 시작부분에 일반적으로 사용하는 태그 스타일을 확인하기 위해 제가 공개한 일부 이미지를 참조하세요. ComfyUI를 사용하는 주된 이유는 vpred의 채도와 대비를 낮추기 위함입니다. 소개 이미지들은 모두 완전한 덴노이즈로 생성되었지만, 주 KSampler의 덴노이즈 값을 0.8로 낮추는 것이 매우 권장됩니다. 이는 vpred 모델의 덴노이징 패턴이 eps(또는 엡실론 모델)과 훨씬 다르기 때문입니다. 이 버전은 완벽하지 않으며, 흐림과 심도 효과와 같은 일부 태그는 여전히 문제가 있습니다. 원하는 효과가 지나치게 강하게 나타난다면 네거티브 프롬프트에 'blur' 또는 'depth of field'를 추가하면 해결될 수 있습니다. 생성기만 사용하고 있어 제 첨부된 ComfyUI 워크플로우에서처럼 수동으로 샘플러를 조정할 수 없다면, 네거티브 프롬프트에 'red_theme' 및 'blue_theme'를 같이 추가하는 것도 도움이 됩니다. 그러나 솔직히 말해, 이 체크포인트를 사용하신다면 첨부된 워크플로우를 사용해 제가 어떻게 사용하는지 확인하시는 것이 가장 좋습니다.
그러나 소개된 모든 이미지는 ComfyUI 후에 포토샵이나 편집을 하지 않았으며, i2i도 사용하지 않았습니다. 하지만 얼굴 디테일러를 사용했습니다. 이 체크포인트는 'full_body'나 'wide_angle'과 같은 원거리 촬영에서 얼굴 생성에 V1~V3의 pony 버전보다 더 큰 어려움을 겪습니다. 따라서 이 버전에서는 얼굴 디테일러를 매우 권장합니다. V4 워크플로우에 얼굴 디테일러가 첨부되어 있습니다. 설정이 매우 간단하며, 전체 잠재 공간을 사용하는 것보다 더 빠르게 실행되며, 원거리에서의 얼굴 품질을 획기적으로 향상시킵니다. 저는 이 가이드를 사용하고 있습니다(매우 잘 작동합니다):
https://www.youtube.com/watch?v=gDBeKIa4sHA


V3 업데이트: V3는 주로 몬스터 관련 업데이트이며, 몇 가지 캐스팅은 있지만 무엇보다도 예술적 요소에 대한 더 미세한 제어가 가능해졌습니다. 저는 이 버전을 위해 GIMP를 사용해 많은 소스 이미지를 수동으로 편집해 JPEG 아티팩트를 인체가 가능한 한 최대한 제거했습니다. 워터마크는 존재하지 않으며, 부정적으로 태깅할 필요도 없습니다. 식물 및 생물 관련 문제는 해결되었고, 남성 캐릭터 생성도 향상되었습니다. 이 업데이트에 포함된 이미지의 전체 태그 목록은 '버전에 대해' 섹션에 있습니다. V3의 많은 이미지에는 매우 강력한 태그가 적용되어 있습니다. 예를 들어 'film grain, halftone effect, dark fantasy, muted colors, sepia' 등이 있습니다. 이 태그를 자주 사용하는 이유는 제 프롬프트가 참조한 소스 이미지들에 해당 요소들이 포함되어 있었기 때문입니다. 이러한 스타일을 원치 않으신다면, 일반적인 애니메이션 스타일을 원하시면 이 태그들을 네거티브 프롬프트에 추가하세요. 일부 경우 스타일이 너무 강력해 프롬프트를 지정하지 않아도 흘러나올 수 있습니다. 무기들도 몇 가지 추가되었으며, 주로 검과 'Guts'의 '거대한 검' 및 카타나(씨스에서 유래)가 포함됩니다. 무기를 포함한 이미지 생성은 SDXL의 한계로 인해 프롬프팅 기술이 아무리 뛰어나도 항상 어려우나, 카타나와 검 이미지가 모델이 이 무기들을 더 정확한 자세로 생성하도록 도울 것입니다.


V2 업데이트: V2는 제가 처음으로 직접 훈련하고 영향을 준 버전입니다. V1과 거의 동일한 구조를 유지하지만, 일부 가중치가 낮춰졌고, 제가 추가하고 훈련한 이미지들이 V1이 가졌던 몇 가지 문제를 해결했습니다. V2는 사막 스타일 조명과 효과에 더 집중하며, 예술적 스타일을 약간 조정해 눈과 입을 조금 더 작게 표현했습니다. 이 버전에서 조명은 더욱 과도해졌고, 조명에 더 이상 개선을 추가하면 전체 모델이 붕괴될 것 같습니다. 이 버전을 'kegant 사막 업데이트'라고 부를 수 있겠습니다.


kegant PDXL은 포니를 더 레트로하고 거친 외관으로 변형시키는 것을 목표로 하며, 조명 효과에 중점을 둔 포니 기반 모델입니다.

이 모델은 주로 5개의 별도 LoRA와 1개의 임베딩을 ponyv6 모델에 결합한 방식으로 구성되어 있습니다. 이 모델들은 다음과 같습니다:

/model/366990/pony-custom-styles?modelVersionId=454703

/model/341353/expressiveh-hentai-lora-style?modelVersionId=382152

/model/550871/bss-styles-for-pony?modelVersionId=669776

/model/122359/detail-tweaker-xl?modelVersionId=135867

/model/118418/negativexl?modelVersionId=134583

/model/264290/styles-for-pony-diffusion-v6-xl-not-artists-styles?modelVersionId=330475

이번 베이킹 과정에서 사용된 설정은 다음과 같습니다:

  • Kenva: .8

  • ExpressiveH: .8

  • GLSHS: .8

  • add_detail: .5

  • negativeXL_D: 1

  • Concept Art Twilight: .3

이 모델은 여성 생성에 편향이 있으며, 피사체를 너무 가깝거나 멀리 두지 않기를 선호합니다. 전체 신체를 생성하는 것은 다소 어려울 수 있지만, 'shoes', 'boots', 'feet' 또는 'toes'와 같은 세부 요소를 명시하면 원하는 전체 신체 생성의 확률이 크게 높아집니다. 기억하세요 — 이것은 포니 기반 체크포인트입니다. 일반 영어보다 danbooru 스타일 태그를 훨씬 선호합니다. 때로는 적을수록 더 좋습니다. 너무 많은 태그를 프롬프트에 집어넣으면 모델이 무엇을 해야 할지 이해하기 어려워집니다. 전체 신체가 중요하다면 프롬프트 시작부분에 'full_body' 태그를 붙이세요. 프롬프트에서 위치가 높을수록 중요도가 높아지기 때문입니다. 수동으로 가중치를 조정하면 더욱 효과적입니다. 이 체크포인트를 어떻게 사용해야 할지 도움이 필요하시면, 제가 사용한 모든 프롬프트를 공개해 두었습니다.

그러나 이 체크포인트는 염소(즉, V6) 모델만큼 유연하지는 않습니다. 그러나 유연성에 대한 대가로 더 많은 조명, 예술적 스타일, 그리고 생성 속도를 얻게 됩니다. 이 체크포인트에 포함된 모든 LoRA를 베이킹한 상태로 동일한 이미지 스택을 생성하는 데 걸리는 시간은 V6와 모든 LoRA를 별도로 사용하는 것보다 약 3배 빠릅니다. 이것이 이 체크포인트의 주된 목적입니다.

✨ 멋진 창작물을 아래에 공유해주세요! ✨

제 첫 번째 체크포인트를 시도해 주셔서 감사합니다.


보다 자세한 프롬프팅 가이드는 Pony V6 모델 페이지를 참조하세요.

☄️ 생성 권장 사항

* 모든 프리뷰 이미지는 최종 두 장을 제외하고는 어떤 LoRA도 사용하지 않고 생성되었습니다. Haruko Haruhara와 Lain은 포니 모델이 이 캐릭터들을 인식하지 못하며, 매우 스타일리시한 캐릭터이므로 단독 프롬프팅이 매우 어렵기 때문입니다. 다른 자원은 사용하지 않았고, 단순히 텍스트-to-이미지 생성 후 잠재 공간 업스케일링만二次 통과했습니다(픽셀 업스케일링은 포함되지 않았음).

대부분의 샘플 이미지는 초기 단계에서 다음과 같은 유형의 원형 샘플러를 사용하여 생성했습니다:

  • 샘플러: Euler A / DPM++A

  • 스케줄 유형: Karras

  • 스텝: 20 - 30

  • CFG: 2 - 6

  • Clip Skip: 2

  • 덴노이즈: 1

사용된 잠재 공간 업스케일러는 위와 유사하며, 일반적으로 이미지 생성 속도가 빠른 Euler 계열을 선택했습니다.

  • 샘플러: Euler A / DPM++A

  • 스케줄 유형: Karras

  • 스텝: 15

  • CFG: 2 - 6

  • 덴노이즈: 0.5

  • 업스케일 비율: 1.5–2.0

생성 팁: 잠재 공간 업스케일러에서 CFG와 스텝을 낮추면 그림 같은 느낌이 더 강해지고, 특징이 부드럽고 덜 선명해져 일부 이미지에서 '안개' 같은 효과를 줍니다. 반대로 CFG를 높이면 '베이킹'되고 반짝이는 느낌이 강해집니다. 3.0 CFG는 모든 LoRA를 최적화해 균형을 이루는 중간지점에 가까운 설정입니다. 첨부된 Harley Quinn 이미지의 경우, 이 효과를 보여주기 위해 CFG 10을 사용했지만, 매우 추상적입니다.

제 첨부된 워크플로우를 꼭 확인해보세요. 슬림하고 광택 있는 디자인을 선호하시든, 필름 그레인 효과가 있는 부드러운 극도의 레트로 감성을 원하시든, kegant을 최대한 활용하는 방법을 정확히 설명하고 있습니다.

마지막 한 가지: 이 체크포인트는 일반적으로 'JPEG 아티팩트'와 다양한 생물(식물, 꽃 등)을 추가하며, '사이버펑크' 요소도 추가하는 경향이 있습니다. 이러한 요소를 원하지 않는다면 네거티브 프롬프트에 추가하면 대부분 잘 제거됩니다. 남성 캐릭터 생성 시, 네거티브 프롬프트에 '1girl'을 명시하면 매우 큰 도움이 됩니다. 앞서 언급했듯이, 이 체크포인트는 여성 캐릭터를 훨씬 더 선호합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.