Crystal Opal - PDXL Checkpoint

세부 정보

파일 다운로드

모델 설명

크리스탈 올라프는 투명에서 반투명에 이르는 몸체와 돌 내부에서 빛나는 것처럼 보이는 환상적인 색상 변화(play-of-color)로 높이 평가되는 올라프의 일종입니다. “크리스탈”이라는 표현은 올라프가 비정질(결정 구조가 아닌)이라는 구조적 특성과는 무관하며, 보석의 투명도와 빛이 통과하는 정도를 의미합니다. 크리스탈 올라프는 생동감 있고 종종 초현실적인 외관으로 인해 가장 호감을 받는 올라프 중 하나입니다.

이 모델을 왜 ‘크리스탈 올라프’라고 부르나요?

예술 작품의 아름다움은 빛과의 상호작용에 크게 기인합니다. 여러 방향으로 산란하고 굴절된 빛과 그림자의 패턴은 관점이 바뀌면서 변화하는 역동적인 색상 변화를 만들어냅니다. 크리스탈 올라프와 이 ‘크리스탈 올라프’ 모델은 이 특성을 공유합니다. 저는 빛의 효과를 자유롭게 구현하면서도 스타일에 매우 유연한 반실재적 모델을 원했고, 따라서 이름에도 유사한 미학을 반영하기로 결정했습니다.

어떻게 만들었나요?

크리스탈 올라프는 여러 PDXL 학습 모델과 병합을 통해 만들어졌으며, 이 병합들은 사실성, CGI, 예술적 스타일의 결합에 중점을 두었습니다. 불행히도 이 병합의 정확한 파라미터는 기능하지 않는 다른 컴퓨터에서 생성되었기 때문에 가지고 있지 않습니다. 하지만 기초 모델로는 Zovya의 Everclear PNY (아마도 V2) 가 사용되었을 것이라 확신합니다. 병합 결과는 피드백을 위해 공유되었고, 최근 공개 요청이 있어 이곳에 업로드하게 되었습니다.

기초 모델 출처: /model/341433/everclear-pny-by-zovya

Zovya의 Everclear PNY는 사용 가능한 PDXL 모델 중 가장 뛰어난 사실성을 생성하는 뛰어난 모델입니다. 꼭 한번 확인해 보시길 강력히 추천드립니다!

크리스탈 올라프가 어려워하는 점은 무엇인가요?

손과 눈과 같은 세부 사항은 거리가 멀어질수록 사라지는 경향이 있습니다. 일반적으로 저는 Adetailer를 사용하고, highres fix에서 이미지의 해상도나 스텝 수를 늘려서 이를 보정합니다. 여러 캐릭터 간 상호작용은 세부 사항을 흐리게 만들기 쉽습니다. 이 모델은 booru 태그로 매우 강하게 프롬프트되기 때문에, 여러 캐릭터에 서로 충돌하는 태그(예: “파란 머리, 갈색 머리”)를 사용하면 캐릭터의 특징이 혼동되거나 공유되는 현상이 발생합니다. Automatic1111에서 BREAK를 사용해 프롬프트를 분리하거나, 지역 프롬프팅 확장 기능을 사용해 프롬프트가 적용될 이미지 영역을 지정하면 이 문제를 해결할 수 있습니다. 향후 다중 캐릭터 개념으로 학습을 진행하여 이 문제를 모델 내부에서 극복할 수 있는지 실험할 계획입니다.

크리스탈 올라프의 주요 특징:

  • 유연성: 이 모델은 아티팩트 발생 전까지 여러 LoRA를 동시에 사용할 수 있습니다. 일반적으로 두 개까지, 모델이 과도하게 학습되지 않았다면 낮은 가중치로도 많은 보완 LoRA를 문제 없이 사용할 수 있습니다. 높은 CFG와 높은 스텝, 낮은 CFG와 낮은 스텝 모두 잘 동작합니다. 실험을 통해 가능한 범위를 확인해 보세요. 대부분의 PDXL 모델과 마찬가지로, 남성과 여성 해부학에 대한 지식을 바탕으로 NSFW 콘텐츠를 생성할 수 있습니다.

  • 캐릭터: 이 모델은 특정 캐릭터에 집중하여 학습되었습니다. 비디오 게임, CGI 영화, 일부 애니메이션 캐릭터의 인기 캐릭터를 이해합니다. 애니메이션 및 영화 캐릭터에 대한 이해력은 제한적이지만, 향후 이 부분을 개선할 계획입니다. Nier 시리즈, 오버워치, 리그 오브 레전드, 월드 오브 워크래프트, 데드 오어 얼라이브, 패탈 퓨리, 닌자 가이덴, RWBY 등의 캐릭터와 스타일을 인식하며, 목록은 계속 이어집니다.

  • 기본 동작: 좋은 결과를 얻기 위해 긍정적 미적 프롬프트는 필수는 아니지만, 모델은 이러한 프롬프트에 잘 반응합니다. 기본적으로 생성되는 요소를 제거하려는 경우가 아니면 부정적 프롬프트가 필요하지 않습니다. 다른 맥락 정보 없이 캐릭터만 프롬프트하면 일반적으로 배경은 단순하고, 캐릭터는 중앙에 정면을 바라보는 자세로 나타납니다. 대부분의 모델과 마찬가지로 인간 및 여성 생성을 선호하지만, 남성과 no_human을 프롬프트하면 문제없이 생성합니다.

크리스탈 올라프 사용법:

  • VAE: VAE는 내장되어 있지만, 원하는 어떤 SDXL 호환 VAE든 사용할 수 있습니다.

  • Sampler: 이 모델은 대부분의 샘플러와 문제 없이 호환됩니다. 저는 Euler A와 DPM++ 2M을 선호합니다. 아래 테스트 결과를 확인해 각 샘플러의 성능을 확인해 보세요.

  • CFG & Steps: 20 스텝에서 CFG 4~10 사이까지 큰 문제 없이 작동합니다. CFG가 높아질수록(약 20 이상) 아티팩트를 방지하기 위해 스텝을 40 이상으로 증가시키는 것이 좋습니다. 스텝이 낮을 때(약 8)는 CFG를 낮춤(약 4)으로 아티팩트를 방지하세요.

  • 크기 및 비율: 저는 크기가 1000 이상인 정사각형 비율을 선호합니다. 768~1280 사이의 크기에서 잘 생성됩니다. 이 범위를 초과하거나 미치지 못하면 왜곡이 생깁니다. Highres Fix, Image to Image, Depth Control Net을 사용하면 훨씬 더 큰 이미지를 생성할 수 있습니다. 권장 범위에서 크게 벗어나지 않는 한 일반적인 비율(1:1, 4:3, 3:2, 8:5, 16:9 및 그 반대 비율)도 안정적으로 생성됩니다.

  • 프롬프팅: PDXL 모델에 적합한 표준 품질 프롬프트(예: score_9, score_8_up, source_anime 등)가 매우 효과적입니다. 이 모델은 booru 태그 프롬프트에 가장 잘 반응하지만, 복잡한 문장은 정확도가 낮아집니다. 서로 충돌하는 프롬프트는 피하세요. 다음 프롬프트는 개별적으로 또는 조합하여 생성 이미지 스타일을 변경할 수 있습니다:

    • Blender (medium),
    • Anime screencap,
    • Realistic, photorealistic,
    • Game CG,
    • Bokeh, blurry background,
    • Monochrome,
    • Colorful, colors

테스트 및 샘플:

15스텝 및 30스텝 샘플러 그리드:

15스텝

30스텝

높은 CFG, 높은 스텝

낮은 CFG, 낮은 스텝

참고:

저는 전문가가 아니며, 모델 학습 및 병합에 훨씬 우수한 지식, 도구, 기술을 가진 분들이 많습니다. 저는 실험을 통해 배우는 것을 즐기며, 어떠한 피드백, 팁, 트릭도 환영합니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.