Astaroth

세부 정보

파일 다운로드

모델 설명

ver.2

나는 Astaroth를 반실사적 모델로 만들었다. 그러나 출력 결과를 보니 미완성처럼 느껴져, 사진에 더 가깝게 만들려 시도했고 이것이 버전 2다.

프롬프트 정확도가 약간 향상되었다. 구성과 자세의 역동성은 약간 줄어들었다. 신체 안정성과 손가락이 약간 감소할 수도 있다. 일부 이미지에서는 사진적 드로잉 방향으로 과도한 효과가 나타난다. 이미지에 따라 부정적 프롬프트에 "기름진 피부"를 추가하는 것을 권장한다.

모든 샘플 이미지는 LCM을 사용하여 512 x 768 픽셀로 출력되었으며, HiRes.Fix 또는 Adetailer는 사용하지 않았다. 이는 모델을 시연하기 위한 내 방식이며, 실제로는 이를 사용하는 것이 더 나은 점을 참고하라. 또한 SD1.5의 불가피한 문제이기도 하다. 업스케일러를 사용하는 경우, denoise strength가 0.3 미만인 ESRGAN 기반 업스케일러를 권장한다(예: 0.18. 나는 한때 0.09를 자주 사용했다). 원칙적으로 Latent 시스템은 생성 모델의 특성에 더 부합하지만, 성능 면에서는 열등한 것으로 보인다. 게다가 Latent 외의 방법에서는 생성 모델이 참조되지 않고, 내장된 업스케일러를 가진 모델을 사용해 출력 이미지를 확대하므로, 강도가 높을수록 모든 모델이 유사한 이미지를 생성할 위험이 있다. 물론 그 가정에 따라 모델을 조정하는 경우도 있지만, 이번에는 그렇지 않으므로 이 모델을 사용할 때는 반드시 낮은 강도로 유지하라.


ver.1

이 모델이 무엇인지 설명하는 것은 어렵다. 간단히 말해, 두 년 전에 내가 만들고 보관소에서 발견한 basilisk.fp16.safetensors라는 모델을 수정한 버전이다. 원래는 오래된 레시피를 기반으로 한 실패한 시도였다.

훨씬 더 오래된 레시피를 기반으로 했기 때문에 이미지 품질(저해상도 및 흐릿함)과 기본적 품질(예: 신체 구조)에 수많은 문제가 있었다. 이러한 문제를 해결하기 위해, 나는 NAI2로 핵심 구조를 강화하고, 사진 표현과 콘텐츠를 철저히 향상시켰으며, 최근 만들어온 고해상도 LoRA 모델들과 결합하여 이 모델을 만들었다. 일부는 원래 모델이 더 이상 관련이 없다고 말할지도 모른다.

NAI2를 사용한 사진 모델 측면에서, 나는 이미 Beyond을 통해 여러 모델을 실험해봤다. 하지만 애니메이션 모델을 고차원 레이어에 통합하면 캐릭터의 연령이 낮아지는 경향이 있어 CIVITAI에 공개하기 어려웠고, 이들은 보관 상태에 있다. 또한 다른 사람의 사진 기반 모델을 사용한 모델들도 꽤 좋은 향상을 이뤘지만, 고해상도 디스플레이에서 문제가 발생(단, 표준 해상도에서는 정상 작동)하여 매우 섬세한 상황에 놓여 있다.

이 모델은 고해상도 디스플레이를 지원하지만, 추천하지 않는다. 단조로운 이미지만 생성하기 때문이다. 또한 상당히 독특한 특성을 지니고 있어, 프롬프트에 따라 전혀 이미지를 생성하지 못할 수도 있다. 제작자 입장에서는 결과가 수용 가능한 수준이지만, 놀랍게도 신체 구조는 비교적 잘 정의되어 있다(단, 깨지면 붕괴됨). 손가락도 상당히 사실적으로 표현되어 있어 다소 납득이 가지 않는다.

DPM++SDE 샘플러가 가장 권장된다. 일반적으로 나는 20스텝을 사용하지만, DPM++SDE로 사진실사적 렌더링을 하려면 24스텝이 필요하다. CFG 스케일은 7~6이다. 이 샘플러는 가장 안정적인 신체 구조를 제공한다.

Euler a는 20스텝으로도 사진적 표현이 충분하지만, 반실사적인 톤을 띠며 중간 범위 얼굴 같은 세부사항에서 DPM++SDE만큼의 재현성을 갖지 못한다. 구성은 DPM++SDE가 더 안정적이지만, 약간 흥미가 부족하므로 Euler a를 시도해볼 만하다.

사진적 표현에는 DPM++3MSDE가 우수하지만, CFG 스케일을 약 3.5로 낮춰야 한다. 스텝 수는 약 28이다.

DDIM도 상당히 좋은 결과를 낸다. 세부사항의 안정성 측면에서는 DPM++SDE보다 약간 떨어지지만, 구성 및 기타 측면에서의 표현력은 매우 높다. 스텝 수는 30, CFG 스케일은 약 5.5 정도?

기능 검증의 대부분은 LCM으로 수행되었으며, 손가락 재현 면에서는 약간 열세이지만, 7스텝으로도 충분한 이미지를 생성한다.

모든 샘플러는 전반적으로 약간의 반실사적 톤을 유지할 수 있다.

샘플 이미지는 최근 내 표준이 된 512×768 픽셀의 저해상도 출력이다. HiRes.Fix와 Adetailer는 사용하지 않았다. CIVITAI에 대비해 부정적 프롬프트를 사용했지만, 필수는 아니다.

Astaroth는 독사(毒蛇)를 들고 있는 천사(악마)임을 참고하라. basilisk에 관한 훨씬 더 긴 이야기가 있지만, 그건 다음 기회에.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.