BoltMonkey-PhotoReal
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
BoltMonkey-PhotoReal
이것은 제가 여가 시간에 진행하는 비즈니스 프로젝트의 부가 결과로 개발한 극히 고화질의 사진실사형 SD1.5 모델입니다. 저는 AI의 오픈소스 성격을 신뢰하며, 제가 현재 진행 중인 프로젝트에서 사용하지 않을 일부 작업물을 점차 공개하고 있습니다. 이 모델은 약 1년 동안 서서히 개발해 왔습니다.
이 모델을 '병합 모델'로 표시했지만, 이미 30회 이상의 반복을 거쳤으며, 그 과정에서 수많은 블록 병합과 여러 차례의 미세 조정이 포함되어 있습니다.
이 모델은 SD1.5 기준으로 매우 사실적입니다.
손은 일반적으로 5개의 손가락을 가지며 왜곡되지 않지만, 지나치게 복잡하거나 부적절한 프롬프트 스타일은 손상이나 왜곡을 초래할 수 있습니다.
대부분의 텍스처가 잘 렌더링되지만, 광산 터널과 같이 극도로 먼지가 많은 환경은 저에게 약간 지나치게 일반적으로 보입니다.
조명과 그림자는 이 모델의 강점입니다. 특히 안개나 먼지가 있는 대기 중을 통과하는 빛줄기 같은 체적 조명이 매우 잘 렌더링됩니다.
제 샘플의 대부분은 동물을 사용하지만, 이 모델은 인간, 건축물, 자연 환경, 음식 등도 잘 생성합니다. 그러나 대부분의 교통수단에 대해서는 충분히 학습하지 못한 것 같습니다.
사용 권장 사항
저는 CivitAI 사용자들의 집합적 경험에서 프롬프트 작성법에 대해 배울 것이 많지만, 아래는 제가 효과적으로 작동하는 방법을 발견한 몇 가지 팁입니다:
_TL;DR:
DDIM, 15-40스텝, CFG ~2-10, Clipskip 1-4 (사용 목적에 따라 다름), LoRA가 잘 작동합니다._
이 모델은 정사각형 및 직사각형 비율에 잘 작동합니다. 해상도는 768x 이상이 가장 이상적이지만, 1024x 부근에서는 가끔 중복이 발생할 수 있습니다. 그러나 512x 이상도 충분히 우수한 이미지를 생성합니다.
이 모델의 출력 품질은 최소한의 프롬프트만으로도 매우 사실적이며, 구조화된 프롬프트를 사용할 때 탁월한 결과를 낳습니다. 또한 LoRA와도 매우 잘 작동하는데, LoRA의 학습 해상도(768+가 가장 좋음)를 고려해야 합니다. 저는 애니메이션 LoRA를 사용하지 않아 관련 조언은 드릴 수 없지만, 시도해보신 결과가 궁금합니다.
매우 간단한 프롬프트(예: "고양이")만으로도 고품질의 사진실사 이미지를 생성할 수 있지만, 이 모델은 품질 높은 지침 프롬프트와 다소 복잡한 프롬프트에도 매우 잘 반응합니다.
제가 자주 사용하는 프롬프트는 다음과 같습니다:
"초실사 사진, 32K UHD, absurdres, 자연광과 그림자, 체적 조명, 자연스러운 피부 텍스처, 세부 사항에 대한 정확한 표현, 심도의 흐림, 선명한 초점"
일반적으로 DPM++_3m_SDE_GPU 샘플러와 SGM_uniform 노이즈 스케줄을 사용하지만, 이 모델은 제 취향상 DDIM 샘플러와 DDIM_uniform 노이즈 스케줄과 가장 잘 작동합니다.
15스텝만으로도 일반적으로 우수한 이미지를 생성할 수 있지만, 저는 보통 25-40스텝을 사용합니다. ComfyUI의 최대 999스텝으로도 몇 번 생성해본 적이 있는데, 결과는 훌륭하지만, 최대 50스텝을 넘길 필요는 전혀 없다고 판단합니다.
CFG 값은 조정하기 어려운 요소입니다. CFG 2-4가 잘 작동하지만, 생성하려는 주제에 따라 10까지 높일 때도 있습니다. 4에서 시작하여 자신에게 맞는 값을 조정해보시기를 권장합니다. 당연히 낮은 값은 모델에 더 많은 자유를 줍니다.
이 모델은 clipskip 없이도 잘 작동하지만, 여러 개의 서로 다른 개념을 하나의 이미지로 병합할 때는 2~3단계 clipskip을 적용하여 개념 사이의 유동성을 높이는 것이 유리할 수 있습니다.
이 모델에 기여했을 수 있는 모델들
Juggernaut
LeoSam FilmGirl Ultra
Realia Photorealistic
MNK Realism
Analog Madness
Photon
EpicPhotogasm
앞서 언급했듯이, 저는 약 1년간 점진적으로 이 모델을 개발해왔습니다. 블록 단위로의 병합과 중간 미세 조정의 양을 고려하면, 현재 단계에서 포함된 각 모델의 전체 기여도는 매우 희석되어 있습니다.



















