The Araminta Experiment (SDXL+Flux)

세부 정보

파일 다운로드

모델 설명

이 커뮤니티에 제가 기여한 바를 즐긴다면, 커피 한 잔 사주기를 통해 지원해 주세요: 제가 마시는 카페인의 양이 많을수록 더 많은 모델을 만들 수 있답니다 😅

비교 갤러리: Fv6-Fv5 및 NSFW 일러스트 비교: Gv1-Cv6-Fv2.

제 실험에서 현재 최고성능(SOTA) 모델:

  • SDXL 기본 모델: Gv4는 사실적이고 스타일리시한 NSFW 및 SFW 이미지를 모두 생성할 수 있는 가장 균형 잡힌 모델입니다. Fv6보다 더 뛰어난 미적 감각을 제공하지만, 사진처럼 사실적인 표현은 덜합니다.

  • SDXL 사진적 사실주의 모델(SFW 및 NSFW): Fv6는 과도한 사실성, 특히 현실적인 NSFW 이미지를 생성하려는 경우 최적의 선택입니다. 그러나 Gv4만큼의 스타일링 기능은 부족합니다.

  • SDXL 일러스트레이션: Gv4(SFW 및 NSFW). NSFW 이미지에 관심이 없다면 Cv6도 시도해 볼 만합니다.

  • Flux 모델: Flux1-A1

SDXL 모델용 이미지 생성 설정

DPM++ 2/3M SDE / Karras 또는 Exponential은 항상 25단계 이상과 CFG 약 5–7로 사용하는 것이 좋습니다. 그러나 DPM++ SDE / Karras를 사용해 단계를 줄이고(CFG 8–11) CFG를 높이는 것도 시도해 볼 만합니다. 또한 Euler Ancestral / Normal은 덜 상세한 결과를 제공하며, 특히 Fv6와 같은 모델에서 덜 “잡음” 있는 결과를 얻고 싶을 때 유용합니다.

기본 CLIP Skip 값 2도 좋은 선택이지만, 1 또는 3–4로 변경해 보는 것도 가치 있습니다: 1은 프롬프트에 더 가까운 결과를 유도하고, 3–4는 기본값보다 더 "개념"에 집중해 더 나은 결과를 낼 수 있습니다.

Flux 모델용 이미지 생성 설정

저의 선호 설정은 샘플러/스케줄러로 DPM++ 2M / beta 또는 sgm_uniform 또는 DDEIS / normal을 사용합니다. beta는 더 강렬하고 선명한 이미지를 생성합니다. 더 부드러운 이미지를 원한다면 Euler / simple 또는 beta가 좋은 선택입니다.

CFG는 최종 이미지에 큰 영향을 미치며, 사소한 변화에도 매우 민감합니다.

  • 사진용: 플라스틱 같은 피부를 피하기 위해 CFG를 낮게 유지하세요(1.5–2.5).

  • 미술 및 일러스트레이션용: 매체에 따라 달라지므로 더 복잡합니다. "거친" 스타일(회화, 수채화 등)의 경우 CFG는 여전히 1.5–2.5 범위 내로 낮게 유지하는 것이 좋지만, 애니메이션이나 만화 스타일의 경우 원하는 스타일을 얻기 위해 CFG를 더 높여야 합니다(3–6 또는 그 이상).

이미지가 혼란스럽거나 왜곡되거나 흐릿한 경우, 보통 CFG/스텝 설정이 해당 이미지에 부적절하기 때문입니다. 그러나 CFG/스텝을 늘려야 할지 줄여야 할지 판단하는 것은 항상 쉽지 않습니다(적어도 저에게는 😊).

Flux의 동작 방식은 SDXL과 매우 다르며, 이를 이해하고 적응해야 할 점이 많이 남아 있습니다.

워크플로우

제가 업로드한 모든 이미지에는 ComfyUI 워크플로우가 내장되어 있지만, CivitAI 처리 시스템과 호환되지 않아 대부분 프롬프트를 추출할 수 없습니다. 그러나 이미지 보기에서 "다운로드" 아이콘을 클릭하면 워크플로우가 포함된 원본 PNG 이미지를 다운로드할 수 있습니다.

저는 일반적으로 모델에서 바로 생성한 이미지에 가끔 제 Lora 또는 세부 사항 강화용 Lora를 추가하여 게시하곤 합니다. 그러나 최근에는 더 나은 상세한 구성 작업을 쉽게 만들기 위해 Controlnet도 활용하고 있습니다. 이 경우 소스 이미지는 워크플로우에 포함되지 않지만, 원하신다면 제가 게시한 이미지를 소스로 사용해 변형을 만들어도 괜찮습니다 :)

과거

E 시리즈부터, 모델은 때때로 다른 기여자들의 모델과 병합되며 진화하지만, 대부분은 저의 자체 데이터셋으로 학습을 통해 발전합니다. 현재 약 2,000장 정도로 규모는 작지만, 품질과 독창성으로 보완하려 노력하고 있습니다.

Fv1부터, 이전 버전을 사용해 제가 생성한 많은 합성 이미지를 포함했습니다. 프롬프트를 적극적으로 실험하고, 필요시 Photoshop으로 결과를 보정해, 원본 이미지가 풍부한 데이터셋을 구축했습니다.


이 모델의 핵심 아이디어는 개인적인 취향(간단히 말해 사진과 판타지 아트)에 맞는 기존 최고의 모델을 병합하여 다재다능한 도구를 만드는 것이었습니다. 주요 목표는 다음과 같습니다:

  1. 사진적 사실주의: 사람물체/자연 모두를 놀라울 정도로 사실적으로 생성할 수 있는 능력.

  2. 유연성: 다양한 스타일과 아티스트의 조합을 통해 고도로 스타일리시한 이미지를 생성할 수 있는 능력. 저는 오래된 세대에 속하며 유럽 출신이기 때문에, "스타일"이라는 말은 "가슴이 큰 일본 카와이 아이미"나 "수많은 슈퍼히어로와 볼륨감 있는 금발 여성 캐릭터가 등장하는 DC 만화"를 의미하지 않습니다. 오히려 프랭크 프라제타, 미로 마나라, 보리스 발레조, H.R. 기거, 보이테크 시우드마크 같은 판타지 아트의 거장들로부터 영감을 받았습니다. 물론 가슴도 나오지만, 스타일은 다소 다르죠 :P

  3. 인체 표현에 제한을 받기를 싫어하기 때문에, NSFW 모델도 충분히 강력하게 만들고자 했습니다. 그러나 사용 가능한 학습 이미지 데이터셋의 특성상, NSFW는 종종 포르노 사진이나 일본 애니메이션 포르노에 강한 편향을 보입니다. 이로 인해 유연성(예: 프롬프트에 "섹시"라는 단어를 사용하면 스타일을 조정해야 함)에 부정적인 영향을 미칩니다. 따라서 이 점은 기본 모델의 최우선 목표는 아니며, NSFW 전용 모델에서 더 강조됩니다.

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.