RobMix CosXL Edit

세부 정보

파일 다운로드

모델 설명

RobMix CosXL Edit가 업그레이드되었습니다.

저는 RobMix Zenith로 얻은 결과에 매우 만족했기 때문에, 이것이 CosXL Edit와 어떻게 어우러질지 시도해보고 싶었습니다. 이 버전 역시 훌륭한 성능을 보여주었고, 혹시 여러분께도 도움이 될 수 있을 것 같아 공개하게 되었습니다.

이전 버전은 간단하고 대충 합친 것이었지만, 이번 버전에서는 이미지 모델의 최고 품질과 프롬프트 준수도를 끌어내기 위해, 블록별로 가중치를 조정하며 믹스를 더 세심하게 튜닝했습니다. 또한 Edit 모델의 지시사항 준수 능력을 최적화했습니다.

내부적으로, 이 버전은 Zenith에 포함된 모든 장점들을 그대로 포함합니다.

제 스타일 프롬프트 라이브러리와 함께 시도해보세요.

샘플 이미지 대부분은 양성 프롬프트로 제 스타일 프롬프트와 캐릭터 프롬프트를 그대로 사용했으며, Text CFG는 3~4, Image CFG는 1로 설정했습니다.

프롬프트는 RobMix Zenith에 최적화되어 있습니다.

이것은 CosXL Edit 체크포인트입니다. 다운로드 전 읽어주세요.

예시 ComfyUI 워크플로우 다운로드 여기.

Stability CosXL HuggingFace에서:

"Cos Stable Diffusion XL 1.0 Base는 코사인-지속적인 EDM VPred 스케줄을 사용하도록 조정되었습니다. 이 스케줄 변경의 가장 두드러진 특징은 완전한 검정에서 순백까지의 전체 색상 범위를 생성할 수 있으며, 각 단계에서 이미지의 변화율에 대한 미세한 개선점도 포함됩니다."

"Edit Stable Diffusion XL 1.0 Base는 코사인-지속적인 EDM VPred 스케줄을 사용하도록 조정되었으며, 지시된 이미지 편집 기능을 추가로 향상시켰습니다. 이 모델은 소스 이미지와 프롬프트를 입력으로 받아, 프롬프트를 이미지를 어떻게 수정할지에 대한 지시로 해석합니다."

초기 테스트에서 CosXL Edit 베이스 모델은 이미 훌륭했지만, 더욱 특별한 느낌을 주기 위해 최근에 제가 만든 SDXL 체크포인트 병합 기술을 일부 통합하고자 했습니다.

장점과 단점

장점:

  • 비교할 수 없는 대비도

  • 극도로 선명함

  • SDXL보다 더 흥미로운 구도와 다양성을 보이는 듯함

단점:

  • CFG에 매우 민감함. 4.0을 초과하면 리스케일링을 해도 아티팩트가 발생함

  • 주제에 대한 지식이 제한적임

CosXL 체크포인트 사용 방법

현재 작성 시점 기준으로, ComfyUI 및 StableSwarmUI는 CosXL을 기본 지원합니다. 다른 웹 UI에 대한 지원은 들은 바 없습니다.

대비와 디테일을 더 정교하게 조절하려면, 모델 파이프라인에 ModelSamplingContinuousEDM 노드를 추가하고, sigma_maxsigma_min 설정을 조정하세요.

제가 정확히 말하는 것은 아니지만, 이 값들은 각 단계에서 이미지에서 제거할 수 있는 최대 및 최소 노이즈량을 의미한다고 이해하고 있습니다.

_sigma_max_를 높이면 이미지의 대비가 증가하지만, 지나치게 높이면 이미지가 타버리는 경향이 있습니다. 일반적으로 120이 표준이며, 저는 약간 더 높은 값을 선호합니다.

_sigma_min_를 매우 낮은 값으로 내릴 수 있지만, 0.0001 이하 또는 0.1 이상으로 설정하면 명확한 아티팩트가 발생합니다.

CosXL Edit 프롬프팅

프롬프팅은 간단합니다. 변경하고 싶은 내용을 그대로 입력하세요. 예를 들어 이미지에 산꼭대기에 앉아 있는 남자가 있다면, "금발 머리의 여자"라고만 입력하면 됩니다.

권장 설정

예시 ComfyUI 워크플로우를 여기에서 다운로드하세요.

이 모델은 CFG에 매우 민감하므로 값을 낮게 유지하세요. cfg_text와 cfg_image의 비율을 조정하여 각 요소가 최종 이미지에 미치는 영향을 조절하세요. 높은 CFG는 이미지를 빠르게 손상시킵니다.

첫 번째 패스

  • 40스텝

  • cfg_text: 2.5

  • cfg_image: 1.5

  • DPM++ 3M SDE Karras

추가적으로 다음을 적용하면 더 나은 결과를 얻을 수 있습니다:

  • FreeU

    • B1: 1.05

    • B2: 1.08

    • S1: 0.95

    • S2: 0.88

  • Self-Attention Guidance

    • scale: 0.5–0.8

    • blur_sigma: 2.0–4.0

  • CFG Rescale: 약 0.3

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.