Clarity XL

세부 정보

파일 다운로드

모델 설명

설명 읽기

참고: Clarity XL은 현재 베타 단계입니다.

세부 조정이 진행 중입니다.

사진처럼 사실적인 결과를 원하시나요? 제 최신 SDXL 세부 조정 버전을 확인하세요: NatViS.


변경 사항

2024년 8월 26일 ClarityXL v2.0 Lightning 8step

  • 요청에 따라 ClarityXL v2.0의 8스텝 라이트닝 버전을 출시했습니다. 자세한 내용은 _이 버전에 대해_를 꼭 읽어주세요.

    • 참고: 색상이 흐릿하게 보인다면 CFG 값을 낮추세요(1.5 - 2.5). 샘플 이미지에서 저는 이를 너무 높게 설정하는 실수를 했습니다.

————

2024년 8월 12일 ClarityXL v2.0

  • ClarityXL v2.0을 출시했습니다. _이 버전에 대해_를 읽고 새로 추가된 내용을 확인하세요.

커피 한 잔 사주기 ❤

https://ko-fi.com/ndimensional

저는 이메일로 기부를 요청하는 것을 좋아하지 않았지만, 이 규모의 SDXL 세부 조정은 점점 비싸워지고 있습니다. 그래서 불가피하게 요청드리겠습니다. 제가 만든 모델을 좋아하시고 지원하고 싶으시다면, Ko-Fi 에 기부를 고려해주세요. 💌
기부자 분들께는 업데이트 공지, 질문 응답, 피드백 수용, 그리고 조기 접근 모델(비독점)을 제공할 예정입니다.

모든 기부금은 새로운 Stable Diffusion 세부 조정 모델 및 오픈소스 AI 도구 개발에 사용됩니다.


개요

SD1.5용 원래 Clarity 모델을 이어받아, Clarity XL은 SDXL의 더 복잡한 아키텍처 내에서 원래 모델의 기능을 재현하고 확장하려는 시도입니다.

Clarity SD1.5와 Clarity XL의 차이점

현재 Clarity XL은纯粹하게 사진처럼 사실적인 표현에 초점을 맞추고 있습니다. 이는 향후 릴리즈에서 확장할 기반을 구축하기 위한 의도적 선택입니다. Clarity XL이 일반 목적 모델이 될ことは 결코 없습니다. 항상 사진적 사실성에 편향될 것입니다. 향후 릴리즈에서는 더 복잡한 사진적/영화적 장면 기능이 추가될 예정입니다.

개선 사항

  • 진정성 있는 (수정되지 않은) 사진적 사실성 강조

  • 높은 이미지 정밀도

  • 프롬프트 준수: 모델이 사용자의 프롬프트를 얼마나 잘 따르는지

    • 모델이 학습하지 않은 개념은 제외
  • 향상된 피부 텍스처

  • 전반적인 미적 개선

  • 비디오 게임/영화 캐릭터 인식

    • 세계관, 풍경, 설정 등 포함
  • 자유로운 프롬프트 작성: 자연어 프롬프트, 쉼표로 구분된 목록, 두 방식의 하이브리드 모두 지원합니다. 프롬프트는 짧거나 길거나 원하는 대로 작성 가능합니다.

제한 사항

  • 복잡한 장면: 예: 손에서 번개를 쏘아 올리며 밝은 파란색 빛줄기들이 뒤섞인 화려한 폭발

  • 다중 매체 생성: 현재 모델은 사진적 사실성과 영화적 연출에 집중되어 있습니다.

모델 세부 정보

  • 기반 모델: Stable Diffusion XL v1.0

    • Clarity XL v1은 중간 학습 에포크이므로, 이 에포크를 아직 출시되지 않은 LomoXL의 세부 조정 업데이트와 병합했습니다. 기반 에포크의 원래 가중치 행렬을 보존하기 위해 DARE 병합 방법의 수정 버전을 사용했습니다. 이후 릴리즈에서는 이 과정이 필요하지 않습니다.
  • 데이터: 데이터셋 생성 시 품질을 최우선으로 설정했습니다. 모든 이미지-캡션 쌍은 여러 번 반복하여 클린징하여 세부 조정에 사용할 고품질 데이터만 선별했습니다.

    • 캡션: 캡션은 제 MLLM 캡셔닝 시스템이 작성했으며, GroundingDINO + 추론 엔진 + NLP를 통해 검증했습니다.

      • 캡션은 자연어 형식으로 작성되었지만, SDXL의 텍스트 인코더는 다양한 프롬프트 스타일을 지원합니다.
  • VAE: sdxl-vae-fp16-fix

  • 종횡비: 학습 데이터 기반으로 SDXL의 일반적인 종횡비 모두 사용 가능합니다.

    • 1344x768 (16:9) — 영화 컷스틸

    • 1536x640 (21:9) — 초광각 영화 컷스틸

    • 1152x896 (4:3) — 풀스크린

    • 1216x832 (3:2) — 모바일 가로

    • 1024x1024 (1:1) — 정사각형

    • 1024x704 (11:16)

    • 768x1344 (9:16) — 세로 (인스타그램 스토리 / 스냅챗)

    • 896x1152 (3:4)

    • 832x1216 (2:3) — 모바일 세로

    • 704x1024 (16:11)

🤗Huggingface 저장소


변경 사항

2024년 5월 23일 Clarity XL v1.0:

  • 최초 출시

다른 모델도 확인하세요

SDXL 체크포인트: https://civitai.com/collections/966964

SDXL LoRAs: https://civitai.com/collections/966969

40K 시리즈: https://civitai.com/collections/956187

SD1.5 체크포인트: https://civitai.com/collections/966974

SD1.5 LoRAs: https://civitai.com/collections/966972


Tensor Art에서 Clarity XL 실행: https://tensor.art/models/740350571376126636?source_id=nj2-r1nnnUO3ovUiaHf19Bgn

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.