AlbedoBase XL

세부 정보

파일 다운로드

모델 설명


모델에 가치를 찾으셨다면, 지원을 고려해 주세요. 귀하의 기여는 모두 SDXL 커뮤니티의 발전에 전념됩니다.

🙋🏼‍♂️ 우리와 함께하기 (discord) |ㅤ 🛒 구매하기ㅤ |ㅤ 🌱 기부하기


AlbedoBase XL (SFW&NSFW)

리파이너는 불필요하며, VAE가 포함되어 있습니다.


목표

Stable Diffusion XL은 35억 개의 파라미터(리파이너 제외)를 가지며, 이는 SD v1.5 버전의 약 3.6배에 해당합니다. 저는 이것이 단순한 숫자가 아니라 성능의 극적인 향상을 이끌어낼 수 있는 숫자라고 믿습니다.

우리 커뮤니티의 폭발적인 기여 덕분에 SD v1.5의 전체 성능이 상상 이상으로 향상되었음을 우리는 오래전에 인지했습니다. 따라서 저는 이 XL 버전에서도 v1.5에서 발생한 성능 향상을 최적화하여 재현하기 위해 이 AlbedoBase XL 모델을 완성하고 있습니다.

저의 목표는 Civitai에 공개적으로 업로드된 모든 체크포인트와 LoRA를 직접 성능 테스트한 뒤, 여러 필터를 통과한 최적의 자원만을 병합하는 것입니다. 이를 통해 Midjourney와 같은 기업의 이미지 생성 AI를 능가할 수 있을 것입니다.

현재 AlbedoBase XL v3.1 Large는 약 200개의 선택된 체크포인트와 251개의 LoRA를 병합했습니다.


로그

v3.1-Large

• V3에서 사용한 재귀 스크립트를 이용해 SDXL 모델 중 50개 이상의 최신 버전을 병합했습니다.

스펙 그리드(370.7 MB): 다운로드


v3-mini

오랫동안 기다리게 해드려서 진심으로 사과드립니다.

개인적인 문제를 처리하는 도중, 새로운 버전 작업을 하던 중 건강상의 문제도 겪었습니다. 지금 이 문장을 쓰고 있는 지금도 여전히 이 도전들에 맞서고 있습니다.

간단한 업데이트만으로는 부족하다고 느껴, 이보다 더 자세한 메시지를 공유하며 여러분의 이해를 구합니다.

버전 2.0 출시 이후, 저는 딥러닝을 독학으로 공부해 왔습니다. 저는 공식적인 학위가 없고, 프로그래밍에 대한 약간의 재능을 제외하면 예술 배경밖에 없습니다. 따라서 제가 투자한 시간과 노력을 고려할 때, 중요한 돌파구를 이끌어낼 수 있는 수학적·과학적 기반을 갖추지 못했습니다. 그럼에도 불구하고, 이 자율적인 학습과 연구에 몰입한 경험은 제 인생에서 소중한 보물이 되었습니다.

최근, 저는 잠재적으로 큰 돌파구가 될 수 있는 아이디어를 발견했습니다. 버전 2.0 이후 수백 개의 공식과 방법을 재작업한 끝에, 저는 다소 흥미롭고 성공적인 알고리즘을 개발했습니다. 이 모델 병합 과정은 SDXL1.0과 SD1.5, 그리고 기타 신중하게 선별된 모델을 기반으로 이루어졌습니다. 이들은 “애니메이션”, “리얼리즘”, “예술적”, “NSFW”, “기본”이라는 다섯 가지 주요 분류로 나뉘어 데이터셋으로 알고리즘에 공급되었습니다. 이 접근법은 몇 가지 흥미로운 결과를 도출했습니다.

그러나 알고리즘 개발만큼이나 도전적인 과정은 성능 테스트 단계였습니다. 이 기간 동안 저의 신체적·정신적 건강은 크게 악화되어, 혼자서 이 작업을 지속할 수 없음을 깨달았습니다. 이것이 바로 이 버전을 출시하기로 결정한 결정적 이유입니다.

이제, 기다리셨던 AlbedoBaseXL V3 Mini 버전을 발표하게 되어 매우 기쁩니다. 이 모델은 규모가 작지만, 특정 분야에 제한되지 않고 다양한 영역에서 뛰어난 성능을 발휘합니다. SDXL1.0의 새로운 기반 모델로 사용될 가능성이 있습니다. (참고로, 제 병합 알고리즘은 ‘선형 병합’이 아니므로, 본질적으로 새로운 미세 조정된 모델로 간주할 수 있습니다.)

이 모델은 기존 AlbedoBase 모델들과 함께 모든 면에서 이전 버전들을 능가하며 매우 유연합니다. (NSFW 콘텐츠는 극단적이지 않지만, 이전 버전(예: v2.1)보다 더 넓은 표현 범위를 제공합니다. 향후 전용 NSFW 병합 모델이 출시될 예정입니다.)

또한, 최근 많은 공유 모델들이 병합 또는 외부 상업적 사용을 금지하는 라이선스를 도입하고 있다는 것을 알게 되었습니다. 이는 매우 실망스러운 일이며, 제게 병합에 사용할 수 있는 정말 훌륭한 모델들을 사용하지 못하게 만들었습니다.

제가 병합에 사용할 수 있도록 자유 라이선스로 품질 높은 모델(많은 시간과 노력을 투자하여 만들어진 결과물)을 공유해 주신 모델 개발자 분들께 진심으로 감사드립니다.

곧 돌아오겠습니다.

애니메이션, 리얼리즘, 예술적, 2.5D, 3D, NSFW 등 다양한 분야에서의 성능 테스트를 기대하고 있습니다.

모델 개발자로서 우리는 단지 씨앗을 뿌릴 뿐입니다. 결국 꽃과 열매를 피우는 것은 여러분, 즉 모델 사용자이자 예술가들입니다.

항상 감사드립니다.


작업을 소액의 금전적 기부로 지원하고 싶으신 분들은 아래 링크를 활용해 주세요. 현재 저는 일자리를 구하지 못했으며, 생계에 대한 불확실한 미래를 겪고 있습니다.

🌱 기부하기

스펙 그리드(380.5 MB): 다운로드


v2.1
새로운 병합 알고리즘과 공식을 사용해 v0.1~2.0을 재병합 및 조정했습니다.

스펙 그리드(424.5 MB): 다운로드

v2.0

AlbedoBase XL Pre 측에서 저를 도와주신 모든 분들께 감사드립니다. 여러분이 없었다면 출시일은 훨씬 더 늦었을 것입니다. 진심으로 감사합니다!

  • 기존 AlbedoBase XL 모델들을 하나로 수렴시키기 위해 사용자 정의 스크립트를 작성했습니다. 제 고유한 공식에 따라 모든 U-NET 및 CLIP 블록의 행과 열 가중치를 정밀하게 정렬했습니다.

  • 이미지 생성 시 버그(생성되지 않음)를 발견하신다면, CLIP SKIP을 2로 변경하거나 프롬프트를 약간 수정해보세요! CLIP이 인식하지 못하는 프롬프트 조합이 있을 수 있습니다. 그 경우 단어 순서를 바꾸거나, 다른 단어를 사용하거나, 가장 간단하게 CLIP SKIP을 조정하시면 됩니다. 향후 v1.3처럼 점차 이러한 문제를 해결해 나가겠습니다.

스펙 그리드(403.5 MB): 다운로드

v1.3

  • 모델의 무작위성과 관련된 품질을 보여주기 위해, 샘플용으로 제시된 모든 이미지의 시드 값을 '9'로 표준화하고 즉시 생성했습니다.

  • 특히 이 버전은 부정 프롬프트의 영향이 크기 때문에, 부정 프롬프트 필드를 비워두면 훨씬 좋은 품질의 결과를 얻을 수 있습니다.

스펙 그리드(438.7 MB): 다운로드

  • 보시다시피, 스텝 수가 증가할수록 모든 샘플러에서 사용 가능해지며, 품질도 향상됩니다.

  • 아래에서 설명한 제가 개발하고 병합한 LoRA의 효과로, 태그(단어 리스트) 프롬프트보다 문장형 프롬프트를 사용하는 것이 품질 향상과 직결됩니다.

  • 저는 45개의 체크포인트와 7개의 LoRA를 병합했습니다. 이후, 오래되어 희석된 병합 모델을 다시 활성화하기 위해 AlbedoBase v0.4와 v0.3을 순차적으로 0~5% 미만의 비율로 다시 병합했습니다.

  • 이 7개의 LoRA 중 하나는 제가 만들었습니다. GPT4-V를 사용해 총 174개의 고품질 화보 이미지에 대해 캡션을 분석하고 주석을 달았습니다. 이 LoRA를 병합한 결과, 눈에 띄게 선명한 이미지와 놀라울 정도로 뛰어난 프롬프트 이해력을 얻었습니다.

_
v1.2_

  • 22개의 최신 체크포인트를 병합했습니다.

스펙 그리드(565.6 MB): 다운로드

v1.1

  • 안정화되었습니다.

  • 더 상세해졌습니다.

  • 고급 사용자라면 버전 1.0을 추천합니다. 버전 1.0이 적절한 설정을 찾는다면 훨씬 더 생동감 있는 결과물을 생성할 수 있습니다.

스펙 그리드(349.7 MB): 다운로드

v1.0

  • 106개의 LoRA를 병합했습니다.

  • 19개의 체크포인트를 병합했습니다.

  1. 모델의 결과는 선택한 설정에 따라 달라지므로, 사용 전 반드시 스펙 그리드를 확인하십시오.

    • 비대칭 눈이나 픽셀화된 이미지 문제를 해결하기 위해 몇 가지 특정 부정 프롬프트를 사용하는 것이 도움이 됩니다. 스펙 그리드는 CPU 또는 GPU 장치에 따라 달라질 수 있으므로 일반적인 참고용으로 사용하시기 바랍니다. 품질을 향상시키기 위해 몇 가지 부정 프롬프트를 실험해보세요(예: strabismus). 병합된 LoRA의 수가 증가할수록 모든 설정을 동등하게 만족시키는 것이 어려워집니다. 그러나 버전 1.0에서는 적절한 설정을 통해 다양한 면에서 놀라운 품질의 작품을 생성할 수 있다는 이점을 강조하고자 합니다. 향후 더 안정적인 버전으로 돌아오겠습니다.
  2. 샘플 이미지에서 유용한 설정 값을 찾거나 다른 사용자들의 결과를 검색해보세요.

  3. 항상 최고의 결과를 원한다면 부정 프롬프트는 비워두는 것이 좋습니다.

  4. 이 v1.0은 많은 노력을 기울인 작업이었기 때문에 잠시 휴식을 취하겠습니다. 모델을 즐겁게 사용해 주시고, 병합하신다면 Civitai에 무상으로 공유해 주세요. 그렇게 하면 우리 모두가 이 모델을 지속적으로 개선할 수 있습니다.

스펙 그리드(479.4 MB): 다운로드

v0.4

  • 132개의 LoRA를 병합했습니다.

  • 4개의 체크포인트를 병합했습니다.

스펙 그리드**:** 다운로드

v0.3

  • 모든 샘플러에서 향상되었습니다.

  • 생동감 있는 리얼리즘을 달성했습니다.

  • 안정화되었습니다.

스펙 그리드: 다운로드

v0.2

  • 선명도 및 디테일에서 큰 향상이 있었습니다.

  • 손과 발 표현이 개선되었습니다.

  • 미적 향상: 구도, 추상성, 흐름, 빛과 색상 등이 크게 향상되었습니다.

v0.1

  • SDXL1.0 모델에 적절한 미세 조정을 거친 후, Civitai에서 공개된 40개 이상의 고품질 모델을 신중하고 목적적으로 병합했습니다.

  • 테스트는 최소한의 프롬프트 토큰으로 최대 품질을 확보하는 데 중점을 두었으며, 많은 토큰을 사용했을 때 품질이 얼마나 향상되는지는 아직 확인되지 않았습니다. (자체 테스트를 진행하고 결과를 공유해 주세요.)

  • 일반적으로 현실과 애니메이션 사이의 중간 지점에서 가장 아름다운 결과를 얻을 수 있습니다.

  • 그러나 적절한 프롬프트를 사용하면 표현할 수 없는 것이 거의 없습니다. (이 모델이 병합 측면에서 다른 모델을 능가하는 가치 있는 기반 모델이라고 단언합니다. 그러나 이는 현재 v0.1이라는 점을 명심해 주세요.)

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.