Colorful
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
BeiAiArtLab 제작
ColorfulXL 출시되었어요! 하지만 우리가 그렇게 훌륭한 1.5 체크포인트를 갖고 있으면서 누구에게나 신경 쓸 필요가 있나요?
피드백과 여러분의 작품 예시의 제출에 매우 감사드립니다! 정말 다짐과 동기부여가 됩니다.
v 8.0에 관하여:
이 모델은 시네마틱, 사진, 애니메이션, 예술의 유일한 융합입니다.

이 버전이 최종 버전이라고 생각합니다. 지금부터 ColorfulXL을 만들 것입니다. 현재 더 개선할 점을 전혀 보지 못합니다. 이런 시간 동안 함께해 주신 모든 분들께 감사드립니다 (1년 이상!). 다양한 해상도를 시도하고 DPM 적응형(1단계)의 1단계 생성을 확인해 보세요 (다른 샘플러를 사용할 경우 10단계보다 빠를 수 있음).
제 설정
포트레이트: 768×1088
장면: 576×1280
샘플러: DPM++2M SDE Karras - 20단계, 최고 (10단계에서도 작동)
다른 유효 샘플러: Euler a, DPM2, DPM++2s a, DPM++ SDE, DPM++ 2s a Karras
DPM 적응형 - 1단계
VAE - 내장! (Civitai 버그로 인해 사이트 외부의 VAE를 지정해야 함: vae-ft-mse-840000-ema-pruned.safetensors)
v 7.3에 관하여:
매우 논란이 많고 복잡한 버전입니다.
음성 프롬프트, 샘플러, 해상도, 단계 수에 매우 민감합니다. 미술 측면에서 아마도 좋지 않을 수 있습니다.
실제로는 SD1.5의 전반적인 재구성 시도였습니다. 이는 종종 부정확한 해부학을 유발합니다. 그러나 저는 이 버전이 흥미롭다고 생각하며, 제 성능에 어떤 것을 만들 수 있는지 궁금합니다.
이전

이후

가장 큰 학습 세부사항
https://wandb.ai/recoilme/finetuning/runs/nkfsrchd
v 6.2에 관하여:
저는 고해상도 학습(1280)에서 운이 없었어요 (1280은 수백만 단계를 투자해도 쓰레기밖에 안 나옴, 약 $70 투자)
따라서 저는 기초 모델로 v3.7을 다시 사용하고, 960×576, 576×960, 768×768으로 재학습했습니다. 약간의 시네마틱 요소도 추가했습니다. 하지만 이것은 사진 실사형 모델은 아닙니다(저는 예술을 좋아함), 주로 반실사형입니다.
제 시간과 자원을 존중해 주세요. 만약 제 모델로 수익을 창출하고 싶으시다면 적절한 사용을 위해 저에게 연락해 주세요.
v 5.0에 관하여:
정말 힘들었지만, 비용은 매우 저렴했어요. 학습에 $30 미만과 약 1000개의 Civitai 크레딧만 사용했습니다.
처음으로 768/832 해상도에서 9-12단계로 생성 가능성을 유지했습니다. 제가 생각하기엔 품질은 Turbo/LCM보다 낫습니다. 하지만 일부 샘플러에서만 작동합니다.

그러므로, 처음부터 부정적 학습(노이즈)을 계속 탐색해 보았습니다. 지금까지 기형, 최악의 품질, 과포화 등과 같은 LoRA를 학습했습니다.

다른 가중치(예: -0.3)와 병합해 보았습니다.
SD1.5에 얼마나 많은 쓰레기가 있는지 놀라게 될 거에요!

동시에 현실적인 체크포인트를 학습 중입니다. 현실적인 학습은 매우 난이도가 높습니다.
예: “눈에 뒤덮인 여성”이 뭔가 여기와 비슷하게 나타날 수 있습니다.

다행히 Supermerger 팀과 제가 개발한 뛰어난 코사인 유사도 병합 알고리즘 덕분에, 다음과 같은 결과로 개선할 수 있었습니다.

최고의 비율, 매력적인 놀라운 우크라이나 여성의 사진, 흐물흐물한 뒷머리, 눈에 뒤덮여, 피부 모공, 빙하산 뒤에 있는 눈 덮인 풍경, 고해상도 피부, 필름 그레인
마지막으로
고해상도 이미지에서는 해부학이 완벽하지는 않습니다. 832×1024에서 배치 4에서 선택한 이미지입니다. 더 안정적인 해부학을 원한다면 768×960에서 낮은 조건으로 사용해 보세요.
즐겁게 사용하세요!
v 4.6에 관하여:
저는 '보기 싫은' 데이터셋을 생성했습니다.

그리고 그 데이터셋으로 학습한 후, “차이 더하기” 방식으로 병합했습니다.
이후 768×968, 968×768 등에서 해부학이 다소 개선되었으며, 이전에 비해 다음과 같은 모습이 됩니다.

이후

하지만 색감이 지나치게 포화되었습니다:
보다 깊이 있는 연구 끝에, 이 방법은 매우 큰 변화를 가져오며, 불행히도 한 곳을 고치면 다른 곳에서 파손되는 경향이 있음을 발견했습니다. 다른 우리가 사용할 수 있는 방법과 다르거나 직접 학습하는 것보다 더 나쁘지 않습니다.
따라서 저는 다시 "좋은 이미지"로 학습했고, 코사인 유사도로 병합했습니다
기묘하지만, 저는 일부 경우에서 낮은 단계에서도 고해상도 이미지를 생성할 수 있음을 발견했습니다.
v 3.7에 관하여:
이 모델은 무엇으로 학습되었는지. SDXL에 비해 약 10배 빠름. 저는 익숙한 관행으로 과적합을 했고, 낮은 학습률 4e-7과 adafactor를 유지했습니다(비록 크게 줄이진 않았지만). 4에폭 후 결과는 절대적으로 정상적임. 하루와 저녁 동안 그녀는 사실적인 모델을 학습했고, 이전에 배운 모든 것을 잊어버렸습니다. 병합을 통해 자르고, 또 4에폭 더 학습시켰습니다 - 다시 현실적 형태로 부상했고, 다시 자르기도 했습니다.
앞서 말했듯, 작용 약간씩 쌓여서, 다양한 비율로, 특히 포트레이트와 장면 생성에 집중하여 훈련했습니다. 정사각형 생성을 좋아하는 사람은 드물죠. 인형/만화는 특정 반실사 스타일로 제작했습니다. 멀리 있는 손/얼굴/구성은 좋지만 완벽하지는 않습니다.
최적의 해상도는 768×960입니다. 음성 프롬프트는 품질에 매우 큰 영향을 미칩니다. 예시를 확인해보세요. 이 음성 프롬프트는 잘 처리했지만, 기본적인 음성 프롬프트를 쓸 경우 흉물스러웠습니다. 왜 그런지 저는 모릅니다.
물론 1.5에서 SDXL을 바로 만들 수는 없었지만, 결과에 대해 저는 나이트롤리처럼 기뻐하고 있어요.
문의처
모델

















