Experimental NoobAI with Rectified Flow + EQ-VAE

세부 정보

모델 설명

NoobAI v-pred 1.0을 기본으로 하여 Rectified Flow로 전환한 파인튜닝은 기본적으로 Anzhc의 EQ-VAE-B7을 사용합니다. 이 실험은 데이터가 여전히 분포 밖이기 때문에 어두운 장면에서 어려움을 겪지만, Rectified Flow가 SDXL 개선 노력의 다음 단계임을 보여줍니다(EQ-VAE 이상). 이 모델은 어떻게 든 내재된 청색 편향과 청색 이동에서 v-pred를 회복하지만, uncond에서는 여전히 개선이 부족하며, 적절한 파인튜닝을 통해 수정되어야 할 Zero Out negatives 문제를 겪고 있습니다.

사용 팁:

당신은 ModelSamplingSD3를 2.5로 처리할 수 있는 COMFYUI/SWARMUI 또는 다른 웹UI를 사용해야 합니다.

  • 긍정적 프롬프트: masterpiece, best quality

  • 부정적 프롬프트: worst quality, low quality, worst aesthetic, old, early, blurry, lowres, signature, artist name, watermark, twitter username, sketch, logo, furry, text, speech bubble, censored, ai-generated, censorship, censor, mosaic censor 또는 필요에 따라 유사한 내용

기술 설정:

  • 샘플러: Euler, Euler CFG++ 안cestor 샘플러는 사용하지 마세요!

  • 스탭: 20-28

  • 스케줄러: Simple, Normal

  • CFG 스케일: 4.5-6.0

  • CFG++ 스케일: 1.0 - 2.0

  • 해상도: 1024x1024 또는 ~~1.048.576 픽셀 이내의 모든 종횡비

  • ModelSamplingSD3: 2.5

이것 또한 당신의 허접한 모델 중 하나인가, Bluvoll? 어찌 보면 그렇습니다. 하지만 이 모델은 Rectified Flow SDXL이 완전히 가능함을 보여주기 위해 제작되었습니다. 충분한 데이터를 주면 NoobAI가 이에 쉽게 회복할 수 있습니다. 얼마나 많은 데이터가 필요할까요? 제가 보유하고 있지만 재정적 제한으로 사용할 수 없는 전체 NoobAI 데이터셋입니다. 따라서 이 모델에 미래가 있다고 생각하신다면, 제가 이를 현실화할 수 있도록 겸손하게 기부를 부탁드립니다. 얼마나 필요한가요? 전체 데이터셋에 대해 2 에포크, 또는 2천만 스텝, 약 1600~1900 달러가 필요할 것입니다. 분명히 나타날 문제들 때문입니다.

"왜 나는 당신을 신뢰해야 합니까, Bluvoll?" 당신은 신뢰할 필요가 없습니다. 우리 커뮤니티에는 'Unstable Diffusion'이라는 오명과 또 다른 'Resonance Cascade'가 있습니다. 따라서 누군가가 _컴퓨팅 자원_을 기부해 주신다면 완벽할 것입니다. 기부를 원하신다면, 저는 Ko-Fi를 운영하고 있으며, NoobAI 서버나 Arc en Ciel 서버에서도 찾을 수 있습니다. 특정 버전 7을 가진 흉물스러운 모델처럼 사용 불가능한 Rectified Flow가 아니라, 실제로 쓸 수 있는 Rectified Flow를 원하신다면 이 프로젝트를 지원해 주세요.

학습 정보:

  • 학습 시 shift 2.5를 사용했습니다.

  • Cosine Optimal Transport를 사용했습니다.

  • Anzhc의 B7 VAE를 사용했습니다.

향후 개선 가능 사항:

  • 더 많은 데이터를 사용한 더 나은 VAE

  • Clip L을 회복하고 BigG 성능을 더 향상시키기 위한 파인튜닝된 Clip Text Encoder

  • 대비 흐름 매칭과 더 최신의 학습 기법을 활용한 개선된 학습

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.