Experimental NoobAI with Rectified Flow + EQ-VAE
세부 정보
파일 다운로드
모델 설명
NoobAI v-pred 1.0을 기본으로 하여 Rectified Flow로 전환한 파인튜닝은 기본적으로 Anzhc의 EQ-VAE-B7을 사용합니다. 이 실험은 데이터가 여전히 분포 밖이기 때문에 어두운 장면에서 어려움을 겪지만, Rectified Flow가 SDXL 개선 노력의 다음 단계임을 보여줍니다(EQ-VAE 이상). 이 모델은 어떻게 든 내재된 청색 편향과 청색 이동에서 v-pred를 회복하지만, uncond에서는 여전히 개선이 부족하며, 적절한 파인튜닝을 통해 수정되어야 할 Zero Out negatives 문제를 겪고 있습니다.
사용 팁:
당신은 ModelSamplingSD3를 2.5로 처리할 수 있는 COMFYUI/SWARMUI 또는 다른 웹UI를 사용해야 합니다.
긍정적 프롬프트:
masterpiece, best quality부정적 프롬프트:
worst quality, low quality, worst aesthetic, old, early, blurry, lowres, signature, artist name, watermark, twitter username, sketch, logo, furry, text, speech bubble, censored, ai-generated, censorship, censor, mosaic censor또는 필요에 따라 유사한 내용
기술 설정:
샘플러: Euler, Euler CFG++ 안cestor 샘플러는 사용하지 마세요!
스탭: 20-28
스케줄러: Simple, Normal
CFG 스케일: 4.5-6.0
CFG++ 스케일: 1.0 - 2.0
해상도: 1024x1024 또는 ~~1.048.576 픽셀 이내의 모든 종횡비
ModelSamplingSD3: 2.5
이것 또한 당신의 허접한 모델 중 하나인가, Bluvoll? 어찌 보면 그렇습니다. 하지만 이 모델은 Rectified Flow SDXL이 완전히 가능함을 보여주기 위해 제작되었습니다. 충분한 데이터를 주면 NoobAI가 이에 쉽게 회복할 수 있습니다. 얼마나 많은 데이터가 필요할까요? 제가 보유하고 있지만 재정적 제한으로 사용할 수 없는 전체 NoobAI 데이터셋입니다. 따라서 이 모델에 미래가 있다고 생각하신다면, 제가 이를 현실화할 수 있도록 겸손하게 기부를 부탁드립니다. 얼마나 필요한가요? 전체 데이터셋에 대해 2 에포크, 또는 2천만 스텝, 약 1600~1900 달러가 필요할 것입니다. 분명히 나타날 문제들 때문입니다.
"왜 나는 당신을 신뢰해야 합니까, Bluvoll?" 당신은 신뢰할 필요가 없습니다. 우리 커뮤니티에는 'Unstable Diffusion'이라는 오명과 또 다른 'Resonance Cascade'가 있습니다. 따라서 누군가가 _컴퓨팅 자원_을 기부해 주신다면 완벽할 것입니다. 기부를 원하신다면, 저는 Ko-Fi를 운영하고 있으며, NoobAI 서버나 Arc en Ciel 서버에서도 찾을 수 있습니다. 특정 버전 7을 가진 흉물스러운 모델처럼 사용 불가능한 Rectified Flow가 아니라, 실제로 쓸 수 있는 Rectified Flow를 원하신다면 이 프로젝트를 지원해 주세요.
학습 정보:
학습 시 shift 2.5를 사용했습니다.
Cosine Optimal Transport를 사용했습니다.
Anzhc의 B7 VAE를 사용했습니다.
향후 개선 가능 사항:
더 많은 데이터를 사용한 더 나은 VAE
Clip L을 회복하고 BigG 성능을 더 향상시키기 위한 파인튜닝된 Clip Text Encoder
대비 흐름 매칭과 더 최신의 학습 기법을 활용한 개선된 학습













