Experimental NoobAI with Rectified Flow + EQ-VAE

詳細

ファイルをダウンロード

モデル説明

NoobAI v-pred 1.0をベースとし、デフォルトでRectified Flowに変換したファインチューニングモデルは、AnzhcのEQ-VAE-B7を使用しています。この実験はデータが分布外であるため、暗いシーンでの性能に課題がありますが、Rectified FlowがSDXLの改善における次のステップである(EQ-VAEだけでなく)ことを示しています。このモデルは、v-predの内在的な青みがかったシフトや青色バイアスを何らかの方法で回復していますが、uncond部分の改善が不足しており、Zero Out negativesの修正が必要です。これは適切なファインチューニングで解決可能です。

使用上のヒント:

ModelSamplingSD3を2.5で実行できるComfyUI/SWARMUIまたは任意のWebUIが必要です

  • ポジティブプロンプト: masterpiece, best quality

  • ネガティブプロンプト: worst quality, low quality, worst aesthetic, old, early, blurry, lowres, signature, artist name, watermark, twitter username, sketch, logo, furry, text, speech bubble, censored, ai-generated, censorship, censor, mosaic censor または必要に応じて同種の内容

技術的設定:

  • サンプラー: Euler, Euler CFG++ 絶対にアナセストラルサンプラーは使用しないでください!

  • ステップ数: 20–28

  • スケジューラ: Simple, Normal

  • CFGスケール: 4.5–6.0

  • CFG++スケール: 1.0–2.0

  • 解像度: 1024x1024、または~~1.048.576ピクセル以内の任意のアスペクト比

  • ModelSamplingSD3: 2.5

これはまた、あなたのひどいモデルの一つですか、Bluvoll?ある意味ではそうですが、これはRectified Flow SDXLが完全に可能であることを示すためのものです。十分なデータを提供できれば、NoobAIは簡単にこれに回復できます。どのくらいのデータが必要か?私が所有しているが、資金不足のため使用できない完全なNoobAIデータセットです。したがって、このモデルに将来性を感じるなら、私がこれを現実のものにするために寄付をいただけたら幸いです。どれくらい必要か?フルデータセットで2エポック、または2000万ステップ、約1600〜1900ドルが必要です(避けられない問題が発生するため)。

「なぜ私はあなたを信頼すべきですか、Bluvoll?」あなたは信頼する必要はありません。私たちのコミュニティには「Unstable Diffusion」と「Resonance Cascade」という汚点があります。そのため、誰かが計算リソースを寄付してくれれば、それは完璧です。どちらかの寄付を検討される方は、Ko-Fiをご利用ください。またはNoobAIのサーバーやArc en Cielのサーバーでお見かけできます。利用可能なRectified Flowを実現したいなら、バージョンに7がついているような粗悪なモデルとは違う、この取り組みを支援してください。

トレーニング情報:

  • トレーニングにはshift 2.5を使用しました。

  • Cosine Optimal Transportを使用しました。

  • AnzhcのB7 VAEを使用しました。

今後の改善可能性:

  • より多くのデータを用いた優れたVAEの開発

  • Clip Text Encoderのファインチューニングにより、Clip Lを回復しBigGのパフォーマンスをさらに向上

  • コントラスティブフローマッチングとその他の最新手法を用いた改善されたトレーニング

このモデルで生成された画像

画像が見つかりません。