Colorful
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
AiArtLabによるプロジェクト
カラフルXLがリリースされました!でも、優れた1.5チェックポイントがあるなら、誰が気にするでしょうか?
ご意見やあなたの作品の例を本当にありがとうございます!とても励みになります。
v 8.0について:
これは映画的、写真的、アニメ的、アート的要素を融合させた独自の作品です。

これは最終版だと思います。おそらくこれからカラフルXLの開発に集中するでしょう。今のところ改善できる点は見当たりません。この1年あまり、ずっとご支援くださいました皆様に感謝申し上げます。さまざまな解像度を試し、DPMアダプティブで1ステップ生成を検証してください(他にも10ステップで動作するサンプラーがあれば、そちらの方が早いかもしれません)。
私の設定
ポートレート:768×1088
ランドスケープ:576×1280
サンプラー:DPM++2M SDE Karras - 20ステップ、最良(10ステップでも可)
その他動作:Euler a、DPM2、DPM++2s a、DPM++ SDE、DPM++ 2s a Karras
DPMアダプティブ - 1ステップ
VAE - 付属済み!(CivitAIのバグにより、このサイトにないVAEを明記する必要があります:vae-ft-mse-840000-ema-pruned.safetensors)
v 7.3について:
非常に議論の多い、複雑なバージョンです。
ネガティブプロンプト、サンプラー、解像度、ステップ数に非常に敏感です。アート分野ではおそらく不向きです。
実際には、SD1.5全体を再構築しようという試みでしたが、多くは不自然な解剖構造を引き起こす結果になりました。それでも、このバージョンは興味深いと考えており、皆さんがどんな創造物を生み出すか、楽しみです。
前

後

最も詳細なトレーニングデータ
https://wandb.ai/recoilme/finetuning/runs/nkfsrchd
v 6.2について:
私は高解像度トレーニングに運がない(1280解像度は、何百万ステップもかけて無駄なデータを大量生成して、70ドルほど費やす)ので、ベースとしてv3.7に戻り、960×576、576×960、768×768でトレーニングを行いました。いくつかの映画的要素も追加しましたが、これは物々しくないモデルです(私は芸術を好みます)ので、主にセミリアル風です。
私の時間とリソースを尊重してください。私のモデルで利益を得たい場合は、公正な利用のために連絡してください。
v 5.0について:
非常に大変でした。でも安価です。トレーニングに30ドル未満、CivitAIのクレジットは約1000点ほどを使いました。
まず最初に、768/832解像度での9~12ステップ生成機能を維持しました。私なりの評価では、Turbo/LCMより質が良いと考えています。ただし、一部のサンプラーでのみ動作します。

そこでまず、ネガティブトレーニングに取り組み始めました。現在、歪み、最低品質、過度に色が濃い、などといったLoRAをトレーニング中です。

それらをさまざまな重み(例:-0.3)でマージして使用します。
SD1.5にどれほど多くの無駄なデータがあるのか、驚くことでしょう!

一方で、リアリスティックなチェックポイントのトレーニングも実施しました。リアリスティックは難しい。
たとえば、「雪に覆われた女性」というプロンプトで、次のような結果になります。

しかし、Supermergerチームと私の優れたコサイン類似度マージアルゴリズムのおかげで、次のように改善できました。

最適な比率、魅力的な美しいウクライナ人の女性、乱れたポニーテール、雪に覆われ、肌の毛穴、氷河の山脈の奥、雪、高精細な肌、フィルムノイズ
最後の注意:
高解像度では解剖構造が完璧ではないです。832×1024のバッチ4から選んだ画像です。より安定した解剖構造を求める場合は、768×960、低解像度で試してください。
楽しんでください!
v 4.6について:
「醜い画像」データセットを作成しました。

そのデータセットでトレーニングし、「差分追加」でマージしました。
その後、768×968、968×768などでは解剖構造が少しだけ改善しました。
前

後

しかし、色が過剰に濃くなってしまいました。
さらに研究を重ねた結果、この方法は非常に大きなシフトをもたらすことがわかりました。残念ながら、ある点を修正すると、別の点で問題が発生します。他の利用可能な方法や直接トレーニングより優れているとは言えません。
そこで、再度「良質な画像」でトレーニングし、コサイン類似度でマージしました!(以下の画像)

不思議ですが、ある状況では低ステップで高品質な画像が生成されることが判明しました。
v 3.7について:
トレーニング内容について。SDXLと比較すると、10倍速く、習慣的に過学習してしまいましたが、低学習率の4e-7とAdafactorを維持。カットもあまり行いませんでした。4エポックで結果はまっとうになりました。一夜と夕方の間で、リアルなモデルを学習し、これまで学んだすべてを忘れてしまいました。一旦マージで調整。さらに4エポック分の再学習を行った後、再びリアリズムに浮かび上がりました。再度調整)。
少しずつ、ポータレート・ランドスケープ生成の多様なアスペクト比に焦点を当てた学習を行った結果です。四角い画像生成を好む人は稀です。人形/アニメは特定のセミリアルスタイルに仕上げられています。遠くの手/顔や構図の扱いは改善されているものの、完璧ではないです。
最適な解像度は768×960です。ネガティブプロンプトは品質に非常に強い影響を与えます。例を確認してください。このネガティブプロンプトはうまくいったものの、基本的なものはあまり良くありません。なぜそうなのか、私にはわかりません。
もちろん、SDXLを一夜で作るのは無理ですが、結果はとても満足しています(象のように幸せです)。
連絡先
モデル









