AstolfoMix
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
AstolfoMix
20のモデルをエキゾチックにマージしたものです。詳細についてはこの記事をご覧ください。以下の内容は近日中に更新されます。
抽象
私はAstolfoMixを発表します。これはabsurdresに焦点を当てたマージモデルであり、アートスタイルを無視してほとんどのコンテンツをそのまま出力することを試みた、バイアス-バリアンスのトレードオフへのアプローチです。現在はアニメスタイルで、Astolfoはとてもかわいい!
はじめに
HuggingFaceのモデルページをご覧ください。そこにある内容を繰り返す時間はありません。また、すべての中間モデル・バリエーション も那里で利用できます。さらに他のモデルについてはこちらのページをご覧ください。
関連研究
「ユニフォームマージ」は独自のアイデアだと考えていますが、確信はありません。しかし、私はマージについていくつか調査しました。将来的な「ブースティング」アプローチについては、auto-MBW-rtをご覧ください(私の弱い「バンギング」アプローチとは異なります)。マニュアルMBWファンの方々には申し訳ありませんが、私は特別な好みを持っておらず、「absurdres」はそのような探索では一切カバーされていません。
手法
【免責事項】:あなたが私が書いている内容をすでに理解していない限り、これは冗談です。ここでは何も説明しません。実験部分と重複している可能性もあります。これは独立して検証が必要だからです。
CS関連の理論
私の記事を読み込んでください。それが博士課程の学生や教授にとってナンセンスかどうかを確認してください(もしかしたら正式な論文として発表するかもしれません)。また、996ライフの中でPythonコードを書くテストを行う時間もまだありません。
レシピ
完全なレシピはこちら。必ずこのツールキットを使用して、元のSDのCLIPと置き換えてください。すべての手順はWebUI内で行い、一行のコードも必要ありません。
実験
アートワーク
私の記事、私のアートワーク、および私の通常の手順(手動画像編集なし)に含まれています。「相関」の最後の部分は「近日中に完成します」。スコア指標は使用していません。なぜならすでに議論されています。私は、審美的な要素と論理的正当性の相関を試みる前に、差異化に関する基本的な指標を優先しています。個人的な感想として、「現実的なスケールでアニメ的なものを描く」点で、インターネット上の他のすべてのモデルと一線を画しています。
プロンプト
これはベースモデルです。「トリガー語」を意識せず、ご自身に馴染みのあるプロンプトをご使用ください。CivitAIのPNG情報は不完全です。代わりに私のアートワークをご覧ください。ComfyUIをご使用の場合は、プロンプト重みを無視してください、またはその仕組みがわからない場合。「Who What Where」だけでも十分です。
サンプラー
お好みのものをご使用ください。私はシンプルなのでデフォルトのサンプラーを使用しています。また、それ自体は悪くありません。
CFG / ステップ / アドオン
最初のレビューをありがとうございます。どの「デフォルト範囲」(CFG 7.5)でも動作します(明らかに)
経験上、CFG 4.5 〜 4.0 が最小最適値です。疑問があればプロットしてください。ローカルな潜在的アップサンプリングにはadetailerをご使用ください、またはグローバルなHiRes fixを組み込みでご利用ください(1024x1024には2.0x、768x768には2.5x、画像が崩れる場合はそれ以下に)。デフォルトのDynamic CFG(1を模倣!論文に従ってください!)、デフォルトのFreeU(論文に従ってください!)。これはあくまでベースモデルです。
エンベッディング / LoRAs
最初のレビューをありがとうございます。NAI / SDまたはそれらに「近い」モデルから学習された一般のエンベッディングであれば問題ありません
参考として、この投稿とこの投稿をご覧ください。(これらはクロスポストとして表示される可能性があります)最悪の場合、Hi-Resアップサンプリングの能力が失われることがあります。さらに(トリガーする可能性がありますが)、VBPのオリジナル273スタイルのエンベッディングをサポートしています。必要に応じてミラーを有効化します。
コンテンツ・アートスタイルの多様性
「はい」。ただし、これはあくまで「良質な」ベースモデルです。「幅広いコンテンツをベースに」。エンベッディングやLoRA、その他のツールを置き換えることはできません。細かいこと(非人間、非バイナリーなど)を実現するには、プロンプティングスキルが必要です。
議論
これは私の議論ではないと思います。 私のモデルをベースモデルとして使ってください:さらにマージしたり、LoRAやファインチューニングしたり、何でも歓迎です。このモデルは、HiResにおいて他の多くのモデルを凌駕し、SDXLのレベルに到達しているかもしれません。しかし、それは必ず代償を伴います(例:画像レイヤーを「v-pred」として扱い、LAIONデータセットで1024 ARBでトレーニングされたSDXLよりも大きな「バイアス」が必要)。これは私の能力を超えた話です。
結論
ぜひ私のモデルをお試しください!AstolfoMixは、私の個人的な「モデル選択」の結果にすぎません。皆さんは「ユニフォームマージ」を使って、素晴らしいSDXLモデルが登場する前に、自分だけのベースモデルを作成できます。また、豊富なリソースを持っていないなら、リスクの高いMBWやファインチューニングに時間を無駄にしないでください。
付録
使用したモデル
これは完全なレシピと同じです。




















