EasyFluff
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
2024年3月29日更新:Fluffusion R3を基にしたより実験的な個人的なマージモデルが公開されました。このマージモデルは、このモデルシリーズの以前のバージョンとは異なります。そのため、以前のような命名スキームは明示的に与えられません。このモデルはv-predictionモデルであるため、YAMLまたはサンプリングノードを覚えておいてください。Fluffusionはclip skip 2で学習されているため、お使いのUIで必ずそれを設定してください。
以下は古くなった情報です。これ以上ありません。
結果が過剰に彩度が高く、滑らかで詳細が不足している?まったく結果が出ない?以下の内容をお読みください!

これはterminal-snr-v-predictionモデルであり、モデルと並行して設定ファイルとCFG Rescale WebUI拡張機能が必要です!詳細およびComfyUI用同等設定は下記をご覧ください。
このモデルの実行方法
- これはterminal-snr-v-predictionモデルであり、v-predictionモードでモデルを読み込むには、併用する設定ファイルが必要です。ファイルドロップダウンからダウンロードし、モデルと同じフォルダーに配置してください。
- また、https://github.com/Seshelle/CFG_Rescale_webui も必要です。この拡張機能は、拡張機能タブからこのリポジトリのリンクを「URLからインストール」セクションに貼り付けてインストールできます。拡張機能の作成者自身はCFG Rescale値として0.7を推奨しています。インストール後、CFG Rescaleスライダーは生成パラメータの下、スクリプトセクションの上に表示されます。CFG Rescaleを設定せずに推論を実行すると、この研究論文に示されているような結果が得られます。

- ComfyUIをお使いの場合は、https://github.com/comfyanonymous/ComfyUI_experiments から sampler_rescalecfg.py ノードが必要です。
このモデルのプロンプトの書き方
- V7以降、自然言語はこのモデルに強い影響を与えます。すべてを理解できるわけではありませんが、良い結果を得られる可能性があります。そして、これ以上引き出せなくなったら、e621タグを使ってプロンプトを洗練させることができます。(タグだけを使う方法でも、どちらでも問題ありません。)
- プロンプトは、望んでいる内容を簡潔に自然言語で記述して始めて、その後e621タグで特定の概念を精緻化してください。このモデルはv-predictionモデルであるため、プロンプトの解釈はやや直喩的になります。
- SD 1.5で使われていた多くのフレーバーワードやアーティストが再び有効です。
- PolyFurはMiniGPT-4のキャプションで学習されているため、プロンプトを非常に装飾的に、文を多用して書いてみてください。(プレビュー画像の生成情報で確認できます。)
- 既知のキャラクターが正確に生成されない場合は、そのタグの強度を上げて、外見を示唆するいくつかの暗黙のタグを追加してください。FluffyRockのデータセットで人気が低く、画像が少ないキャラクターは、LORAなしではうまく生成されないことが多いです。
- カメラアングルのキーワード、特にclose-upの重み付けは強くしすぎないでください。
- 解像度は576から1088の間が、FluffyRockの学習範囲に合致するため、適切に動作します。
モデル情報と作成プロセス
V8.1が利用可能です。しばらくの間、最後のメジャーバージョンです。現在、FeffyのクオリティタgLORAは組み込まれていませんので、LORAとして使用することを推奨します。V4〜V6までは、@FeffyのクオリティタgLORAがこのモデルのFluffyRock部分に組み込まれていました。ポジティブ/ネガティブプロンプトに「masterpiece」「best quality」「worst quality」「low quality」「normal quality」を追加してください。
このモデルは**「Train Difference」**ミックス(詳細:https://github.com/hako-mikan/sd-webui-supermerger/blob/main/calcmode_en.md#traindifference)であり、FluffyRockとPolyFurを多様で汎用性の高いベースモデルに組み合わせ、e621タグ以外の概念についてテキストエンコーダーのプロンプト範囲と理解力を拡張することを目的としています。このプロセスは従来のマージやブロックマージとは異なり、「Add Difference」と混同しないでください。現在のベースモデルは、6つの非フューリーモデルを異なる比率で混合したもので、これらもまた多くのプロンプト機能をカバーするマージモデルです。V6以降、CLIPの調整とブロックマージにより、プロセスはさらに複雑化しています。

