EasyFluff

詳細

ファイルをダウンロード

モデル説明

2024年3月29日更新:Fluffusion R3を基にしたより実験的な個人的なマージモデルが公開されました。このマージモデルは、このモデルシリーズの以前のバージョンとは異なります。そのため、以前のような命名スキームは明示的に与えられません。このモデルはv-predictionモデルであるため、YAMLまたはサンプリングノードを覚えておいてください。Fluffusionはclip skip 2で学習されているため、お使いのUIで必ずそれを設定してください。

以下は古くなった情報です。これ以上ありません。

結果が過剰に彩度が高く、滑らかで詳細が不足している?まったく結果が出ない?以下の内容をお読みください!

これはterminal-snr-v-predictionモデルであり、モデルと並行して設定ファイルとCFG Rescale WebUI拡張機能が必要です!詳細およびComfyUI用同等設定は下記をご覧ください。

このモデルの実行方法

- これはterminal-snr-v-predictionモデルであり、v-predictionモードでモデルを読み込むには、併用する設定ファイルが必要です。ファイルドロップダウンからダウンロードし、モデルと同じフォルダーに配置してください。

- また、https://github.com/Seshelle/CFG_Rescale_webui も必要です。この拡張機能は、拡張機能タブからこのリポジトリのリンクを「URLからインストール」セクションに貼り付けてインストールできます。拡張機能の作成者自身はCFG Rescale値として0.7を推奨しています。インストール後、CFG Rescaleスライダーは生成パラメータの下、スクリプトセクションの上に表示されます。CFG Rescaleを設定せずに推論を実行すると、この研究論文に示されているような結果が得られます。

- ComfyUIをお使いの場合は、https://github.com/comfyanonymous/ComfyUI_experiments から sampler_rescalecfg.py ノードが必要です。

このモデルのプロンプトの書き方

- V7以降、自然言語はこのモデルに強い影響を与えます。すべてを理解できるわけではありませんが、良い結果を得られる可能性があります。そして、これ以上引き出せなくなったら、e621タグを使ってプロンプトを洗練させることができます。(タグだけを使う方法でも、どちらでも問題ありません。)

- プロンプトは、望んでいる内容を簡潔に自然言語で記述して始めて、その後e621タグで特定の概念を精緻化してください。このモデルはv-predictionモデルであるため、プロンプトの解釈はやや直喩的になります。

- SD 1.5で使われていた多くのフレーバーワードやアーティストが再び有効です。

- PolyFurはMiniGPT-4のキャプションで学習されているため、プロンプトを非常に装飾的に、文を多用して書いてみてください。(プレビュー画像の生成情報で確認できます。)

- 既知のキャラクターが正確に生成されない場合は、そのタグの強度を上げて、外見を示唆するいくつかの暗黙のタグを追加してください。FluffyRockのデータセットで人気が低く、画像が少ないキャラクターは、LORAなしではうまく生成されないことが多いです。

- カメラアングルのキーワード、特にclose-upの重み付けは強くしすぎないでください。

- 解像度は576から1088の間が、FluffyRockの学習範囲に合致するため、適切に動作します。

モデル情報と作成プロセス

V8.1が利用可能です。しばらくの間、最後のメジャーバージョンです。現在、FeffyのクオリティタgLORAは組み込まれていませんので、LORAとして使用することを推奨します。V4〜V6までは、@FeffyのクオリティタgLORAがこのモデルのFluffyRock部分に組み込まれていました。ポジティブ/ネガティブプロンプトに「masterpiece」「best quality」「worst quality」「low quality」「normal quality」を追加してください。

このモデルは**「Train Difference」**ミックス(詳細:https://github.com/hako-mikan/sd-webui-supermerger/blob/main/calcmode_en.md#traindifference)であり、FluffyRockとPolyFurを多様で汎用性の高いベースモデルに組み合わせ、e621タグ以外の概念についてテキストエンコーダーのプロンプト範囲と理解力を拡張することを目的としています。このプロセスは従来のマージやブロックマージとは異なり、「Add Difference」と混同しないでください。現在のベースモデルは、6つの非フューリーモデルを異なる比率で混合したもので、これらもまた多くのプロンプト機能をカバーするマージモデルです。V6以降、CLIPの調整とブロックマージにより、プロセスはさらに複雑化しています。

拡大したモデルを訓練したLodestone Rockおよびチームに感謝します。/model/92450?modelVersionId=124661 https://huggingface.co/lodestones/furryrock-model-safetensors/tree/main

このプロセスで私の異常なアイデアに付き合ってくれたpokemonlover69に感謝します。

Feffy氏のFluffyrockクオリティタgLORAに感謝します。/model/127533

このモデルで生成された画像

画像が見つかりません。