FluffyRock E6-LAION

詳細

モデル説明

ここにある情報は作業中です。

このモデルは、fluffyrock-1088-megares-terminal-snr-vpred と同様に、端末SNRとv予測を使用していますが、e6、laion、booru、gpt4miniの追加データセットで学習されています。これらの非常に大規模なデータセットの「多様性」により、e6のみで学習されたほとんどのモデルよりも、出力のスタイルや概念の範囲がはるかに広くなります。ただし、結果はやや「実験的」で不安定になることもあります。

他の多くのFRモデルとは異なり、このモデルは他のFRモデルからフォークされたものではなく、SD1.5から最初から学習されています。この点とデータセットの規模の増大により、完全な学習パスを完了するのに幾何学的に長い時間がかかり、他のFRモデルと比べて(知識面で)大きく遅れています。

過去のすべてのエポック、そしておそらく新しいエポックも、HuggingFace E6-LAIONリポジトリで確認できます。

PolyFur は、やや似たプロジェクトで、より厳選されたデータセットを使用して開発中です。

プロンプティング:

このモデルは、SD1.5やe621タグと同様に自然言語を理解しますが、これらは別々の知識の「島」として扱われるため、両方を組み合わせて使用するとより良い出力が得られる可能性があります。A1111のBREAKキーワードの使用を推奨します。

他のモデル、甚至他のFluffyRockモデルよりも、より完全で慎重にプロンプトを記述する必要がある場合があります(例:「尾」をプロンプトに含めない場合、本来尾であるべき部分が3番目の足になってしまうことがあります)。E6LAIONは、通常意味のない「プロンプトの混ぜ物」を文字通り解釈し、(不)予期せぬ結果を生むことがあります。

e621タグは、アンダースコアなしでカンマ区切り、順序は問いません。

アーティストタグは、通常「(アーティスト)」が付くタグにおいても、「by 名前」の形式で記述してください。

FluffyRock vpredモデルを使用するには、追加のセットアップが必要です:

提供された設定ファイルを使用してください。

CFGリスケールの使用が必要です。

A1111(およびおそらくVladフォーク)では、CFG_Rescale_webui拡張機能を使用してください。

Comfy UIでこれを実行する方法もありますが、私はまだ個人的にテストしていません。ComfyUI_experimentsにそのノードがあると思われます。

オートコンプリート:

タグオートコンプリートファイル - 現在はpre-3Mデータセットのみをカバーしています。新しいファイルを構築中ですが、35,000件の競合タグを手動で確認・修正する必要があります。

2つのエポック番号?

最初の数値は学習開始からの連続番号です。

2番目の数値は、その特定の行がフォークされた時点の番号です。

E6-LAIONでは、モデルはより小さなデータセットで構成された以前のE6-LAION実験からフォークされています。

トラブルシューティング:

出力が悪く見える場合:

512x512でサンプリングしないでください。768以上を使用してください。1088を超えると、典型的なSD1.xの高解像度異常が発生する可能性があります。ハイレゾフィックスやその他の類似手法は、2K以上の解像度を簡単に実現するのに有効です。

いくつかのアートスタイルをプロンプトに含めてください。「by [アンダースコアなしのe6アーティストタグ]」を使用してください。より良い結果を得るには、複数のスタイルをプロンプトしてください。スタイルを一切プロンプトに含めない場合、出力がひどくなることがあります。

VPredのトラブルシューティング:

出力がノイズ/雲だけになる場合: 設定ファイルが不足しています。

出力が暗すぎる場合: CFGリスケールを上げてください。通常、0.7–0.9が最も効果的です。

一部のサンプラーは、CFGリスケールのサポートが未完成であるため、正しく動作しない場合があります。最新の議論についてはDiscordスレッドをご覧ください。

LoRAの学習:

vpredでは、v_parameterizationを有効にして学習する必要がある場合があります。kohya_ssはv1でそれを使用することを警告するかもしれませんが、無視してください。誰もSD1.5をv-予測で学習すると想定していませんでした。

vpredでないFRモデルで学習されたLoRAは、おそらく動作します。

Discordでサポートを求めてください。

リンクとリソース:

タグオートコンプリートファイル

Hugging Faceリポジトリ — すべてのモデルラインのすべてのバージョンが含まれています。リポジトリ全体をgit cloneするには1.5TB以上のディスク容量が必要です。ご注意ください。

FluffyRock Discordサーバー

Furry Diffusion Discordサーバー および そこでのFRスレッド

LodestoneRockのPatreon — 学習コストを支援してください。

ライセンス:WTFPL

wtfpl-badge-1

Civitaiのサイト内生成機能が壊れている(少なくともこれらのモデルでは)ため、面倒な「Create」ボタンを無効にするために、商用利用の設定を誤って設定しました。生成サービスでのモデル使用は問題ありませんが、実際には機能してほしいです。:V

どうやら現在はvpredモデルを除いて動作しているようです。

FluffyRockモデルのパブリックマージを公開する場合、HFまたはCivitaiのFR投稿へのリンクを返していただけると嬉しいです。

このモデルで生成された画像

画像が見つかりません。