Fkey style (Flux dev test version)

詳細

ファイルをダウンロード

モデル説明

V3-V4 情報:より最近の機能を使用してトレーニングされた2つのバージョン。両方ともT5とclip-lエンコーダーでトレーニングされています。V3はjoycaptionからの長文プロセを用いてトレーニングされました。V4はtoriiキャプショナーから抽出された短縮されたキャプションでトレーニングされました。この2つの中では、個人的にはV3を好みます。

V1-V2 情報:2つのバージョン。最初のバージョンは512解像度でbooruキャプションを用いて2000ステップ、2番目は768解像度でnlpキャプションを用いて5000ステップトレーニングされています。どちらが厳密に優れているとは言えず、おそらく2番目の方が、他のキャラクターロラを使用してもスタイルの転送がより困難であるため優れていると思われます。fp16/fp8モードでのベースチェックポイントとそれ以外のものでのテストは行っておらず、現在のところ、人気のあるUIの一部の量子化タイプでは動作しない可能性があります。

プロンプトを含むワークフローは画像内に直接記載されています。それらをComfyUIのブラウザウィンドウにドラッグするだけで使用できます。おそらく「anime screencap」をポジティブプロンプトに、「realistic, 3d」をネガティブプロンプトに設定するとより良い結果が得られるでしょう。ただし、1 CFGではネガティブプロンプトは利用できません。しかし、この拡張機能を使用して回避可能です。その設定は既にワークフローに組み込まれています。

このモデルで生成された画像

画像が見つかりません。