Flux.1-D + PDXL Consistency OUTDATED
詳細
ファイルをダウンロード
モデル説明
ブラックフォレストラボズ株式会社のスタッフたちに心からの感謝を。皆さんの努力が大きな成果を生みました。Fluxは本物の偉業です。
ほぼあらゆるFluxワークスペースでComfyUI上で動作させられます。以下に、便利なワークフローを含む画像を添付しました。
これは、CLIPと開発モデルを組み合わせた中で、私が見つけた最も高速で実用的な方法です。使用するVRAMは約20GB程度で、私のVRAMをすべて使い切ってコンピュータをロックアップさせた完全な組み合わせよりも遥かに効率的です。16ステップで生成にかかる時間は通常20秒未満で、ベースの完全版(1枚あたり約2分)よりも速いです。また、新しくスタイル化された表面にテキストを正しく導入することにも成功しています。
私は、SD3一貫性LoRAトレーニングから得た機能的なL-CLIPを、Pony RealismのLとマージし、それをFluxの約80%のFlux CLIP Lに組み込みました。下に完全なマージレシピを記載します。同じ結果が出るかどうかは保証できません。私が使った組み合わせのすべては現在オンラインで公開されていますので、私のものをそのまま使うのではなく、自分で試してみてください。その方がずっと楽しいですし、より良い、あるいははるかに優れた結果が得られる可能性もあります。
この組み合わせは、非常に興味深いスタイルの違いを導入し、それなりにうまく機能しています。標準的なFluxよりもステップ数が必要で、VAEは組み込まれています。
プロンプト
Ponyマージの影響で、スコアタグに反応する傾向があります。
単一のプロンプトを使用する場合、これはかなり効果的です。実験してみてください。
三人の人物、Flux用に英語で人数を数えてください。
単一のプロンプトを使う場合は、以下のような形式で記述してください。個々の文はコンマで区切り、句点は使用しないでください。
score_9, score_8_up, score_7_up,
1girl, 2girl など、danbooruおよび一貫性のあるアニメ用タグ、
他の人物タグとさらに詳細な説明、
さらに説明を定義するためのdanbooruタグ。ここでは強度を高めることを推奨します。
最終的な説明は背景ではなく、オーバーレイ(テキストや特定の詳細なオーバーレイスタイルなど)に基づいてください。
Fluxにはすでにいくつかのdanbooruタグが含まれていますが、それほど多くはありません。主にsafebooruタグが使われているようです。
設定
16ステップ以上で、明らかに高品質になります。
euler
16ステップ
生成時間は平均して20秒未満でした。
Fluxの標準設定1を使用。7を使用して実験していた際、Ponyリアリズムを狙うと、約5で奇妙な組み合わせが生まれました。
config rescaleノードは悪影響を与えるが、何らかの効果はある。
sd3 scaleは完全に破壊するため、絶対に使用しないでください。
実験結果によると、CLIP_LがFluxオリジナルCLIP_Lからずれるほど、出力画像は断片的になり、大きく異なる傾向が見られました。Fluxの20%程度のパワーで、リアリズム+一貫性とほぼ同じ文脈を生成し、画像は完全に断片的で不自然でした。しかし、形態は維持されていたため、調整を繰り返して、統一的かつ包括的に結合する組み合わせを見つけ出しました。
私の記憶に残るレシピ
PDXL Autism CLIP_L: 0.67
Consistency V1.1 LOHA: 0.33
→ Autism_Consistency_Clip_Lが誕生
PDXL Autism_Consistency CLIP_L: 0.2
SD3 CLIP_L: 0.8
→ SD3_Consistency_Clip_Lが誕生
LORA ファインチューン → 0.8 LORA + SD3 MERGE CLIP_L
SD3_Consistency_Clip_Lが完成。
SD3_Consistency_Clip_L: 0.5
Pony_Realism_V2.1 CLIP_L: 0.5
→ STAGE_2_CONSISTENCY_REALISM_EXPERIMENT_SDXL_SD3
元の組み合わせはSD3であまり面白くも強力でもなかったため、却下。
Fluxマージ:
STAGE_2_CONSISTENCY_EXPERIMENT_SDXL_SD3: 0.2
Flux_Clip_L: 0.8
→ 現在のV1.0 Flux + Consistency
PDXL + Fluxワークフロー
FluxとPDXLを組み合わせるための便利なワークフローを添付しました。以下のギャラリーから2人の少女の画像をComfyUIにドラッグして、Flux + PDXLワークフローを使用してください。必須ではありませんが、非常に興味深いアプローチになります。PDXLを外して上部の2つのプロンプトだけ使用すれば、単純にFluxのみで使用できます。
PDXL Autism Mix に 0.33の強度で Consistency LOHA Version 1.1 をマージ
SD3 を SD3 LORA experiment v0.3 にファインチューン(SimpleTuner でトレーニング)

















