BFS - Best Face Swap (Qwen Image Edit 2509)

詳細

ファイルをダウンロード

モデル説明

BFS(ベストフェイススワップ) LoRAシリーズは、Qwen Image Edit 2509用に開発され、自然なトーンのブレンドと一貫した照明で、高精細な顔および頭部の置換タスクに特化しています。

各バージョンは前のバージョンを基に改良されています:

  • 🧠 Focus Faces: 精密な顔の置換。元の頭部の形状と髪を維持しながら、顔の識別情報と表情を転送します。
  • 🧩 Focus Head: より強力な頭部の置換。髪や姿勢の方向を含む完全な頭部を置換します。
  • この2つのバージョンは互いに補完し合います。1つは顔のスワップに、もう1つは頭部のスワップに焦点を当てています。

ワークフロー:
Head/Face Swap Workflow - Qwen-Image-Edit-2509 | Civitai

顔スワップ動画テスト(V1):
Face Swap - Qwen Image Edit 2509 (English)

個人的なメモ:

スワップの品質は、常に入力画像の品質に大きく依存します。ノイズや圧縮アーティファクトが少なく、高解像でクリーンな画像が最も良い結果を生み出します。モデルはボディ画像の品質に常に従うことを覚えておいてください。なぜなら、それが最終的なレンダリングフレームになるからです。たとえ顔のソースが高品質でも、低解像度またはノイズの多いボディ画像は結果に制限を課します。

私が生成する画像の多くは、LightX2VライティングLoRAを使用せずに作成しています。なぜなら、これを有効にすると肌がプラスチックのように見え、赤みが強くなる傾向があると気づいたからです。適切なバランスを見つけるには追加のチューニングが必要で、私はその点に焦点を当てませんでした。もし良い設定を見つけた方がいれば、このテンプレートのコメント欄で共有してください。

簡単に言えば、LightX2Vを使用するとモデルの汎用性が低下します。なぜなら、固定されたCFG値1.0で動作するからです。そのため、「うまくいかなかった」と判断する前に、まずLightX2Vなしで私が公開したワークフローを試して、結果を比較することをお勧めします。

LightX2Vのライティングモデルを使用中にコントラストが強すぎたり、色が過剰に鮮やかになったり、プラスチックのような質感になったりする場合は、推論ステップ数を減らしてみてください。たとえば、Qwen Image Edit 2509 Lightning (8 steps) モデルを使用している場合、8ステップではなく4ステップで実行してみてください。過剰なコントラストは、CFGが1.0に固定されたまま多くのステップを実行したときに発生しやすいです。

ライティングLoRAを使用しない場合でも同様の問題が発生した場合は、ステップ数を減らしてみてください(例:20ステップから16ステップ以下に)。また、CFGを1.2や1.5などに下げることで、より滑らかで自然な結果を得られることがあります。

もう1つの重要なポイント:ボディがカメラから遠くに位置している画像では、顔領域が小さくなり、スワップの精度と全体的な品質が低下します。これは、小さな顔領域でモデルが処理できるピクセル情報が少ないためです。このようなケースに対応するには、古いワークフローを使用してください。このワークフローは、ボディ画像から顔領域を自動的に切り出し、インペインティングのような処理を実行して、遠くまたは小さな顔の構図での結果を改善します。

最後に、顔やポーズの類似性が失われる(特に参照画像とターゲット画像の美的スタイルや角度が大きく異なる場合)と感じた場合は、頭部スワップLoRAの強度をやや上げて(例:1.2や1.3)一貫性を回復してみてください。


⚙️ BFS — 「Focus Faces」

240組の画像トリプレット(顔、ボディ、結果)で学習、
LoRAランクは16 → 後に32に増加
勾配蓄積 = 2NVIDIA L40S GPU5500ステップ学習。

このバージョンは、表情、照明、視線の方向を維持しながら、安定かつ詳細な顔のスワップを生成し、ボディの自然な外観を保ちます。


🔧 モデルの注意点

  • このLoRAを使用するには、私のワークフローを使う必要はありません。問題が発生した場合は、ご自身のワークフローを使ってください。シンプルなQwen Image Edit + LoRAのワークフローで、入力を正しい順序(顔画像1、ボディ画像2)で指定すれば問題ありません。

  • 量子化: FP8以下では動作保証されません(GGUF Q4は避けてください)。

  • 顔マスク: オプションです。MediaPipeまたはPlanar Overlayで問題が発生した場合は削除してください。

  • ポーズ条件付け: より正確なアラインメントが必要な場合は、MediaPipe Face MeshまたはDWPoseを使用してください。

  • Lightning LoRA: 他のQwenベースのLoRAと組み合わせると、肌がプラスチックのように見えることがあります。


⚙️ 推奨設定

サンプラー:

  • er_sde + beta57 / kl_optimal / ddim_uniform 最良の結果

  • ddim + ddim_uniform(時々最も現実的)

  • res_2s + beta57

1つの設定に固執しないでください。うまくいかない場合は、別の設定に切り替えてみてください。

精度:

  • 🧠 最適: fp16

  • ⚙️ 推奨: gguf q8 または fp8

  • ⚠️ fp8以下: 明確な品質低下が発生します

推論のヒント:

  • Qwen Image Edit 2509 Lightning LoRAを使用する場合 → 4 / 8ステップで高速生成

  • 使用しない場合 → 12~20ステップCFG 1.0~2.5で現実的な結果を狙う


🧬 BFS — 「Focus Head」

「Focus Head」 バージョンは、Focus Faceの継続として学習され、データセットを拡張し、完全な頭部スワップに焦点を移しました。

NVIDIA RTX 6000 PROランク3212,000ステップ学習。628組の画像ペア(顔、ボディ、ターゲット、MediaPipeで生成されたポーズマップを含む)を使用。

🔹 学習フェーズ

  1. 標準的な顔スワップ — Focus Faceと同様、顔の識別に焦点。
  2. ポーズ条件付き顔スワップ — 視線と頭部の角度を合わせるためにポーズマップを追加。
  3. 完全な頭部スワップ — 髪を含む完全な頭部を置換し、識別をより強く制御。

約2000ステップ後、焦点は頭部スワップの微調整へ移行。
約4000ステップ後、データセットは肌のトーンが完璧に一致するものに絞られ、学習終了時には、
データセットは628 → 138 → 76と、最終的な微調整用の高品質サンプルへと精選されました。

⚠️ 注意:
Focus Faceは依然として標準的な顔スワップを実行できますが、データのバランスの影響で完全な頭部スワップに自然と傾いています。これは意図的であると同時に、データ分布と混合条件付けの副産物でもあります。


⚠️ 重要な注意事項

実在の人物、有名人、公的人物を含む結果の使用や共有は行わないでください
Civitaiのモデレーションは、肖像権や同意のルールに違反する投稿を無効化する可能性があります。
このモデルは芸術的・フィクショナルなキャラクター教育目的、およびAI実験のみを目的としています。

私はこのモデルの不適切な使用に対して一切の責任を負いません。責任を持って使用し、すべての肖像権を尊重してください。

このモデルで生成された画像

画像が見つかりません。