AUTOMATED Flux-Kontext LoRA Training: My "Reverse Engineering" Workflow for Perfect Datasets

詳細

ファイルをダウンロード

モデル説明

みなさん、Flux-Kontext LoRAのトレーニングで非常に高い精度の結果を得るために私が使っているワークフローを共有したいと思います。この方法は、データセットの準備に悩んでいる人にとっては革命的です。

核心的なアイデア:逆向きに考え、すべてを自動化する

Flux-Kontextの標準的なアプローチは、「before」画像を見つけてから、何か「after」画像を作成することです(例えば、オブジェクトを追加したり、服を脱がせたり)。この「after」画像の作成が、特にAIが望む変更を一貫して生成できない場合、最も難しい部分になります。その後、すべてのサイドカーテキストファイルを手動で作成しなければなりません。

私の方法は、このプロセスを逆転させ、パイプライン全体を自動化することです。

ステップバイステップのワークフロー

たとえば、特定の種類の帽子を除去するLoRAをトレーニングしたいとします。

  1. 「after」フォルダー(データセット)を作成する:まず、対象とする帽子を被った状態の被写体を含む画像のセットを収集または作成します。これがスタート地点であり、後でデータセットフォルダーになります。

  2. 「before」フォルダー(コントロールセット)とプロンプトを生成する:次に、データセットフォルダー内のすべての画像をFlux-Kontextのバッチ処理に通します。ここでの目標は、変更を元に戻すことです。「帽子を除去する」「髪型をスッキリさせる」などのプロンプトを提示します。出てきた帽子のないきれいな画像がコントロール画像です。最も素晴らしい点は?このワークフローは、画像ペアごとに自動的に必要なサイドカーテキストファイルを作成することです。

  3. 「クリーニング」の利点:この方法の大きな利点は、潜在的に不完全な「after」画像から完璧な「before」画像へとモデルをトレーニングする点です。これにより、LoRAはAIアーチファクトや不備を除去する能力を学習し、最終的な出力がはるかにクリーンになります。

  4. 最終化してトレーニング:これで、コントロール画像とデータセット画像のペアが完璧に整い、すべてのサイドカーテキストファイルが自動生成されています。サンプル画像をいくつか追加するだけで、トレーニングを開始できます。得られるLoRAは、その1つの特定のタスクに非常に専門的に特化します。

このワークフローをより簡単に

コントロール画像、データセット画像、および対応するテキストファイルの管理は煩雑です。image_a.jpgimage_b.jpgprompt_a.txtが正しく対応しているかを確認するために、常にマウスをクリックして行き来しなければなりません。

この問題を解決するために、私はカスタムのデスクトップアプリケーションを開発しました。このアプリは、すべての3つを1つのウィンドウで同時に表示できます。これにより、大幅な時間の節約が可能になり、ファイルの不一致によってトレーニングが失敗するリスクを完全に排除できます。

このワークフローを効率化したい場合、このツールとより詳細なチュートリアルは、Patreonのサポート者向けに提供されています。詳細はPatreon.com/LoboForgeをご覧ください。
こちらが動画デモです:https://vimeo.com/manage/videos/1134804036?fl=pl&fe=vl

このワークフローを試してみて、どんな創造的なLoRAが作れるか教えてください。

このモデルで生成された画像

画像が見つかりません。