Flux Kontext + Gemini for finetuning dataset from few images

詳細

ファイルをダウンロード

モデル説明

(これは私の最初のワークフローで、最初のアップロードでもあるため、使用されているノードの整理が悪く、事前にお詫び申し上げます)

元のワークフローは Lovis Odin によるもの:https://github.com/lovisdotio/workflow-comfyui-single-image-to-lora-flux

この ComfyUI ワークフローは、1枚(または複数枚)の画像を多くの画像に変換してデータセットを生成し、それらを微調整に使用します。

単に「inputs」フォルダーに画像を置くだけで、ランダムに1枚が選択され、Gemini に分析を依頼してプロンプトを生成します。その後、ランダムに1つのプロンプトが選ばれ、入力画像をもとに Flux コンテキストを使用して新しい画像を生成します。VRAM が少ない仲間のために、Flux コンテキストの GGUF ファイルを読み込むためのノードを追加しました。

「ask gemini for text」ノードを含むパッケージ「comfyui_fill-nodes」の実行に大変苦労しました。最終的に、フォルダー内の __init__.py ファイルを編集し、「Gemini」に関係しない行をすべて削除することで解決しました。Gemini(または他のLLM)へのアクセスに、より簡単なノードパッケージをご存知の方がいらっしゃれば、ぜひ教えてください!

このモデルで生成された画像

画像が見つかりません。