Flux Kontext + Gemini for finetuning dataset from few images
詳細
ファイルをダウンロード
モデル説明
(これは私の最初のワークフローで、最初のアップロードでもあるため、使用されているノードの整理が悪く、事前にお詫び申し上げます)
元のワークフローは Lovis Odin によるもの:https://github.com/lovisdotio/workflow-comfyui-single-image-to-lora-flux
この ComfyUI ワークフローは、1枚(または複数枚)の画像を多くの画像に変換してデータセットを生成し、それらを微調整に使用します。
単に「inputs」フォルダーに画像を置くだけで、ランダムに1枚が選択され、Gemini に分析を依頼してプロンプトを生成します。その後、ランダムに1つのプロンプトが選ばれ、入力画像をもとに Flux コンテキストを使用して新しい画像を生成します。VRAM が少ない仲間のために、Flux コンテキストの GGUF ファイルを読み込むためのノードを追加しました。
「ask gemini for text」ノードを含むパッケージ「comfyui_fill-nodes」の実行に大変苦労しました。最終的に、フォルダー内の __init__.py ファイルを編集し、「Gemini」に関係しない行をすべて削除することで解決しました。Gemini(または他のLLM)へのアクセスに、より簡単なノードパッケージをご存知の方がいらっしゃれば、ぜひ教えてください!

