Auto Captioning for Qwen Image Edit Lora Datasets - LLama CPP VLM

バージョン1

以前にLoRAトレーニングをしたことがあるなら、非常にシンプルです。事前にデータセットを準備しておくことをお勧めします。コントロール画像とトレーニング画像を再度保存するのはやや非効率ですが、コントロール画像を再保存するのはおそらく必要ないでしょう。しかし、安全のために私は行いました。

この処理では、コントロール画像とトレーニング画像を縫い合わせます。Llama-CPPのプロンプトは、上部に縫い合わされた画像をコントロール画像として認識するように調整されています。以下のセクションをあなたのニーズに合わせて調整してください：

Create a prompt to get qwen image edit to get {Subject of} the input Image to preform the {action} with the {Object} as shown in the output image. Don't use "image" in the prompt.

これはそのままでも動作しますが、必要に応じて自由に変更できます。

この処理を実行するには、LLama CPPが必要です。

https://github.com/lihaoyun6/ComfyUI-llama-cpp_vlm

モデルタイプ	ワークフロー
ベースモデル	Other
公開日	1/3/2026

Auto Captioning for Qwen Image Edit Lora Datasets - LLama CPP VLM

詳細

ファイルをダウンロード

モデル説明

バージョン1

このモデルで生成された画像