Auto Captioning for Qwen Image Edit Lora Datasets - LLama CPP VLM
詳細
ファイルをダウンロード
モデル説明
バージョン1
以前にLoRAトレーニングをしたことがあるなら、非常にシンプルです。事前にデータセットを準備しておくことをお勧めします。コントロール画像とトレーニング画像を再度保存するのはやや非効率ですが、コントロール画像を再保存するのはおそらく必要ないでしょう。しかし、安全のために私は行いました。
この処理では、コントロール画像とトレーニング画像を縫い合わせます。Llama-CPPのプロンプトは、上部に縫い合わされた画像をコントロール画像として認識するように調整されています。以下のセクションをあなたのニーズに合わせて調整してください:
Create a prompt to get qwen image edit to get {Subject of} the input Image to preform the {action} with the {Object} as shown in the output image. Don't use "image" in the prompt.
これはそのままでも動作しますが、必要に応じて自由に変更できます。
この処理を実行するには、LLama CPPが必要です。

