Qwen Image Edit Transformation Lora

（このモデルは2509ベースです）

Loraは、人物Xが他の人物や物Yに変化するシーケンスの多数の画像で学習されており、人間から人間、人間からアニマル（人間型動物）、動物、物体などへの変換に対応します。

開始画像、終了画像、またはその両方（スタイル画像も可能ですが、その効果は限定的です）を受け付けます。

生成される画像のスタイルやポーズは、条件画像とは独立しています。これは条件の「アイデア」を抽出するように訓練されているため、たとえば、座っている人物の画像を条件にしても、 Promptで「立つ」ように指示すれば、問題なく動作します。

このモデルが学習に用いたプロンプトは、おおむね以下のように構成されています：

終了画像をターゲット参照として、次の変換シーケンスを生成してください：
「変換シーケンス男を（image1）女に」
または

「変換シーケンス（image1）男を（image2）女に、イラスト」

使用されるフレーミングタグは、全身フレーミングまたはポートレートフレーミングです。

スタイルは通常、イラスト、絵画、リアル、グレースケールなどです。

注意：プロンプトで画像をより詳しく記述すれば、より良いシーケンスが生成されます。たとえば、終了画像の女性がドレスを着ているなら、それを明確に指定してください。そうでないと、他のステップでドレスを着ていないように誤って生成される可能性があります。

このモデルの学習には、膨大な量の合成データ生成を要しました。

なぜか常に会話風のバブルが追加されるのか、私は全く理由が分かりません。トレーニングデータのほとんどには、そうしたバブルは含まれていません。