TF/TG M2F LoRA — ALPHA
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
注意:使い方の注意点およびプロンプトのヒントについては以下の内容をご確認ください。
これは実験的なモデルで、変化フェーズ画像の作成に使用できます。特に、男から女(m2f)への性別変化シーケンス—つまり男性が女性へと変化する様子—に訓練されています。その点に関しては比較的優れた結果が得られますが、胸の拡大やビンボ化(バニーガール的要素の強調)などの類似した変化シーケンスも生成可能です。ただし、画像の出発点として男性像を強く意識するため、結果の一貫性はさらに低下する傾向があります。
現行バージョンのこのLoRAでは、「一貫性」を達成するのが最も難しい課題です。ここに掲載されているほとんどすべての結果は、少なくともある程度意図的に選ばれたものです。いくつかのシーケンスは他のものよりも生産しやすい傾向にあり、おそらく訓練データに含まれているタイプに近いものでしょう。全体として、私が満足できる出力は25%未満だと推定しています。
それでも、今後アップデート版を開発する中で公開することにしました。楽しんでください!
使い方の注意点:
基本モデルとしてSD1.5で訓練されており、最も良好で一貫性のある結果が得られます。ただし、他のリアル志向のモデルでも十分に動作する可能性があります。(他の種類のモデルでは動作確認できていません。)
LoRAの強度は0.5~0.8を推奨します。それ以上の値は望ましくないスタイルの特徴を引き継ぐリスクが高くなります。低い値でも十分な結果が得られる場合があります。
画像の縦横比は出力に大きく影響します。特定のサイズでは一定数の変化ステップを生成しやすい傾向があります。横長の縦横比が推奨され、
5seqの場合、2:1を超える比率が効果的です。ControlNetは、このLoRAの出力を制御する上で非常に有用です。目的の人物数を配置したい場合は、openpose入力を提示してください。
プロンプトの使い方:
プロンプトに
3seqまたは5seqを追加すると、変化ステップが3段階または5段階になるよう出力を誘導します。このモデルは2~7段階のシーケンスに訓練されているものの、3や5以外のステップは訓練データが少なかったため、特に3と5の結果が最も強力です。drawing、digital art、3d renderなどは、このLoRAにとって最も扱いやすいスタイルと思われますが、トレーニングデータからのスタイルが漏れ出すリスクも高くなります。また、photoをテーマにしたプロンプトも多数生成しています。一般的に効果的なプロンプト構成は以下の通りです:
<3seq/5seq>、<スタイル>、<男性の描写>、<女性の描写>、<シーンの描写>。例えば:3seq, (masterpiece photo), tシャツと短パンを着た男、ビキニを着た woman、ビーチ5seq, (masterpiece photo), セットの着た男、ドレスを着た woman3seq, (masterpiece photo), チンケな男がシャツとジーンズを着た状態、巨乳の woman、黒い背景
他のスタイルやキャラクター用LoRAと基本的には互換性がありますが、強度の調整が必要になる場合があります。




















