M2F Transformation
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
M2F/TSFのカートゥーンシーケンスを生成します。これは通常の風景比3:2(1216×832)では3キャラクターのシーケンスを生成しやすいですが、16:9比(1344×768)や超ワイドスクリーン(1536×640)ではより長いシーケンスを生成します。2キャラクター(「前後」)のショットも非常にうまく生成でき、正方形や縦長解像度ではこれぐらいが限界です。ワイドおよび超ワイドの画像では、良いシーケンス一貫性を保ちながら5~6キャラクターまで生成可能です。
また、強度を少し下げるとF2F変換シーケンスも生成できます。4.0と5.0向けにいくつかこれをギャラリーに追加しました。
推奨強度:0.8
タグ:gender transformation 最近は通常、masterpiece, gender transformation, man, woman, androgynous から始めます。キャラクターの数は解像度とポーズに大きく依存し、性別の幅は男性的・女性的なタグの組み合わせに依存します。ほとんどのモデルは女性に強く偏っており、強く指示しない限り男性を含めようとしません。
2girls, 1boy などのタグは役に立たないと感じています。LoRAなしのチェックポイントで試しましたが、それらのタグにほとんど注目していないようです。ただし、他のタグが少ない場合、ここで調整してみるのも良いでしょう。
オプション:magical effects, drinking potion, glowing book など。この種の要素が十分に学習されたため、モデルは適切な処理を推測できるようになっています。
否定:people in background(モデルは可能な限りあらゆる隅に人を反映させてしまうため)
結果を投稿してください!あなたの作品を見たいです。
バージョン5更新 🎉
v4よりも一貫して優れた結果を得ようとさまざまな試行錯誤を重ね、ついに理想的な形にたどり着いたと思います。ご使用の感想をお聞かせください。
バージョンガイド:
[1.0] 最初のリリース、Pony専用。4~5人のキャラクターが正面を向いて立っている形状を好んで生成し、3人または6人の生成も可能。ほぼ陳腐化していますが、生成される画像のタイプが好きなら非常にクリーンで扱いやすいです。
[1.5] 最初のIllustriousバージョン。正面を向いた並列配置以外のキャラクターの生成を容易にしました。扱えるキャラクターの多様性を大幅に拡張。一部の魔法的特殊効果をサポート。実用面では1.0よりすべてにおいて優れています。
[2.0] 他のバージョンよりも2.5Dに偏った傾向があります。より広範なコンセプトと魔法的効果でトレーニングされ、非常に汎用的。ただし多様性のため、不要な魔法効果が出現しないよう、否定プロンプトが必要になることがあります。
[3.0] 魔法の杖、薬剤、神秘的な装置などのトレーニングを大幅に強化。ポーズやシーンの多様性も増加。キャラクターがより大きな領域を占めるため、シーケンスは短め(通常3~4人、2人または5人まで可能)。以前のバージョンよりやや強め。0.8~0.85で動作させるのが好み(以前は1.0が最適)。2.0よりさらに「濃い」仕上がりになることがあります。
[4.0] 画像品質の問題を修正し、より多くのチェックポイントと互換性が向上。強度1.0で非常にクリーンな画像が得られますが、より積極的な変形を試みるときにはわずかに不自然になることがあります。全体的に3.0よりさらに汎用的です。
[5.0] 以前のバージョンで生成が極めて困難だった画像を次バージョンのトレーニングデータに組み込みましたが、それがモデルを混乱させた可能性があります。このバージョンはより一貫性の高いデータセットで構築され、一貫して良い結果を出せるようになっています。柔軟性はやや下がるかもしれませんが、そうとも限りません。トレーニング画像は、画像品質と「雰囲気」の両面で過去のバージョンをはるかに上回り、本当に物語を語っているのか、単に技術的に正しいだけなのかが明確になります。
今後: すでに成熟していますが、さらに多くの魔法のアイテムやアイデアを追加できます。奇妙な不具合を避けるため、魔法系と技術系の別々のLoRAに分離する可能性もあります。
以前のバージョンの可能性を確認するには、ギャラリーをご覧ください!
ヒント:
LoRAの強度は0.8または0.85が非常にうまく機能します(2.0およびそれ以前のバージョンでは1.0を試してください)。強度を下げるほど、女性キャラクターのシーケンスが増える傾向(それでも楽しい)があり、創造的なシーケンスや順不同のステップが増える可能性があります。強度を上げると男性キャラクターの開始が増え、より長いシーケンスを生成しやすくなりますが、非常に高いレベルでは画像品質が劣化します。
ステップ数を増やすこともシーケンス生成に有効です(少なくとも一定の範囲では)。つまり、約15ステップでクリーンな画像とシーケンスが得られても、20、25、30ステップの方がさらに良くなります。
低いCFG値がLoRAに自由な発想の余地を与えると感じます。ほとんどのチェックポイントで約4が好みです。
キャラクターLoRAと組み合わせる場合、その強度を半分程度に下げてください。それにより、すべてのキャラクターがLoRAのスタイルになってしまい、このLoRAの目的と競合する可能性があります。
タグ「holding object」は非常に興味深いです。モデルは自然と適切なオブジェクトを差し込むことが多く、シーンに合っていることが多いです。
タグ「diorama」も非常に良い効果を生み出します。
現実的または半現実的なモデルは、和風性(アンドロギヌス)を自然に表現するのは苦手です。イラストスタイルのモデルが最適です。
背景に追加の人物を勝手に生成する傾向があります。プロンプトには(blurred background)を、否定プロンプトには(people in background)を推奨します。


















