🎟️ Noteworthy | qp

詳細

ファイルをダウンロード

モデル説明

-- v2 --

  • 顔の多様性が向上
  • プロンプトでの年齢調整が容易に
  • 一般の改善(v1に対して多数の細かい調整が加えられています)
  • プロンプトの忠実度が向上(完璧ではありません…まだv2です…信じていてください)

-- v1 --

これは訓練するのが本当に大変でした。

コメントで挙げられたため、ここにも記載します:
新しいIllustrious XL 1.0のリリース後、一部の属性を正確に調整するのが難しくなっています。私はその問題に取り組んでいます。Illustriousはアニメ/イラスト向けに設計されており、年齢の違いは主に身体の大きさに関連しています。多くのアニメキャラクターは顔立ちが非常に似ており、そのためIllustrious 1.0リンク)の訓練には以下のような課題が生じました(少なくとも私にとっては):

  1. 顔の多様性
  2. 年齢の調整
  3. 色斑、しわなど
  4. 男性特有の特徴(アニメキャラクターは、男性であっても多くの場合、女性的で描かれる傾向があります)

したがって、これらの要素を正確に調整するには、いくつかの世代を経る必要があるでしょう。私は、しわや不整なひげなど、老化した特徴を詳細に記述した重み付きプロンプトを大量に使用することで、ある程度成功しました。

この画像には以下のようにプロンプトを追加しました:

老いた女性、白髪、しわだらけの顔、ぼんやりした目、非常に老いている、賢い、セーターを着ている

この結果は、Illustriousを自分の望むように訓練できるかどうかを数ヶ月かけて試行錯誤した成果です。Illustriousの訓練は(少なくとも私にとっては)非常に難しく、予想以上に時間がかかりました。私はIllustrious 1.0のベース上で作業を再編成しました(元の作業の一部は0.1ベースで行いました)。これは明確に1.0版です。満足している点もあれば、まだ気になっている点もあります。コミュニティからのフィードバックが、今後のバージョンの改善に役立つことを願っています。

Illustriousには「ベースの顔」が存在し、それを乗り越えるためにプロンプトを工夫する必要があることを理解してください。また、男性キャラクターのプロンプト指定はより難しくなります。多少手こずる必要があるでしょう。

Illustriousについて知っておくべきこと

少なくとも最近のIllustrious 1.0ベースでは、LoRAの使用がやや困難です。私は細かい調整でその問題を軽減しようとしましたが、もともとIllustrious 0.1ベースで訓練されたLoRAは、結果を得るためにより多くの工夫が必要になる可能性があります。Illustriousはリアリスティックなモデリングや訓練において悪名高いほど難易度が高いので、その点を留意してください。もし最高のリアリズムを求めるだけなら、おそらくSDXLの方が適しています。その場合、私のQuadPipeモデルやMegaChonkモデルをお試しください。

このモデルの設定に関しては、CFG 3.5~18.5の幅広い範囲で、異なるが安定した結果が得られました。もちろん、使用するプロンプト次第です。

「high-quality」「ultra-detail」などのプロンプトタグを過剰に使用すると、生成される結果が制約されることがあります。これらのタグはおそらく必要なく、むしろ生成範囲を狭めてしまいます。また、時として少し強引にプロンプトを調整する必要がありますが、うまくいくことは可能です。私は、ネガティブプロンプト(特にメディアタイプ)がリアリズムの向上に効果的であることを発見しました。

設定などについては、私のプロンプトを参照してください。ただし、概ね、デモ作成時に私が使用していた設定は以下の通りです:

768x1152

CFG 3.5-18.5(非常に広範囲ですが、高CFGでもプロンプトに従いすぎず安定しています)

4x_foolhardy_Remacri(アップスケーラー)
30 hiresステップ

0.27 デノイズ強度

1.5倍にアップスケール

サンプラー:DPM++ 2M SDE Heun

スケジュール:Karras

サンプリングステップ:50

このモデルで生成された画像

画像が見つかりません。