Helltaker Style Illustrious
詳細
ファイルをダウンロード
モデル説明
開始プロンプト:(品質&スタイルプロンプト)
masterpiece, best quality, amazing quality, flat_color, sharp, (2d, cartoon, toon \(style\):1.2),
(shiny, bloom, glossy, vibrant, edge lighting, volumetric lighting, rim lighting),
スタイルプロンプト/Loraモデル重み:0.7 - 0.8 が最適
<lora:Offical_Helltaker_Style:0.8>, helltaker_style
[ここにあなたのプロンプトを入力してください]。
私はキャラクター関連のプロンプトを下部に配置し、行動や衣装、背景などの要素は中央に配置します。
作成者ノート:
多くの人がスタイルのトレーニングを行う際に、画像に詳細なタグ付けを行っていることに気づきました。しかし、そのようなタグ付けは必要ありません。アクティベーションプロンプトを使用しても構いませんし、完全に省略してアクティベーションタグを使わないこともできます。
スタイルのトレーニングでは、ポーズ、キャラクター、衣装などの「概念」を学習しているわけではありません。概念はUNetとText Encoderの両方に依存します。一方、スタイルはUNetのみに依存し、パターンや色の認識を担当します。
Text Encoderは、トレーニング時に画像に割り当てたタグとその内容を結びつけ、モデルが各画像に何が含まれているかを理解するのを助けます。しかし、スタイルのトレーニングにはこの仕組みは不要です。スタイルは純粋に視覚的なものであり、モデルに「どのようなオブジェクトや被写体が存在するか」を教える必要はないからです。さらに、スタイルは画像の一部ではなく、全体に影響を与えます。
ただし、もし「1boy」「1girl」や画像中のすべての細部を通常通りタグ付けしてしまうと、モデルはそのタグとスタイル自体を関連づけ始めます。推論の際、そのようなタグをプロンプトに含めると、モデルは視覚的審美性を捉えるという本来の目的とは無関係に、タグに関連するコンテンツ(例えば男の子や女の子)を優先的に生成するようになります。これはトレーニングを混乱させ、本来スタイルのみに焦点を当てるべきところに概念学習が混ざってしまう原因になります。タグを付けなければ、スタイルはより柔軟になり、被写体にかかわらず広く適用できるようになります。
ただし、一部のキャラクターモデルは、トレーニング中にUNetとText Encoderを同時に活用するため、画像のスタイルに影響を与えることがあります。
例:
ある人がヘンタイクリエイターのスタイルでトレーニングしたとします。そのデータセットには「伝道師位」が複数回登場し、通常通りタグ付けされていたとします。すると、他の人がそのスタイルモデルを使って「伝道師位」を生成しようとすると、データセットにあった「伝道師位」の外観がそのまま再現されてしまいます。これは、データセットが通常通りタグ付けされていたため、スタイルモデルの柔軟性が損なわれ、誰もが同じ視点で同じポーズの「伝道師位」しか作れなくなってしまうからです。






