Jak and Daxter - The Precursor Legacy Mode
詳細
ファイルをダウンロード
モデル説明
このバージョンは右下に透かしが入っています。実験の一部として、キャプション付きと非キャプション付きの両方を比較しました。このバージョンは、キャプション付きのほうが優れています。
これは私の研究の一部であり、以前の「wooly flux」作業の延長です。その後のテストを通じて、トレーニングにおけるいくつかの主要な使用ケースに対して「一つのサイズですべてに対応」できる近い解決策に到達しました。
今回はTensorArtのオンライントレーニングツールを使用してトレーニングしました。
このLoRAは100枚の画像を使用してトレーニングされています。そのうち30枚は、以下のような私が独自に開発したキャプション形式でキャプション付けました:

precursor legacy mode, cel-shaded textures, warm lighting, era 2000s fantasy, mechanic attire, duo, tech-savvy style, rating sfw, early 2000s video game graphics, keira inside samos' hut speaking with daxter in his ottsel form behind her, ¬the entrance to the hut is visible behind her as she leans forwards and exposes her cleavage while daxter playfully leans towards the door behind her, soft indoor lighting filter.
--
残りの70枚の画像には、ゲームの主要キャラクター各々について5枚ずつ、それにいくつかのグループショットと特定のオブジェクトが含まれていました。これらは以下のような多数のタグでキャプション付けました:
Daxter, Ottsel
また、いくつかの風景画像も以下のようなタグでキャプション付けました:

Sentinel Beach, day, tree, nature, scenery, rock, lantern, item chests,
--
まだ作業中ですが、独自のスタイルLoRAを作成したい場合、この組み合わせは良い出発点になりそうです。
特にキャプションのスタイルは私のこだわりです:
キャプション構造とその役割の理解
モデルは、スタイル、キャラクター、シーン要素を明確に定義する構造化されたキャプションを通じて視覚的プロンプトを解釈するようにトレーニングされています。各キャプションのセクションは、モデルの出力を正確で調和の取れたものにするために、特定の情報を提供します。
モード:
- 役割:画像をレンダリングする芸術的メディアまたはスタイルを指定します(例:油絵、デジタル、3Dレンダリング)。
- 目的:色、テクスチャ、形状の表現方法を決定することで、出力の全体的な美的感覚を設定します。
追加タグ:
- 役割:選択されたモード内で使用される技法を記述します(例:滑らかなグラデーション、太い輪郭線)。
- 目的:筆致、阴影、テクスチャ適用の方法をカスタマイズすることで、芸術的アプローチを洗練させます。
時代:
- 役割:特定の時代または芸術運動を定義します(例:1600年代バロック、2020年代サイバーパンク)。
- 目的:歴史的または未来志向のスタイルを参照することで、視覚的雰囲気を確立し、キャラクターデザイン、建築、ムードに影響を与えます。
ファッションスタイル:
- 役割:登場人物が着用する衣装やコスチュームを記述します(例:ストリートウェア、中世の鎧)。
- 目的:衣装に焦点を当てることで、キャラクターの外見とアイデンティティを構築し、テーマや設定を反映します。
登場人物数:
- 役割:シーンに含まれるキャラクターまたは登場人物の数を指定します(例:一人、二人)。
- 目的:シーンの構成とダイナミクスを制御し、単一の被写体に焦点を当てるか、複数のキャラクター間の相互作用を含むかを示します。
独自のスタイル識別子:
- 役割:画像を際立たせる特徴的なビジュアルテーマやスタイルを特定します(例:奇想天外なファンタジー、未来戦士)。
- 目的:シーンに特徴的な要素を追加し、モデルが特定のムードや創造的ビジョンに導かれるようにします。
レーティング:
- 役割:コンテンツレーティングを示します(例:Rating SFW、Rating NSFW)。
- 目的:使用目的に応じて、職場で安全なコンテンツか、そうでないかに合わせて生成画像が適切な基準に準拠することを保証します。
プロンプト:
- 役割:シーン自体を、詳細な視覚的要素に分解して記述します(例:「ネオンで照らされた都市に立つキャラクターがプラズマ剣を振るう」)。
- 目的:キャラクター、オブジェクト、およびシーン内の相互作用を含む、生成すべき内容の核心的な記述を提供します。
フィルター:
- 役割:最終画像に適用するビジュアル効果を定義します(例:ソフトな照明フィルター、セピア調)。
- 目的:色調、コントラスト、雰囲気などの特定のビジュアル処理を加えることで、出力の外観を変化させます。
これらがどのように連携するか:
キャプションの各部分は、モデルの導きに対してそれぞれ異なる役割を果たします。モードが芸術スタイルの基盤を築き、タグと時代がシーンの詳細を洗練させます。ファッションスタイルと登場人物数が登場人物を形成し、独自のスタイル識別子が明確で調和の取れたテーマを保証します。最後に、プロンプトとフィルターが物語性と仕上げのタッチを加え、望ましい視覚的方向性に基づいて、洗練された詳細な出力を生み出します。
この構造化されたアプローチは、アート生成における柔軟性と正確性を保証し、広範な創造的可能性を可能にします。




















