SPYBG's Toolkit for Digital Artists

詳細

ファイルをダウンロード

モデル説明

SPYBGのデジタルアーティスト向けツールキット

公式YouTubeチャンネル: [ここをクリック]

Patreon: [ここをクリック]

最新動画:

こんにちは、ブルガリアのAIアートコミュニティからValentinと申します。皆さんからはSPYBGとして知られています。私は3Dキャラクターアーティストとして専門職に携わっており、すでに数年間この分野で働いています。プロとして何をしているか気になっている方のために、アートステーションはこちらです: https://www.artstation.com/spybg

AIが登場した当初、多くの皆さんのように私はAIを試し始めました。そして、自分の個人プロジェクトなどに役立つ何かを作りたいと思ったのです。徐々に、自分たちが開発したツールがアーティストがプロフェッショナルな環境でも活用できる可能性に気づいたため、過去2か月間、キャラクター用のカスタムデータセットを作成してきました。さらに、環境デザインを手がけるスタジオのテクニカルリードとして働いている親しい友人の依頼を受け、カスタムモデル用に環境データセットも作ることにしました。

「自分のアートが使われている」ということで多くの方が不満を抱いていることを考慮し、私は別々のアプローチを選びました。私が作成したすべてのデータセット(学習用画像)は、私自身が作ったものです。そしてこれらを作成するのに多くの時間をかけました。ただし、賢くAIツールを活用したため、すべてのデータセット(キャラクターと環境両方)はAIによって生成されているため、このモデルの作成には他のアーティストの貢献は一切使用されていません。唯一の入力は私自身のものです。

私は100ステップでモデルを訓練し、合計で194,000ステップの学習を行いました(はい、やはり多くは感じますが、その結果は語っていきます)。

  • キャラクターデータセット: 766枚の独自制作画像
  • 環境データセット: 1160枚の独自制作画像

Suspiriorに特別感謝します!彼はいくつかのテクニックやアイデアを提案してくれたほか、私のモデルの最初のベータテストも行ってくれました。本当にありがとうございます!彼の試作例もここに追加します。

私のモデルを使用するためのヒント:

以下の設定をおすすめします。少なくとも私にとっては、これが最も良い結果をもたらします。自由に試してみてください。

サンプラー: DPM++2M Karras
ステップ数: 150ステップ(より少ないステップも動作しますが、この学習データでは150ステップが最適であることが私のテストで確認されています)
推奨解像度: 768x768(学習に使用したベースモデルは、Protogen 3.4をカスタム修正し、古いバージョンのツールキット(v2.0)とマージしたものです。その上、768x768のデータセットで学習したため、768x768または768x1280、あるいはそれ以上の解像度を使用することを推奨します)

注: バージョン4.0以降では、基本の1-5-prunedモデルを使用し、適切にファインチューニングしています。

CFGスケール: 5〜7が最も適しています。
トリガー語: tk-char(キャラクター用)、tk-env(環境用)。なぜtkか?(tkはToolkitの略です)

重要: キャラクターを作成する際、最高の結果を得たい場合は、モデルをimg2imgで使用し、テンプレートディレクトリにある画像を基に使用してください。これにより、よりクリーンでプロフェッショナルな見た目の画像が得られます。txt2imgは環境には非常に適していますが、キャラクターの場合、ときどき予測不能な結果になります。キャラクターのコンセプトアートでは一貫性が重要です。そのため、私は個人的に、私のテンプレート画像や自分の画像を使用することを強くおすすめします。そのため、一貫した結果を得たい場合は、私が作成した複数のキャラクターシートをご活用ください。

例題プロンプト:

キャラクターの例:

"((male))の写真、tk-charウォーリアー、非常に詳細、アワード級の画像、16k"

または

"((male))の写真、tk-charスタイルウォーリアー、非常に詳細、アワード級の画像、16k"

"((female))の写真、tk-charウォーリアー、非常に詳細、アワード級の画像、16k"

または

"((female))の写真、tk-charスタイルウォーリアー、非常に詳細、アワード級の画像、16k"

tk-char自体をトリガーとして使用できるほか、tk-char styleも併用可能です。両方試して、結果を見てください。

注意: promptの最初に(((male)))または(((female)))を記述し、作成するキャラクターの性別を明確にしてください。その後、さらにプロンプトを明確にしたい内容を追加してください。また、プロンプトはできるだけ短く保つようにしましょう。長いプロンプトもとても面白いですが、私の画像のテンプレートをいくつか見てみることで、少ない言葉でも十分な結果を得られることに気づくでしょう。

また、私の「デモ」画像へのリンクも用意しました。これらをimg2imgのテンプレートとして使用するか、自分の画像を使用しても大丈夫です。特にキャラクターのコンセプトアートを作成する際、私の画像は非常に良い結果をもたらします(2種類あり:1:1のアスペクト比の基本フルボディ(さまざまな比率とシルエット)と、2:1のアスペクト比のヘッドバリエーション付きクローズアップ)。

テンプレート画像へのリンク: [ダウンロード]

環境の例:

"tk-env古代環境スタイルの写真、ペルシャ都市、人々が歩いている様子、古代ペルシャにて、街中に palm trees(ヤシの木)が生え、あちこちに花が咲いており、アワード級の画像、非常に詳細"

プロンプトにtk-envを含めれば、学習済みデータが有効になります。

ベストな結果を得るために、ネガティブプロンプトを追加することを推奨します。どのプロンプトでも動作しますが、私は以下を使用しています。

ネガティブプロンプト: (((signature))), (((text))), (((watermarks))), deformed eyes, close up, ((disfigured)), ((bad art)), ((deformed)), ((extra limbs)), (((duplicate))), ((morbid)), ((mutilated)), out of frame, extra fingers, mutated hands, poorly drawn eyes, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), cloned face, body out of frame, out of frame, bad anatomy, gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), (fused fingers), (too many fingers), (((long neck))), tiling, poorly drawn, mutated, cross-eye, canvas frame, frame, cartoon, 3d, weird colors, blurry

注意: 最新リリース(v4.5以降)については、ネガティブプロンプトの使用は不要です。はい、お聞き通りです。ただし、ご希望であれば、上記のプロンプトをはじめとして適切な出発点としてご利用ください。

____________________________________________________________________________

VAE: より良い結果を得るため、Stable Diffusionの基本的なSD 1.5 VAEを使用することをおすすめします。

____________________________________________________________________________

SD UPSCALE & Ultimate SD Upscale: 生成された画像を拡大したい場合、automatic1111のSD Upscaleを0.35(ノイズ強度)、スケール2として使用し、さらにR-ESRGAN General 4xV3で拡大することをおすすめします。これにより、私が得た最良の結果が得られます。

____________________________________________________________________________

私のモデルは1.5バージョンをベースとしているため、1.5モデルで作られたすべてのエムベッディングは、このカスタムモデルと互換性があります。以下にいくつかの優れたエムベッディングのリンクを紹介し、さらに進化させるごとにリストを更新していきます。

エムベッディング:

[SPYBGTK-C-Enh] - 私が開発したツール。私のモデルと組み合わせて使用することで、キャラクターの創造性をさらに向上させる

注意: LORAエムベッディングの強度を低めにしてください。これはモデルの修正には役立ちますが、自身が目指すデザインを圧倒しないようにするためです。

[CharTurner] - 前面と背面からのキャラクターのコンセプト生成に特化(テンプレート画像私のテンプレート画像より、「Front_Side_Back」を組み合わせることでさらに良い結果が得られます!)

注意: 私のモデルは現在、txt2imgにおいて同じキャラクターの複数ビューを生成できるようになりましたが、このアドオンも併用すると非常に役立ちます!

____________________________________________________________________________

私のモデルの使用、マージ、または実験は、自由に行ってください。

使用時にクレジットを記載したい場合は、もちろん自由にどうぞ。もちろん、そうしなくても問題ありません。私が一番願っているのは、「生産プロセスで使える」「ただ楽しむために実験できる」というツールを、多くの人々やアーティストに届けることです。

それが、私が実現に近づけた唯一の方法です。

そしてはい、このモデルで自分の画像や、その他あらゆるものについて訓練することができます。

ただし、さらに最適な結果を出すためには、自分の画像に対してTIエムベッディングを実施することを強くおすすめします。

P.S. あなたの成果を共有してください!みなさんのお作業がとても楽しみです!

デジタルアーティストとしていつも身近な仲間として

Valentin

このモデルで生成された画像

画像が見つかりません。