d3caricature

詳細

ファイルをダウンロード

モデル説明

大きな耳、低い額、目立つ鼻、誇張された表情のキャラクターを作りたいですか? まさにそれが d3caricature が目指すものです!

これは、Stable Diffusion 用の埋め込み(Textual Inversion は永遠に!)を初めて作成した試みであり、過去1ヶ月ほど急峻な学習曲線を経て得られた成果です。

「バニラ」Stable Diffusion 2.1 768 で動作しますが、他の多くの 2.1 モデルとも互換性があります。動物には(ほとんど)影響せず、人物にのみ適用され、多くの場合非常に極端な結果を生み出します。

***

そこで、この埋め込みには3つのバージョンを用意しました:

d3caricature-beta-x — 1ベクトルの均等分散バージョン(影響最小)
d3caricature-beta-y — 6ベクトルの「半重量」均等分散バージョン(中程度の影響)
d3caricature-beta-z — 6ベクトルのフル重量均等分散バージョン(高影響)

プロンプトの開始部、中間、または末尾に、より高いまたは低い重み、または高い/低い CFG と共に使用して実験してください。

これらは stable-diffusion-2.1-768 で徹底的にテストされていますが、perpetualDiffusion10_v10Moon(およびsun)や illuminatiDiffusionV1_v11 などの他の 2.1 モデルでの使用を強く推奨します。

***

すべての埋め込みバージョンは、68枚の手動で選定・微調整された画像からなる同一のトレーニングセットに基づいています。トレーニングのステップは以下の通りです:

  • 500ステップ @ lr 0.375-0.5(ウォームアップ付き線形)
  • 1000ステップ @ lr 0.075-0.1(ウォームアップ付き線形)
  • 1000ステップ @ lr 0.015-0.02(ウォームアップ付き線形)
  • 2000ステップ @ lr 0.003-0.004(線形)
  • 2500ステップ @ lr 0.0006-0.0008(線形)
  • 2500ステップ @ lr 0.00016

すべてのトレーニングは invokeai 2.3.5 で 4 の gradient_accumulation_steps を使用し、その後 a1111 と Embedding Inspector 拡張機能を用いて統合しました。

***

この埋め込みが役に立ち、たくさん楽しく使っていただけることを心から願っています! この埋め込みはベータ版ですが、リリース候補版になるかどうかはまったくわかりませんし、そうなってほしいとも思っていません。

単に、離れられずどうしても作りたくなったアイデアを形にしただけです ;)

ごらんいただき、ありがとうございます。お楽しみください!

心を込めて

このモデルで生成された画像

画像が見つかりません。