CrystaliTIXL

詳細

ファイルをダウンロード

モデル説明

更新:2024年3月3日

完全な再スタートでのリメイク。

トリガー:cs-cr1stal-v2

この埋め込みは、生成された画像に色鮮やかなガラス状・結晶状の効果を追加します。一般的には、プロンプトの最初またはその近辺でトリガーを使用してください。

短いプロンプトの場合は、通常ガラス製フィギュアのような結果になります。

長いプロンプトの場合、この埋め込みはメインの被写体に影響を与え、他のいくつかの小物にも影響を与える可能性があります。その際、facettedな宝石がところどころ追加されることがあります。

まれにメインの被写体が欠けることがありますが、なぜかはわかりません。ただし、他のTIやLoRAでも同様の現象を観察しています。おそらくSDXLの楽しみの一部なのでしょうね :-)

この埋め込みでは、「レッド」「パープル」「ブルー」などではなく、「ルビー」「アメシスト」「サファイア」などの色の名前を使用するのが一般的に効果的です。

時々、この埋め込みが羽を追加することがありますが、理由は不明です。

重み付けは0.8~1.2の範囲で問題なく機能しましたが、a1111では重み付けの必要性がほとんどありませんでした。ComfyUIを使用している場合は、重みを上げる必要があるかもしれません。なぜかはわかりませんが、複数のComfyUIユーザーが、一般的に埋め込みの重みを上げる必要があると報告しています。

基本的に私は以下のような設定で使用しています:

Euler A または DPM++ 2M Karras

幅 × 高さ:1024x1024 または約1メガピクセルになる値

ステップ数:30~50

CFG:7~10

Hires.fix:

Latent(nearest-exact)スケーリング:1.25~1.75、ステップ=30、denoise=0.7

非常に素晴らしい画像が得られますが、高いdenoise値は変形や重複を引き起こすリスクがあります。

または

4X-UltraSharp スケーリング:1.25~1.75、ステップ=30、denoise=0.4

denoise値は十分に高いので、追加のディテールが導入されつつ、変形や重複のリスクを抑えることができます。

モデル:

主に「Crystal Clear XL」モデルでテストしました:

/model/122822?modelVersionId=133832

Juggernaut 9、Artium 2、Pixelwave 8、Polyhedron 3、ZavyChromaでも良好な結果を得られました。

この埋め込みは、試したすべてのLoRAや埋め込みと組み合わせて良好に機能しました。複数のLoRAを一つのプロンプトでこの埋め込みと同時に使用しても問題なく動作しました。

[PUBLISHEDTOCIVITAIONLY]

= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =

更新:2023年9月10日

この埋め込みは、SDXLで生成された画像に結晶または宝石の効果を追加します。ステップ数が少ないため、効果は控えめではありませんが、SDXL埋め込みにまだ潜在的な可能性があることを示したいと考えています。

ダウンロード可能な「kcrstal17xl-step00002000.safetensors」は2000ステップ、バッチサイズ=1で、kohya_ssを用いて50枚の1024x1024画像で学習されました。もしゆっくりした学習時間を我慢できれば、今後このページにさらに洗練された埋め込みを追加する予定です。

ショーケースはautomatic1111 WebUIの出力ペアで構成されています:

埋め込みあり、埋め込みなし

ショーケース画像では「Crystal Clear XL」モデルを使用しています:

/model/122822?modelVersionId=133832

プロンプト作成はやや面倒でした。おそらく、Stable Diffusion v1.5からSDXLへの変化に十分な感覚を持っていないためかもしれません。ショーケース画像のプロンプトは大体次のような形式です:

kcrstal17xl analog realistic __art styles 1__ colour photo of a __crystal_test_1__, very detailed, award-winning

ワイルドカード __art styles 1__ は「印象派」などのアートスタイルのリストです。

ワイルドカード __crystal_test_1__ は「チェアに座るカエル」のような短いフレーズのリストです。

埋め込みの重みを上げ下げできます。一般的に0.6~1.2の範囲を使用しています。奇妙なことに、重みを0.1にしても、顕著な効果が確認できます。

= = = = = = = = = = = = = = = = = = = = = = = = = = = = = =

2023年9月3日

これは洗練された埋め込みというより、コンセプトの実証です。通常のリソースページではなく、記事として扱ったほうがよいかもしれません?

ダウンロード可能な「kcrstal17xl-step00001200.safetensors」は1200ステップ、バッチサイズ=1で、50枚の1024x1024画像で学習されています。もしゆっくりした学習時間を我慢できれば、今後このページにさらに洗練された埋め込みを追加する予定です。

この埋め込みは、SDXLで生成された画像に結晶または宝石の効果を追加します。ステップ数が少ないため、効果は控えめではありませんが、SDXL埋め込みにまだ潜在的な可能性があることを示したいと考えています。

ショーケースはComfyUIの出力ペアで構成されています:

埋め込みあり、埋め込みなし

そして、a1111 v1.6.0の出力の2ペア:

保存された画像、"Approx NN"プレビューのスクリーンキャプチャ


雑な説明...

私はSDXLの出力に非常に感銘を受け、SD v1.5向けの私の埋め込みをSDXLに対応させようと思いました。

automatic1111 WebUIのTrainタブで「CrystaliTI」を作成しました:

/model/135403/crystaliti

最近のa1111 v1.6.0がSDXLの学習を追加するだろうと期待していましたが、残念ながらそうではありませんでした。さらに、以下で示されているように、今後も追加される可能性は低そうです:

https://github.com/AUTOMATIC1111/stable-diffusion-webui/discussions/11857#discussioncomment-6480804

明らかに解決策はkohya_ssでした:

https://github.com/bmaltais/kohya_ss

私はこれまでkohya_ssを使ったことがなく、膨大な設定オプションに驚きました。まずはkohya_ssでCrystaliTIを再現してみましたが、うまくいかなかったので、以下のチュートリアルのおかげでようやく成功しました:

https://civitai.com/articles/618/tutorial-kohya-ss-dreambooth-ti-textual-inversion-embedding-creation

このチュートリアルに感謝します、@Desi_Cafeさん。

kohya_ssのTIは、元のCrystaliTIとは異なりますが、十分に似ており、私は満足しています。

次のステップは、kohya_ssの設定をSDXLに変更し、私の50枚の学習画像の1024x1024バージョンを指定することでした。21時間後、kohya_ssは2000ステップ中の1240ステップ(バッチ=1)を完了しました。

1ステップあたり1分以上かかります。:-(

比較すると、CrystaliTIの再現は約0.5秒/ステップでした。

4~16倍の遅延を予想していましたが、100倍以上も遅いとは… :-(

使用しているPCは:

Nvidia 3060/12GB(Ti版ではありません)、Ryzen 7-2700(8コア/16スレッド)、64GBシステムRAM、複数のSSD、Windows 10 Pro

kohya_ssがSDXL埋め込みを作成している間、3060の12GBすべてと「共有GPUメモリ」の7GBを使用しています。おそらく、共有RAM(すなわちシステムRAM)を使用していることが、非常に遅い理由の一つなのでしょうか?

kohya_ssで、VRAM消費を抑えるためのより良い設定があるのでしょうか?簡単に検索してみましたが、情報が矛盾していたり不完全なことが多く、もし現在のkohya_ssでVRAM消費を減らすためのオプションをお知りでしたら、何でも構いませんのでご教示ください。

kohya_ssは50ステップごとに埋め込みを保存するように設定されているため、バックアップマシンにコピーしました:2060/6GB、i7-10750H(6コア/12スレッド)、16GBシステムRAM、複数のSSD、Windows 10 Pro。--lowvramオプションを使用すれば、a1111 WebUI(v1.6.0)でSDXL画像を生成できます。一般的にa1111では1画像あたり約2分かかります。

SDXL埋め込みをComfyUI(最新のポータブル版、カスタムノードなし)で試しました。

そして、ここに至りました。SDXL埋め込みの作成は可能ですが、非常に遅いです。私の予算では、近い将来4090を手に入れるのは難しいでしょう。もし3060/12で生成速度を向上させる方法が見つからなければ、多くの埋め込みを作成することは困難です。

もしkohya_ssの専門家の方がこの文章をここまで読んでいただけたなら、私の設定をダウンロードに追加しました。どなたか、生成プロセスを速くするためのアドバイス(何でもよいです)をいただければ幸いです。

このモデルで生成された画像

画像が見つかりません。