UrangDiffusion v3.1

詳細

ファイルをダウンロード

モデル説明

[v3.1 はまだ追加のテスト中です。新しい発見に関する更新は「このバージョンについて」セクションで行われます。]

UrangDiffusion v3.1(ウラン・ディフュージョン)は、Animagine XL 4.0 をベースにした最初の UrangDiffusion バージョンです。

「Urang」という名前は、サンダニ語で「私たち/私たちの/私」を意味します。この名前の由来は、このモデルが私一人だけでなく、多くの人々にも適しているようにすることです。また、他の人々が提供したリソース(トレーニングスクリプト、データセット収集スクリプトなど)を多数使用しているため、このモデルを「私の単独の作品」と主張するのは不公平だと考えています。

標準的なプロンプトガイドライン

  • プロンプトガイド:

  • デフォルトのネガティブプロンプト:lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurry

  • デフォルト設定:Euler a、ステップ数約25〜30、CFG 5〜7、ENSDを31337に設定。最適な設定はステップ数28、CFG 6です。

トレーニング設定

元モデル: Animagine XL 4.0 Base(4.0-Zero ではありません

ファインチューニング:

  • データセットサイズ:約1,600枚

  • GPU:1xA100 80GB

  • 最適化手法:AdaFactor

  • Unet学習率:1.25e-6

  • テキストエンコーダー学習率:N/A(無効化)

  • バッチサイズ:48

  • 勾配蓄積:1

  • ワームアップステップ:5%

  • 最小SNR:5

  • エポック:15

よくある質問

  • Q:画像が時々ノイズが多い。

  • A:これは Animagine XL 4.0 モデル全体に共通する問題です。ベースモデルは10エポックのみで学習されており、十分に学習されていない状態です。初期Nや初期Iモデルとは異なり、より多くのリソースで学習されていません。

  • Q:Hires fix モデルは?

  • A:カバー画像のメタデータをご覧ください。そこに記載されています。

  • Q:初期N/初期Iのほうが優れている。

  • A:そのまま使ってください。使用しないでください。簡単です。去る際はわざわざ告知する必要はありません。建設的なフィードバックを提供するつもりがあるか、将来のプロジェクトを支援するつもりがある場合を除きます。

特別な謝辞

  • 洞察とフィードバックをくれた CagliostroLab の同僚たち(?)

  • 品質管理を担当した Nur Hikari および Vanilla Latte

  • AI生成画像における私の指導者でロールモデルである Linaqruf およびタグ並び順の考案者

ライセンス

UrangDiffusion v1.0-v2.5Fair AI Public License 1.0-SD ライセンスの対象であり、v3.xCreativeML OpenRAIL++-M ライセンス の対象です。

このモデルで生成された画像

画像が見つかりません。