UrangDiffusion v3.1
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
[v3.1 はまだ追加のテスト中です。新しい発見に関する更新は「このバージョンについて」セクションで行われます。]
UrangDiffusion v3.1(ウラン・ディフュージョン)は、Animagine XL 4.0 をベースにした最初の UrangDiffusion バージョンです。
「Urang」という名前は、サンダニ語で「私たち/私たちの/私」を意味します。この名前の由来は、このモデルが私一人だけでなく、多くの人々にも適しているようにすることです。また、他の人々が提供したリソース(トレーニングスクリプト、データセット収集スクリプトなど)を多数使用しているため、このモデルを「私の単独の作品」と主張するのは不公平だと考えています。
標準的なプロンプトガイドライン
プロンプトガイド:

デフォルトのネガティブプロンプト:
lowres, bad anatomy, bad hands, text, error, missing finger, extra digits, fewer digits, cropped, worst quality, low quality, low score, bad score, average score, signature, watermark, username, blurryデフォルト設定:Euler a、ステップ数約25〜30、CFG 5〜7、ENSDを31337に設定。最適な設定はステップ数28、CFG 6です。
トレーニング設定
元モデル: Animagine XL 4.0 Base(4.0-Zero ではありません)
ファインチューニング:
データセットサイズ:約1,600枚
GPU:1xA100 80GB
最適化手法:AdaFactor
Unet学習率:1.25e-6
テキストエンコーダー学習率:N/A(無効化)
バッチサイズ:48
勾配蓄積:1
ワームアップステップ:5%
最小SNR:5
エポック:15
よくある質問
Q:画像が時々ノイズが多い。
A:これは Animagine XL 4.0 モデル全体に共通する問題です。ベースモデルは10エポックのみで学習されており、十分に学習されていない状態です。初期Nや初期Iモデルとは異なり、より多くのリソースで学習されていません。
Q:Hires fix モデルは?
A:カバー画像のメタデータをご覧ください。そこに記載されています。
Q:初期N/初期Iのほうが優れている。
A:そのまま使ってください。使用しないでください。簡単です。去る際はわざわざ告知する必要はありません。建設的なフィードバックを提供するつもりがあるか、将来のプロジェクトを支援するつもりがある場合を除きます。
特別な謝辞
洞察とフィードバックをくれた CagliostroLab の同僚たち(?)
品質管理を担当した Nur Hikari および Vanilla Latte
AI生成画像における私の指導者でロールモデルである Linaqruf およびタグ並び順の考案者
ライセンス
UrangDiffusion v1.0-v2.5 は Fair AI Public License 1.0-SD ライセンスの対象であり、v3.x は CreativeML OpenRAIL++-M ライセンス の対象です。















