Nepotism
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
ネポティズム • XII
Flux進化の頂点。 850万枚の画像、124エポック、210万ステップ以上で訓練されたネポティズムXIIは単に改善するだけでなく、Fluxが可能にする範囲を_再定義_します。
🔥 XIIの新機能
多様かつ膨大なデータセットでの大規模な訓練—あらゆるスタイルと繊細なニュアンスを捉えました。
精緻さと洗練度が向上:テクスチャ、照明、構図—すべてがより鮮明で豊か、そして現実的になりました。
比類なきプロンプト忠実性:スタイル準拠度と繊細な解釈力が向上—複雑な(そして単純な)プロンプトにも対応可能です。
スタイル範囲のマスター:写実主義、アニメ、スタイル化されたアート、抽象芸術、ハイブリッドをすべて自然に処理—過剰な出力はなく、あなたの意図に正確に従います。
ノイズのない鮮明さ:非常に複雑なシーンやエッジケースのスタイル・コンセプトでは最小限~中程度のアーティファクトが発生するのみ—ノイズは完全に消え、ディテールが支配します。
雷のように安定:ミドルレンジGPUでも高速で一貫した反復を実現するように最適化されています。
🚀 なぜXIIが圧倒的なのか
超深層訓練基盤により、学習量が増大→より豊かな表現力→より信頼性の高い出力が可能に。
次世代DiTアーキテクチャが完璧に洗練され、使い勝手が新たな次元へ。
LoRAとCLIPのシナジー:最小限のウェイト調整でプロンプトチューニングに対応—お気に入りの微調整ワークフローと全互換性。
実環境での実用的スピード:4080 GPUで20–32ステップを15–20秒で処理し、1枚あたり1分以内にスタジオ級の結果を実現。
⚙️ 推奨設定
ステップ数:20–32(8–12ステップでも動作しますが、一部のディテールが犠牲になります)。
FLuxGuidance:2–4.5(低いほど抽象的、高いほど制約が厳しくなります。私は2.8と4.5を使用しています)。
LoRA戦略:バニラから始め、精密調整に低めのLoRAウェイトを適用してください。
T5‑XXL:最高のコンテキスト理解にはFlan T5‑XXLをご使用ください。
CLIP L:ロングコンテキスト対応のCLIP Lは必須です。私はLongCLIP-GmP-ViT-L-14を推奨します。
📊 パフォーマンスの概要(4080 GPU)
コールドロード(LoRAなし):約1.0–1.1秒/イテレーション
LoRA付き(ウォーム):約1.0–1.3秒/イテレーション
LoRA付き(コールド):約2.0–3.5秒/イテレーション(ウォームアップ後は急速に低下)
🎯 最適な利用シーン
ミドルレンジGPUでFP16レベルの結果を追求するコンテンツクリエイター
広範なスタイル汎用性とプロンプト忠実性を求めるアーティストと開発者
時間は限られているが、画像品質を犠牲にしたくないワークフロー
あなたの最高の出力が、このプロジェクトへのモチベーションの源です。アップロードして披露し、次回のバージョンをさらに良くするために協力してください!
(データセットの寄付も歓迎します。要件についてはDMでお問い合わせください)
ボーナスツール:
Tenos Discord生成ボット: ComfyのAPIとDiscordのAPIを用いた、設定よりも創作に焦点を当てた画像生成ボット。
FluxプロンプトクリーフターGPT: 非常に創造的で視覚的に詳細なFluxプロンプトを生成します。
BobsのComfyUI用潜在変数最適化ツール: FLUX、SDXL、SD3モード用に設計されたComfyUI用カスタムノード。アスペクト比、メガピクセルサイズ、アップスケール係数を柔軟に制御し、特定のタイリングや解像度の要件に合わせた潜在変数を動的に生成できます。
BobsのComfyUI用LoRAローダー: SDXLとFLUXモデル向けに高度なブロックウェイト制御を備えたComfyUI用カスタムLoRAローダーノード。「キャラクター」や「スタイル」などの共通使用ケースのプリセットと、個々のモデルブロックを微調整できる「カスタム」モードを提供。




