FLUX.2 [klein] AIO

詳細

モデル説明

🚀 FLUX.2 [klein] 4B AIO | サブセカンド画像生成

超高速 • 4-6ステップ • テキストから画像 + 画像編集 • オールインワン • Apache 2.0


✨ FLUX.2 [klein] 4B AIO とは?

FLUX.2 [klein] 4B AIO は、Black Forest Labs が開発した最新のコンパクトな画像生成モデルのオールインワン再パッケージです。このバージョンは、VAE、テキストエンコーダー(Qwen3)、UNet を1つのファイルに統合しており、読み込むだけで即座に使用できます!

「Klein」 はドイツ語で「小さい」という意味ですが、このモデルは決して制限されません。テキストから画像生成(T2I)、画像編集、複数参照生成における卓越した性能を発揮し、通常はより大規模なモデルにのみ備わる機能を提供します。


📦 利用可能なバージョン

🟡 FP8-AIO (~7.7 GB) – ほとんどのユーザーにおすすめ

  • 精度: FP8
  • UNet: FP8
  • テキストエンコーダー: FP8
  • VAE: BF16
  • 最適用途: ほとんどのユーザー、迅速なテスト、日常使用、最低VRAM要件

🔵 FP16-AIO (~15 GB) – 古いGPU向け

  • 精度: FP16
  • UNet: FP16
  • テキストエンコーダー: FP16
  • VAE: BF16
  • 最適用途: 古いGPU(GTX 10xx、RTX 20xx)、最も広範な互換性

🟢 BF16-AIO (~15 GB) – 最高品質

  • 精度: BF16
  • UNet: BF16
  • テキストエンコーダー: BF16
  • VAE: BF16
  • 最適用途: RTX 30xx/40xx/50xx、プロフェッショナル/商用用途

🎯 主な特徴

  • 4-6ステップ生成 – 現代のハードウェアでサブセカンドの推論
  • 📦 オールインワン – 別途VAE/テキストエンコーダーをダウンロードする必要なし
  • 🎨 統一アーキテクチャ – T2I、I2I編集、複数参照を1つのモデルで実現
  • 📐 ネイティブ 1024×1024 – この解像度に最適化
  • 💾 低VRAM – 消費者向けGPUでもスムーズに動作
  • 📜 Apache 2.0 – 商用利用も完全に自由!
  • 🔧 LoRA対応 – ベース版は微調整に最適

⚙️ 推奨設定

  • ステップ数: 4-6(ステップ蒸留済み、ステップ数が増えても品質は向上しない)
  • CFG: 1.0 ⚠️ クリティカル!
  • サンプラー: euler
  • スケジューラ: simple(または「normal」)
  • 解像度: 1024×1024(ネイティブ)

⚠️ クリティカル:CFGは必ず1.0に!

これはCFG 1.0用に最適化された蒸留モデルです。CFG値を高くすると、品質が悪化します!

✅ CFG 1.0 = 正しい
❌ CFG 3.5+ = 間違い、画像が悪くなる

その他の注意点

  • 4-6ステップが最適! モデルは高速推論用にステップ蒸留されています
  • 否定プロンプトは不要 – 使用可能ですが必須ではありません
  • 自然言語プロンプト – 見たいものをそのまま記述してください

📥 インストール(ComfyUI)

クイックスタート

  1. ダウンロード:お好みのバージョン(FP8/FP16/BF16)をダウンロード
  2. 配置ComfyUI/models/checkpoints/ に配置
  3. 読み込み:「Load Checkpoint」ノードで読み込み
  4. 生成!

フォルダ構成

ComfyUI/
└── models/
    └── checkpoints/
        └── flux-2-klein-4b-bf16-aio.safetensors  (または fp16/fp8)

🎨 例:プロンプト

写実的

A professional photograph of a barista making latte art in a cozy 
coffee shop, morning light streaming through windows, shallow depth 
of field, shot on Sony A7III

デジタルアート

A majestic dragon perched on a crystal mountain peak, aurora borealis 
in the background, fantasy digital painting, highly detailed scales, 
dramatic lighting

商品写真

Minimalist product photo of a luxury perfume bottle on white marble, 
studio lighting, reflection, commercial photography

💻 機能

✅ FLUX.2 [klein] 4B が可能なこと:

  • テキストから画像(T2I) – テキストから高品質画像を生成
  • 画像から画像(I2I) – 単一参照編集
  • 複数参照生成 – 複数の入力画像で制御された変換
  • テキストレンダリング – 画像内のテキストレンダリングの改善
  • 写実的 – プロフェッショナルな写真品質
  • 芸術的スタイル – 多様な芸術スタイル

⚠️ 制限事項:

  • 1024×1024に最適化(他の解像度は可能ですが最適ではありません)
  • 4Bモデル – 複雑なシーンでは大規模モデルより詳細度が劣ります
  • 蒸留版 – ベースモデルより出力の多様性がやや低い

🔧 技術的詳細

  • パラメータ数: 40億
  • アーキテクチャ: Rectified Flow Transformer
  • テキストエンコーダー: Qwen3ベース
  • 推論ステップ: 4-6(ステップ蒸留済み)
  • ネイティブ解像度: 1024×1024
  • 精度: BF16 / FP16 / FP8
  • ライセンス: Apache 2.0

🆚 比較:4B と 9B

FLUX.2 [klein] 4B

  • パラメータ: 4B
  • VRAM: ~8-13 GB
  • GPU: RTX 3090/4070+
  • 品質: 非常に良い
  • ライセンス: Apache 2.0 ✅
  • 商用利用: 可!

FLUX.2 [klein] 9B

  • パラメータ: 9B
  • VRAM: ~29 GB
  • GPU: RTX 4090+
  • 品質: 優秀
  • ライセンス: 非商用 ❌
  • 商用利用: 不可

→ 4Bは以下に最適: 消費者向けハードウェア、商用プロジェクト、高速イテレーション


❓ よくある質問

Q:VAE/テキストエンコーダーの別ファイルは必要ですか?

いいえ!AIO = オールインワン。すべてが1つのファイルに含まれています。

Q:商用プロジェクトで使用できますか?

はい!4B版はApache 2.0ライセンスです。

Q:なぜ4-6ステップだけですか?

このモデルはステップ蒸留されています。ステップ数を増やしても品質は向上しません。

Q:なぜCFGは1.0にしなければならないのですか?

これはCFG 1.0用に最適化された蒸留モデルです。高いCFG値は出力品質を低下させます。

Q:FP8とBF16の違いは何ですか?

FP8はファイルサイズが小さく高速、BF16はやや高品質です。ほとんどの用途ではFP8で十分です。

Q:LoRAと互換性がありますか?

はい!特にベース版(非蒸留)はLoRAトレーニングに最適です。

Q:9B版との違いは何ですか?

9Bは品質が優れていますが、商用利用不可です。4BはApache 2.0ライセンスです!


🐛 よくある問題と対処法

画像が「薄い」または過剰に彩度が高い

  • CFGを確認 – 蒸留モデルでは必ず1.0に設定!
  • 4-6ステップを使用

テキストレンダリングが悪い

  • プロンプトでより具体的に記述
  • 簡単で短いテキストを使用
  • テキストの要件をプロンプトの先頭に配置

色がおかしい

  • FP8ではなくBF16版を試す
  • モニターのキャリブレーションを正しく行う

🙏 クレジット

オリジナルモデル: Black Forest Labs
アーキテクチャ: Rectified Flow Transformer
テキストエンコーダー: Qwen3
AIO再パッケージ: SeeSee21

公式リンク:


📋 チェンジログ

v1.0(2026年1月)

  • 初回リリース
  • BF16、FP16、FP8バージョン対応
  • VAE + テキストエンコーダー + UNet をオールインワンで統合

ライセンス: Apache 2.0 – 個人利用・商用利用ともに無料!🎉


ComfyUI向けで最速のオープンソース画像生成モデル!

ダウンロードして、すぐ創作を始めましょう! 🚀

このモデルで生成された画像

画像が見つかりません。