QWEN-Anime

詳細

ファイルをダウンロード

モデル説明

🎨 QWEN-Anime-Beta1 および Beta2 | 専用アニメチェックポイント

⚠️ 注意: 残念ながら、すべてのバージョンを1つのモデルカードに収めるためにいくつかの工夫を用いました。

🧠 SafeTensor バージョン

🟪 BF16 = プルーニング済みモデル bf16 (38.05 GB)
🟦 FP16 = プルーニング済みモデル fp16 (38.05 GB)
🟨 FP8 = プルーニング済みモデル fp8 (19.03 GB)

💾 GGUF バージョン

⚠️ ComfyUI-GGUF が必要です: https://github.com/city96/ComfyUI-GGUF

🔹 F16 = フルモデル fp16 (38.07 GB)
🔹 Q8 = フルモデル fp8 (20.23 GB)
🔹 Q6 = フルモデル bf16 (15.63 GB)
🔹 Q4 = フルモデル nf4 (10.72 GB)

💡 クイックガイド:

  • Safetensors (🟪🟦🟨) → 通常の「Load Diffusion Model」ノードを使用

  • GGUF (🔹) → ComfyUI-GGUF が必要 → 「GGUF Loader」ノード + unet/ フォルダ

"Velvet-Horizon"


Beta2 リリース - qwen-image-edit 2509 を基にカスタムトレーニングしたアニメチェックポイント

これは、qwen-image-edit 2509 を基にゼロから構築したカスタムトレーニングアニメチェックポイントのBeta2リリースです。ダブルNvidia Tesla P40 GPUを使用し、拡張されたカスタムデータセット後期のトレーニングエポックでさらに多くの時間をかけてトレーニングした結果、この改善版をコミュニティに共有できることを嬉しく思います!

🆕 Beta2 の新機能は?

より多くのトレーニングデータ - より多様なカスタムデータセットを拡張
後期エポック - 安定性と品質を向上させるための洗練されたトレーニング
複数フォーマット対応 - BF16、FP16、FP8、GGUF(Q4/Q6/Q8/F16)で提供
より良い一貫性 - すべての解像度とプロンプトで改善された結果
最適化された品質 - 詳細度と色の正確性を強化

🔮 まもなく登場:QWEN-Anime-Beta2-AIO

現在、オールインワン版(Beta2-AIO) の開発を進めています。これには以下が含まれます:

  • ✅ 統合済み VAE およびテキストエンコーダー

  • ✅ 別途ファイルをダウンロードする必要なし

  • ✅ プラグアンドプレイ体験

  • ✅ 同じ品質、簡単なセットアップ


⚡ なぜこれが特別なのか?

🎯 カスタムトレーニングの基盤

✅ qwen-image-edit 2509 アーキテクチャをベース
✅ 自作のカスタムアニメデータセットでスクラッチからトレーニング
✅ 安定性と品質のためのデュアル Tesla P40 GPU トレーニング
✅ 本格的なアニメ美学に最適化
Beta2:より大きなデータセットで拡張トレーニング

🚀 パフォーマンスのハイライト

⚡ 4ステップLoRAで驚異的な高速生成(ほとんどの解像度で19-52秒)
📐 多解像度対応 – 512×512 から 2K+ まで
💪 柔軟なステップ範囲 – 4〜50ステップで高品質な結果を実現
🎨 Beta2:すべての設定で一貫性が向上

🎨 多様な出力

🌐 自然言語プロンプトとdanbooruタグをサポート
🎛️ 複数のサンプラー対応(Euler A、Euler Normal、Beta、Simple)
🔄 Qwen Lightning LoRAsと互換性あり(高速化に最適)
Beta2:プロンプト理解と準拠が改善


💬 Beta ノーティスおよびコミュニティテスト

⚠️ これはまだベータ版です! コミュニティからのフィードバックを積極的に募集しています。

このチェックポイントは8GB VRAMで広くテストされていますが、以下の点についてご協力をお願いします:

✨ 異なる精度バージョン(BF16、FP16、FP8、GGUF)をテスト
✨ 異なるプロンプティングスタイルを探索
✨ 各用途に最適な設定を見つける
✨ 問題や予期しない挙動を報告
Beta2:Beta1と品質の向上を比較

あなたのフィードバックは、最終リリースおよび今後のAIO版の開発に直接反映されます!🙌


📊 パフォーマンスベンチマークおよびテスト結果

すべてのテストは8GB VRAM、Euler Aサンプラーで実施

🔬 テスト1:サイバーパンクハッカーガール

解像度: 512×512 | ステップ: 4(LoRA使用) | CFG: 1.0 | 時間: 19.96秒

サイバーパンクハッカーガール画像

プロンプト:

anime, masterpiece, best quality, 1girl, neon hacker, short purple hair with glowing cyan highlights, cybernetic eye augmentation, focused expression, typing on holographic keyboard, glowing UI reflections on face, dark room illuminated by multiple screens, cyberpunk 2077 aesthetic, sharp details, cinematic lighting, rain on window bokeh, DETAILED EYES, tech wear, futuristic

使用例: Lightning LoRAによる超高速キャラクター生成


🔬 テスト2:ファンタジー猫魔女

解像度: 512×512 | ステップ: 8(LoRA使用) | CFG: 1.0 | 時間: 37.43秒

ファンタジー猫魔女画像

プロンプト:

anime, 1girl, nekomimi, fluffy cat ears, long silver hair with bells, golden feline eyes, playful smirk, witch hat with star ornaments, casting fire magic, floating spell circles, cozy library background, warm candlelight, soft shading, fluffy tail visible, DND fantasy style, vibrant colors, DETAILED FUR, sparkles around hands

使用例: ケモミミ要素を持つ詳細なファンタジー人物


🔬 テスト3:雨の中の侍

解像度: 512×768 | ステップ: 20 | CFG: 2.5 | 時間: 166.19秒

雨の中の侍画像

プロンプト:

anime, 1boy, young samurai, black messy hair wet from rain, determined piercing eyes, scar over left eyebrow, traditional dark blue kimono, sword drawn with water droplets on blade, dramatic rainfall, neon signs blurred in background, cyber-samurai aesthetic, dark moody atmosphere, sharp focus on face, cinematic composition

使用例: 大気効果と詳細な構図を伴うポートレート形式


🔬 テスト4:神秘的なエルフ

解像度: 512×768 | ステップ: 50 | CFG: 4.0 | 時間: 414.57秒

神秘的なエルフ画像

プロンプト:

anime, 1girl, elf, long white hair, glowing blue eyes, pointy ears, nature background, ANIME, masterpiece, sharp focus, ethereal glow, MOE STYLE, tree magic, fast render

注: 8GB VRAMで最大の詳細を追求するため、ステップ数を増やしています。

使用例: 時間が制約でない場合の究極品質モード


🔬 テスト5:ゴシックゲーマーガール

解像度: 1024×1024 | ステップ: 8(LoRA使用) | CFG: 1.0 | 時間: 51.85秒

ゴシックゲーマーガール画像

プロンプト:

anime, masterpiece, best quality, ultra-detailed, gothic, anime confident gamer girl with turquoise pixie hair and dragon tattoo on neck, golden eyes and smug expression, ripped band shirt falling off shoulder revealing bare breast and underboob, jeans unzipped and low on hips, casually leaning on gaming setup with beer, messy bedroom background.

使用例: 複雑なディテールを伴う高解像度キャラクターアート


🔬 テスト6:ラマモード 😅👍

解像度: 832×1216 | ステップ: 8(LoRA使用) | CFG: 1.0 | 時間: 52.03秒

ラマモード画像

プロンプト:

anime, In the fiery depths of an erupting volcano, a solitary llama stands amidst smoldering ruin, silhouetted against molten lava and towering ash clouds. Its plush coat is immaculate despite the surroundings—jagged metal, cracked concrete, glowing embers. The llama's calm demeanor contrasts sharply with the chaos around it. Bright hues of flames and smoke frame the scene. Studio anime style emphasizes detailed backgrounds and expressions; vibrant colors enhance the dramatic setting.

使用例: 柔軟性の証明 – 例え奇抜なコンセプトでも美しく生成!


🔬 テスト7:メカパイロットポートレート

解像度: 1024×1536 | ステップ: 8(LoRA使用) | CFG: 1.0 | 時間: 63.73秒

メカパイロットポートレート画像

プロンプト:

anime, 1girl, mecha pilot, blue jumpsuit, headset, short red hair, serious expression, cockpit background, HUD reflections on face, sharp ANIME STYLE, high contrast, detailed eyes, mechanical details, neon accents, SPEEDPAINT, high quality

使用例: フルボディキャラクターポートレートに最適な縦長フォーマット


🔬 テスト8:プリンセスゼルダ(デュアルテスト)

解像度: 2048×1152 | CFG: 1.0

4ステップ版: 45.28秒(4ステップLoRA使用)
8ステップ版: 83.57秒(8ステップLoRA使用)

プリンセスゼルダ画像

プロンプト:

anime, masterpiece, 2k resolution, ultra-detailed, depth of field, best quality, (anime coloring, anime screencap:1.5), official art style, 1girl, Princess Zelda from The Legend of Zelda, standing on an ancient stone balcony overlooking Hyrule at sunrise, long golden hair flowing in the wind, wearing elegant white and gold royal robes with light blue accents, glowing runes on fabric edges, soft light reflecting from the Master Sword resting nearby, ancient ruins and floating islands in the background, golden morning mist, warm cinematic lighting, anime fantasy atmosphere, calm expression full of determination, official art aesthetics, add microdetails, masterpiece illustration, ultra-realistic anime rendering, inspired by Tears of the Kingdom and Breath of the Wild.

使用例: 速度と品質の両方を備えたシネマティック2Kレンダリング

注: 8GB VRAMでも2K解像度がスムーズに処理可能!LoRAステップ数で速度と品質の選択が可能。


🎯 クイックスタートガイド

基本設定(テスト推奨)

  • ステップ: Lightning LoRA使用時は4-8、使用しない場合は16-32

  • CFGスケール: 1.0-4.0(LoRA使用時は低め、より制御したいときは高め)

  • サンプラー: Euler A、Euler Normal、Beta、またはSimple

  • 解像度: 512×512から開始し、必要に応じて拡大

速度向上に推奨されるLoRA

💡 ベータテストのプロヒント

  • 超高速結果が欲しい? → CFG 1.0で4ステップLoRAを使用

  • より制御したい? → LoRAを使わず、CFG 2.5-4.0で20-32ステップを使用

  • より強いアニメスタイルを出したい?masterpiece, best quality, ANIME などのトリガー語を追加

  • 実験中? → 異なるステップ数を試してみてください!このモデルは4〜50ステップまで優れたスケーリングを示します!

  • Beta2ヒント: 異なる精度バージョンを試してみてください – FP8が最も高速、BF16/FP16が最高品質


🔧 テクニカル情報

トレーニング詳細

  • ベースモデル: qwen-image-edit 2509

  • トレーニングハードウェア: ダブルNvidia Tesla P40 GPU

  • トレーニングデータ: カスタムアニメデータセット(私自身が作成)

  • トレーニング期間: 数多くの集中トレーニング時間

  • アーキテクチャ: QWENベース(別途VAE/CLIPが必要)

  • Beta2改善点: より大きなデータセットで拡張トレーニング、後期エポックで収束性向上

利用可能なフォーマット

プルーニング済みモデル(Safetensors)

  • BF16(38.05 GB)– 最高精度

  • FP16(38.05 GB)– 標準精度

  • FP8(19.03 GB)– 高速かつメモリ効率

GGUFモデル(ComfyUI-GGUFカスタムノードが必要)

⚠️ インストール必須: https://github.com/city96/ComfyUI-GGUF

  • F16(38.07 GB)– フル精度

  • Q8(20.23 GB)– 高品質量子化

  • Q6(15.63 GB)– 品質とサイズのバランス

  • Q4(10.72 GB)– 最小サイズ、良好な品質

GGUFの使用方法:

  • models/unet/ フォルダに配置(diffusion_models/ ではありません)

  • ComfyUIでUnetLoaderGGUFノードを使用

  • CPU推論やVRAMが限られた環境に最適

推奨:

  • 速度と品質のバランスFP8(8GB VRAM向け)

  • 最高品質BF16/FP16(12GB+ VRAM向け)

  • CPU推論または極限VRAM環境GGUF Q6/Q8

含まれていないもの(ベータ版)

❌ これはオールインワンチェックポイントではありません
❌ 別途VAEが必要(FLUX VAEまたは互換性のあるもの)
❌ CLIP/テキストエンコーダーのセットアップが必要
❌ Lightning LoRAsは別売(オプションですが推奨)

🔮 まもなく登場:Beta2-AIO(オールインワン)

現在、QWEN-Anime-Beta2-AIOを開発中です。これには以下が含まれます:

  • ✅ 統合済みVAEおよびテキストエンコーダー(別途ダウンロード不要!)

  • ✅ 単一ファイル、プラグアンドプレイ体験

  • ✅ デフォルトのComfyUIワークフローでそのまま使用可能

  • ✅ Beta2の品質をそのままに、最大の利便性を実現

予定: Beta2のフィードバックを収集した後に次回アップデートで登場!

パフォーマンス特性

✅ アニメ美学に最適化
✅ Lightning LoRAsで高速収束
✅ 柔軟なステップ範囲(4〜50ステップでテスト済み)
✅ 2K+までの多解像度対応
✅ 8GB VRAMでテスト済み・確認済み
Beta2:安定性と一貫性が向上


⚙️ サンプラー互換性

確認済み動作

  • Euler A(主要テスト用サンプラー)

  • Euler Normal(動作確認済み)

  • Beta(動作確認済み)

  • Simple(動作確認済み)

コミュニティによるテスト歓迎

  • ❓ その他のQWEN互換サンプラー

すべての主要サンプラーが完璧に動作します! お好みのサンプラーをご自由にご利用ください。異なるサンプラーでの体験をコメント欄でお知らせください!


📐 解像度対応

テスト済み・確認済み(8GB VRAM)

  • ✅ 512×512 – 超高速(LoRA使用時20-40秒)

  • ✅ 512×768 – 縦向きフォーマット(ステップ数により37-166秒)

  • ✅ 1024×1024 – 標準HD(LoRA使用時約52秒)

  • ✅ 832×1216 – 長い/縦向き(LoRA使用時52秒)

  • ✅ 1024×1536 – フルボディポートレート(LoRA使用時64秒)

  • ✅ 2048×1152 – 2Kシネマティック(LoRA使用時45-84秒)

より高い解像度も動作する可能性がありますが、コミュニティによるテストが必要です!


🎯 最適な利用シーン

ベータテスト担当者 – 最終リリースとAIO版の開発に協力してください!
スピード愛好家 – 超高速LoRA対応で迅速な生成が可能
アニメアーティスト – 手作業で作成されたアニメ専用データセットで学習済み
キャラクターデザイナー – キャラクターの細部表現に優れています
ファンタジークリエイター – 魔法的・ファンタジー要素に非常に適しています
汎用性を求める方 – サイバーパンクから中世ファンタジーまで幅広く対応
低VRAMユーザー – FP8およびGGUF Q4/Q6バージョンを提供中


📝 プロンプトガイド

推奨プロンプト構造

成功テストに基づき、以下の構造をご使用ください:

anime, [品質タグ], [被写体の説明], [スタイル詳細], [雰囲気/照明]

効果的な品質タグ

  • masterpiece, best quality, ultra-detailed

  • 2k resolution, depth of field

  • sharp focus, high quality

  • DETAILED EYES, DETAILED [feature]

スタイル修正子

  • anime coloring, anime screencap

  • MOE STYLE, official art style

  • cinematic lighting, dramatic composition

  • SPEEDPAINT(ペイント風スタイルに)

自然言語:非常に効果的!モデルは複雑な説明をうまく処理します。
Danbooruタグ:タグベースのワークフローにも対応しています。
混合アプローチ:両方を組み合わせると最適な結果が得られます!


🔞 コンテンツ注意

このチェックポイントは、ベースモデルと同様にNSFW対応が限定的です:

対応:裸の胸やアンダーブーブを含む芸術的描写
非対応:ベースモデルの能力を超える完全な明示的NSFWコンテンツ

トレーニングプロセスは、ベースのqwen-image-edit 2509モデルのNSFW機能を大幅に変更していません。明示的なコンテンツ生成には、他の専用モデルをご利用ください。

18歳以上の方のみ対象。CivitAIのガイドラインに従い、責任を持ってご利用ください。


🔗 モデルリンク

必須ダウンロード

このモデルとすべての必須コンポーネントは以下からダウンロードできます:

Diffusionモデル(メインチェックポイント)

  • qwen-anime-beta1/beta2(複数フォーマット)このCivitAIページで入手可能

LoRA(任意ですが推奨:高速化用)

テキストエンコーダー(必須)

VAE(必須)

📂 モデル保存場所

ダウンロードしたファイルを、以下のComfyUIディレクトリ構造に配置してください:

Safetensorsモデル(BF16/FP16/FP8)用:

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── qwen-anime-beta2-fp8.safetensors(または選択したバージョン)
│   ├── 📂 loras/
│   │   ├── Qwen-Image-Lightning-4steps-V1.0.safetensors
│   │   └── Qwen-Image-Lightning-8steps-V1.0.safetensors
│   ├── 📂 vae/
│   │   └── qwen_image_vae.safetensors
│   └── 📂 text_encoders/
│       └── qwen_2.5_vl_7b_fp8_scaled.safetensors

GGUFモデル(Q4/Q6/Q8/F16)用:

⚠️ 重要: GGUFモデルにはComfyUI-GGUFカスタムノードが必要です!

インストール:

https://github.com/city96/ComfyUI-GGUF

GGUFファイル配置場所:

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 unet/
│   │   └── qwen-anime-beta2-Q8.gguf(または選択したGGUFバージョン)
│   ├── 📂 loras/
│   │   ├── Qwen-Image-Lightning-4steps-V1.0.safetensors
│   │   └── Qwen-Image-Lightning-8steps-V1.0.safetensors
│   ├── 📂 vae/
│   │   └── qwen_image_vae.safetensors
│   └── 📂 text_encoders/
│       └── qwen_2.5_vl_7b_fp8_scaled.safetensors

💡 GGUFに関する注意点:

  • GGUFモデルはdiffusion_models/ではなくunet/フォルダに配置してください。

  • city96のComfyUI-GGUFカスタムノードを必ずインストールしてください。

  • 通常の「Load Diffusion Model」ではなく、「GGUF Loader」ノードを使用してください。

  • GGUFモデルはCPU推論や極限の低VRAM環境に最適です。

💡 一般注意: Lightning LoRAは4ステップと8ステップの両方を必要としません。お好みで選んでください:

  • 4ステップLoRA = より高速、やや詳細度が低め

  • 8ステップLoRA = 速度と品質のバランスが良い


🚀 初期設定

Safetensorsモデル(BF16/FP16/FP8)用インストール

  1. お好みのバージョンをダウンロード(8GB VRAMならFP8推奨)

  2. 上記リンクからテキストエンコーダーVAEをダウンロード

  3. (任意)Lightning LoRA(4ステップまたは8ステップ)をダウンロード

  4. すべてのファイルを正しいComfyUIフォルダに配置(上記ディレクトリ構造を参照)

  5. ComfyUIでチェックポイントを読み込み、生成開始!

GGUFモデル(Q4/Q6/Q8/F16)用インストール

  1. まずComfyUI-GGUFカスタムノードをインストール: https://github.com/city96/ComfyUI-GGUF

  2. お好みのGGUFバージョンをダウンロード(品質重視ならQ8推奨)

  3. 上記リンクからテキストエンコーダーVAEをダウンロード

  4. (任意)Lightning LoRA(4ステップまたは8ステップ)をダウンロード

  5. GGUFファイルをmodels/unet/フォルダに配置(diffusion_models/ではありません!)

  6. ワークフローではUnetLoaderGGUFノードを通常のUNETLoaderの代わりに使用

  7. 生成開始!

初回生成推奨設定

  • 解像度: 512×512

  • ステップ数: 8(8ステップLoRA使用時)または20(LoRA未使用時)

  • CFG: 1.0(LoRA使用時)または3.0(LoRA未使用時)

  • サンプラー: Euler A(または上記確認済みサンプラー)

  • テスト例からシンプルなプロンプトを使用


🐛 既知の問題とベータ版の制限

現在の状態

  • ⚠️ ハードウェアの多様性テストが限定的(主に8GB VRAM)

  • ⚠️ 最適な設定に関するフィードバックを収集中

  • ⚠️ 一部のプロンプトパターンの改善が必要

  • ⚠️ まだAIOチェックポイントとして提供されていません

  • ⚠️ Beta2:異なる精度バージョンに関するフィードバックが必要

ご協力のお願い

  • 🔍 他のハードウェア(12GB、16GB、24GB VRAM)でテスト

  • 🔍 異なる精度バージョン(BF16 vs FP16 vs FP8)を比較

  • 🔍 GGUFバージョンを各種ツールでテスト

  • 🔍 エッジケースや珍しいプロンプトを試す

  • 🔍 Beta2とBeta1の改善点を比較

  • 🔍 自分で見つけた最適設定を共有


❓ FAQ

Q:どのバージョンをダウンロードすべきですか?
A:8GB VRAMならFP8、12GB以上なら最高品質のためBF16またはFP16をご使用ください。

Q:Beta1とBeta2の違いは何ですか?
A:Beta2はより多くのトレーニングデータ、後のトレーニングエポック、より高い一貫性、複数の精度フォーマットを提供しています。

Q:これは完全なAIOチェックポイントですか?
A:いいえ!このベータ版は個別のVAEとCLIP設定が必要です。Beta2-AIOがまもなくリリースされ、すべてが統合されます!

Q:Lightning LoRAは必要ですか?
A:必須ではありませんが、高速化のために強く推奨します!使用しない場合、20-32ステップで生成してください。

Q:なぜまだベータ版なのですか?
A:最終リリース前にコミュニティのフィードバックを得たいからです。あなたのテストが、最終版と次期AIO版の改善に役立ちます!

Q:どのサンプラーが最適ですか?
A:Euler A、Euler Normal、Beta、Simpleのすべてが優れた結果を出します。お好みのものをご使用ください。

Q:独自のLoRAを追加できますか?
A:もちろん可能です!これは完全なチェックポイントです。好きなLoRAを重ねてご利用ください。

Q:最終リリースはありますか?
A:はい!コミュニティのフィードバックをもとに、すべてが統合された安定版(Beta2-AIO) をリリースします。

Q:必要なハードウェアは?
A:8GB VRAMでFP8が動作します。高精度バージョンにはより多くのVRAMが必要です。GGUFバージョンはCPUでも動作します。

Q:SDXLワークフローと互換性がありますか?
A:いいえ。これはQWEN/FLUXアーキテクチャ専用です。

Q:どの程度のNSFWコンテンツを生成できますか?
A:ベースモデルと同様に、主に胸の芸術的描写まで。明示的なコンテンツには対応していません。

Q:GGUFのQ4/Q6/Q8の違いは?
A:Q4は最小(10GB)、Q6はバランス型(15GB)、Q8は最高品質(20GB)。数字が高いほど品質が良く、ファイルサイズも大きくなります。

Q:GGUFモデルの使い方は?
A:https://github.com/city96/ComfyUI-GGUF からComfyUI-GGUFカスタムノードをインストールし、GGUFファイルをmodels/unet/に配置。その後、通常の「Load Diffusion Model」ではなく「GGUF Loader」ノードを使用してください。


📸 あなたの作品を公開しましょう!

作品を共有する際は、以下を含めてください:

  • 使用したプロンプト

  • 解像度と設定(ステップ数、CFG、サンプラー)

  • 使用したバージョン(FP8、BF16、GGUFなど)

  • Lightning LoRAを使用したか

  • 使用したVRAM容量

  • 遭遇した問題や驚き

  • Beta2:Beta1との比較(可能であれば)

これにより、このベータ版の最適設定をすべてのユーザーが学べます!


💬 フィードバックとコミュニティ

これはベータ版です。あなたの声が必要です!

求めているフィードバック:

  • ✅ さまざまなプロンプトスタイルの品質評価

  • ✅ 異なるハードウェアでのパフォーマンスレポート

  • ✅ 他のアニメモデルとの比較

  • ✅ バグ報告と予期しない動作

  • ✅ 改善のための提案

  • ✅ 自分で見つけた最適設定

  • Beta2:異なる精度バージョンのフィードバック

  • Beta2:Beta1との品質比較

協力方法:

  • 📝 テスト結果を詳細にレビューに記載

  • 🖼️ 設定とともに生成画像を共有

  • 💬 フィードバックや提案をコメント

  • 🐛 再現手順を添えて不具合を報告

  • ⭐ あなたの体験に基づいて正直に評価


🙏 クレジットと感謝

基盤:

  • qwen-image-edit 2509 – ベースモデル

  • カスタムトレーニングデータセット – 自身で作成したアニメ専用コレクション

  • Nvidia Tesla P40(×2) – トレーニングハードウェア

  • Qwen Lightning LoRAs – 高速化用(別途ダウンロード)

特別な感謝:

  • QWEN開発チーム – 優れたベースモデルを提供

  • CivitAIコミュニティ – 持続的なサポート

  • このベータ版をテストしフィードバックをくれたすべての人!

  • Beta1のテスト者 – あなたのフィードバックがBeta2の実現を可能にしました!


📊 ベータ版ステータスまとめ

✅ 動作確認済み機能:

  • コア機能 – 完全に動作

  • Lightning LoRA対応 – テスト済み・確認済み

  • マルチ解像度対応 – 512pxから2K以上

  • 8GB VRAM対応 – FP8で確認済み

  • 12GB+ VRAM対応 – BF16/FP16で確認済み

  • GGUF対応 – Q4/Q6/Q8/F16で利用可能

  • サンプラー: Euler A、Euler Normal、Beta、Simple – 全て確認済み

  • スタイル汎用性: アニメに特化し、優れた結果を出力

⚠️ 制限事項:

  • NSFW対応: 芸術的裸体(胸・アンダーブーブ)まで

  • 完全な明示的NSFW: トレーニング対象外

  • AIOパッケージ: 未提供(Beta2-AIO開発中)

  • 製品ステータス: まだベータ段階

🔄 現在進行中:

  • コミュニティフィードバック収集

  • ハードウェア互換性テスト

  • 最適設定の発見


🚀 ロードマップ

Beta2フェーズ(現在)

  • ✅ 改善されたトレーニングによるBeta2リリース

  • ✅ 複数精度フォーマット(BF16/FP16/FP8)

  • ✅ GGUFバージョン提供

  • 🔄 コミュニティフィードバック収集

  • 🔄 ハードウェア互換性テスト

  • 🔄 最適設定の発見

Beta2-AIOで計画中:

  • 現在開発中!

  • 📋 VAE/CLIPを統合したすべてを一つにしたチェックポイント

  • 📋 単一ファイルダウンロード

  • 📋 プラグアンドプレイ体験

  • 📋 デフォルトのComfyUIワークフロー対応

  • 📋 別ファイルの管理不要

安定版リリースで計画中:

  • 📋 コミュニティフィードバックの反映

  • 📋 追加トレーニングの最適化

  • 📋 より大規模なデータセットと長期間トレーニング

  • 📋 拡充されたドキュメント

  • 📋 高度なプロンプトガイド

  • 📋 完全な製品版としてリリース


今すぐQWEN-Anime-Beta2をダウンロードし、最終リリースの形成に協力してください! 🎨

あなたのフィードバックは非常に価値があります。すべてのテスト、コメント、提案が、このモデルをより良くする鍵です!


バージョン: Beta 2
リリース日: 2025年11月
トレーニング: 自作データセット、Dual Tesla P40 GPUで実施(拡張)
ベース: qwen-image-edit 2509
まもなく登場: Beta2-AIO(統合型バージョン開発中)

Created with ❤️ for the AI art community

⚠️ 注意: これはベータソフトウェアです。不完全な部分がある可能性があります。問題があればぜひ報告してください!一緒に素晴らしいモデルに仕上げましょう! 🚀

🎯 バージョン比較

📦 Beta1

  • 学習データ: ベースデータセット
  • 学習エポック: 初期段階
  • 利用可能なフォーマット: FP16のみ
  • 一貫性: 高品質
  • セットアップ: 4つの別々のファイルが必要
  • 品質: 高い

📦 Beta2(現在版)

  • 学習データ: 拡張データセット ✨
  • 学習エポック: 後期段階(より洗練された)✨
  • 利用可能なフォーマット: BF16、FP16、FP8、GGUF(Q4/Q6/Q8/F16)✨
  • 一貫性: より高い品質と安定性 ✨
  • セットアップ: 4つの別々のファイルが必要
  • 品質: Beta1より高い ✨

📦 Beta2-AIO(まもなく登場!)

  • 学習データ: 拡張データセット(Beta2と同じ)
  • 学習エポック: 後期段階(Beta2と同じ)
  • 一貫性: Beta2と同じ
  • セットアップ: 1つのファイルで即座に使用可能!🎉
  • ファイル数: 1ファイルのみ(VAE + CLIP統合済み)
  • 品質: Beta2と同等の高品質

推奨:

  • 最新の品質と柔軟性を求める場合はBeta2を選択してください
  • セットアップの簡易さを重視する場合はBeta2-AIOをお待ちください!

このモデルで生成された画像

画像が見つかりません。