UltraSharpCC

詳細

ファイルをダウンロード

モデル説明

🧬 UltraSharpCC – ヴァイラルスタイルのシャープネス&カラーコレクションLoRA

モデル: Wan T2V 14B
互換性: VACE(Kijai版)– Image2VideoFirst Frame to VideoMask to Video ([Wan2_1-T2V-14B_fp8_e4m3fn.safetensors · Kijai/WanVideo_comfy at main](https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Wan2_1-T2V-14B_fp8_e4m3fn.safetensors)) + ([Wan2_1-VACE_module_14B_fp8_e4m3fn.safetensors · Kijai/WanVideo_comfy at main)](https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Wan2_1-VACE_module_14B_fp8_e4m3fn.safetensors)

I2Vで使用する場合は、Wan T2VとKijaiが抽出したVACEモジュールを組み合わせて使用できます。

Workflow Wan T2V 14b + VACE Module

最適化対象: CausVid(8–10ステップの高速生成)(Wan21_CausVid_14B_T2V_lora_rank32_v2.safetensors · Kijai/WanVideo_comfy at main)

または Lightx2v(LCMを使用した4–10ステップの高速生成)(Wan21_T2V_14B_lightx2v_cfg_step_distill_lora_rank32.safetensors · Kijai/WanVideo_comfy at main)


UltraSharpCCは、Wan T2V 14Bを用いた動画生成向けに設計されたビジュアル強化LoRAです。TikTokで流行した「ヴァイラル動画」の見た目を再現し、シャープネス、ハイダイナミックレンジの輝き、大胆なカラーグレーディングによって画像品質を強調します。これはTopazフィルターやフェイク4Kの美学に似ています。

このLoRAは、元の芸術的スタイルを変更せずに、明瞭さ、コントラスト、表面のディテールを強化し、通常の画像または動画プロンプトを劇的に高品質に見える映画的クリップに変換するのに最適です。

VACEシステムと完全に互換性があり、特に以下のモードで動作します:

  • Image2Video

  • First Frame to Video

  • Mask to Video

UltraSharpCCはCausVidともシームレスに連携し、わずか8〜10ステップで超高速動画生成を実現し、品質の損失を最小限に抑えます。速度と効率を重視するワークフローに最適です。


🧪 学習詳細:

V1

  • フレームワーク: Diffusion Pipe

  • エポック数: 26

  • バッチサイズ: 1

  • ランク: 64

  • 最適化アルゴリズム: automagic

  • 解像度:
    – 動画: 512px
    – 画像: 1024px

  • データセット:
    – 短い動画99本
    – 高解像度画像100枚

  • キャプション: カスタムLLM(gemma3:12b)を使用して、視覚的品質に焦点を当てたプロンプトで生成(以下参照)。

V2

  • フレームワーク: Diffusion Pipe

  • エポック数: 76

  • バッチサイズ: 4

  • ランク: 64

  • 最適化アルゴリズム: automagic

  • 解像度:
    – 動画: [512, 288]

  • データセット:
    – 短い動画99本

  • キャプション: カスタムLLM(gemma3:12b)を使用して、視覚的品質に焦点を当てたプロンプトで生成(以下参照)。


💬 キャプション用プロンプトテンプレート(LLM対応):

この動画フレームシーケンスの内容を分析し、以下の要素を含む1段落の説明を返してください:sh4rpn3ss に続いて、動画に適用された視覚的品質強化(例:シャープネスの向上、4K、8K、HDR輝き、クリアな輪郭)の詳細な説明、およびメインキャラクター(存在する場合)の外見と動画のビジュアルスタイル(例:アニメ、カートゥーン、CGI、実写)の焦点を当てた説明。説明は簡潔にし、強化効果と芸術的スタイルの両方を捉えてください。フォーマット、メタデータ、コメントは一切含めず、sh4rpn3ssで始まる1段落のみを出力してください。

このプロンプトは、GeminiGPTMistralQwenなどの任意のLLMで使用でき、独自のデータセット用のキャプション生成や、一貫した品質重視の形式で生成された動画を記述するのに役立ちます。


使用上のヒント:

  • プロンプトにトリガーワード sh4rpn3ss を追加してLoRAの効果を有効化してください

  • ポートレート、スタイル化されたキャラクター、シネマティックな照明と組み合わせると最適に動作します

  • ヴァイラルなショート動画、AI生成のライブウォールペーパー、モーション強化アートワークに最適です

  • CausVidと組み合わせて、高速レンダリング(8–10ステップ)と優れた視覚的忠実度を実現してください

このモデルで生成された画像

画像が見つかりません。