Friendly InfiniteTalk Vibe

詳細

ファイルをダウンロード

モデル説明

💫🎙️ こんにちは!フレンドリーなInfiniteTalkビブスへようこそ!

✨ もっと少しだけ混乱して、もっと魔法を。

InfiniteTalkとVibeVoiceを一つのパッケージに。これで、サードパーティのリソースやワークフローを使って音声やリップシンクを生成する必要がなくなりました。InfiniteTalkとVibeVoiceはお互いに最適に設計されており、両モデルとも感情を理解し、長時間の動画(VibeVoice Largeモデルでは最大45分)の生成を可能にしています。

🚀 より良いパフォーマンスのために、ワークフロー内のComfyUIとノードを最新版に更新することをお忘れなく!

💻 480p解像度向けシステム要件:

  • 最低システム要件:

RTX 3000シリーズ、8〜10GBのビデオメモリ、45GBのRAM、8コアプロセッサ、SSD、最新版ComfyUI

  • 推奨システム要件:

RTX 4000シリーズ以上、16GBのビデオメモリ、64GBのRAM、8コアプロセッサ、PCI-E 4.0 SSD、最新版ComfyUI

📌 ワークフロー内に詳細なヒントを記載

ワークフローの特徴:

  • シャンプーのような複雑な接続なしのフレンドリーなUI、設定の便利なスライダー制御

  • 手順ごとの簡単な生成:まず希望の音声を生成し、その後動画生成に進む

  • GGUFモデルまたは通常のモデルの使用(ワークフロー内にリンクあり)

  • 音声の生成または既存のオーディオの使用が可能

  • 音声生成パラメータの微調整

  • 便利な設定スライダー制御

  • VibeVoiceは初期状態で音量が小さいため、出力音量の正規化を設定済み

  • ステージ間での最適化とメモリ削減

  • 設定、詳細なヒント、モデルへのリンク

  • 滑らかな動画用の補間モジュール

🤗🙏🏼 感謝: MeiGen-AI および kijai

オリジナルリポジトリ — GitHub

このモデルで生成された画像

画像が見つかりません。