Microsoft Vibe Voice Text To Speech Example Workflow
詳細
ファイルをダウンロード
モデル説明
Vibe Voice テキスト-to-音声 AI モデルの例としてのワークフロー。Microsoft VibeVoice と ComfyUI を組み合わせたこの AI ツールは、自然な音声を生成し、音声サンプルからのボイスクローンをサポートし、最大4人の異なる話者による会話生成が可能です。ポッドキャストや長文の音声スクリプトに最適です。音声スタイルや品質の制御オプションを提供し、英語と中国語で最も効果的に動作します。
ComfyUI カスタムノードのリンク - https://github.com/wildminder/ComfyUI-VibeVoice
必要な Python パッケージとカスタムノードのリンクを含む、無料の手書きインストールガイドはこちらで利用可能です - https://www.patreon.com/posts/137750868。
Gradio デモ版の Vibe Voice プロジェクトおよびインストールプロセスについて、手動設定、推奨設定、ローカルおよびクラウドデプロイのヒントを含む完全な動画チュートリアルをご覧になりたい場合は、以下の YouTube チュートリアルをご確認ください:

