Microsoft Vibe Voice Text To Speech Example Workflow

Vibe Voice テキスト-to-音声 AI モデルの例としてのワークフロー。Microsoft VibeVoice と ComfyUI を組み合わせたこの AI ツールは、自然な音声を生成し、音声サンプルからのボイスクローンをサポートし、最大4人の異なる話者による会話生成が可能です。ポッドキャストや長文の音声スクリプトに最適です。音声スタイルや品質の制御オプションを提供し、英語と中国語で最も効果的に動作します。

ComfyUI カスタムノードのリンク - https://github.com/wildminder/ComfyUI-VibeVoice

必要な Python パッケージとカスタムノードのリンクを含む、無料の手書きインストールガイドはこちらで利用可能です - https://www.patreon.com/posts/137750868。

Gradio デモ版の Vibe Voice プロジェクトおよびインストールプロセスについて、手動設定、推奨設定、ローカルおよびクラウドデプロイのヒントを含む完全な動画チュートリアルをご覧になりたい場合は、以下の YouTube チュートリアルをご確認ください：

モデルタイプ	ワークフロー
ベースモデル	Other
公開日	9/3/2025

Microsoft Vibe Voice Text To Speech Example Workflow

詳細

ファイルをダウンロード

モデル説明

このモデルで生成された画像