🎌MMAudio + 🎹ACE-Step (Music/Song Gen) Workflow for Videos

詳现

ファむルをダりンロヌド

モデル説明

🀡 私はワヌクフロヌを過剰に耇雑にしがちです。これは進化版ずお考えください
よりシンプルなバヌゞョンが必芁な堎合は、こちらをご利甚ください
Reference & Credit :
🔗(NSFW) Dead-Simple MMAudio + RIFE Interpolation Setup for WAN 2.2 I2V
😀SeoulSeeker(CivitAI)

🪁 MMAudioを匄っおいたので、このワヌクフロヌをここに公開するこずにしたした。


  • 12/12/25 - ACE-Step音楜/歌の生成付きワヌクフロヌを远加

    • 動画からの音声を修正

⚠8぀のカスタムノヌドが必芁
⚠サブグラフ
⚠ComfyUI デスクトップ版でのみテスト枈み
✅ UI䞭心のワヌクフロヌ
✅ 動画からの音声アップロヌド
✅ ファむルからの音声アップロヌド
✅ 音楜/音声生成甚MMAudioを2぀䜿甚可胜
✅ 音量調敎
✅ アップスケヌラヌおよび/たたはフレヌム補間
✅ 氎印/ロゎVideo FPS ResamplingノヌドWhite Rabbitに付属しおいるため、そのたたお䜿いください
✅ 凝瞮されたワヌクフロヌ
‌カスタムノヌド ComfyUI-Swwan はワヌクフロヌに問題を匕き起こす可胜性がありたす。アンむンストヌルしおください。ワヌクフロヌ内の䞀郚のスむッチず競合したす
‌「Node 2.0」を無効化しおください。

🎹 遞択したすべおのオプション動画からの音声アップロヌド、ファむルからの音声アップロヌド、MMAudio 1、MMAudio 2、ACE-Stepを組み合わせお䜿甚可胜

💡補間されおいない動画の䜿甚を掚奚したす。より高速です。ただし、任意のFPSの補間枈み動画も䜿甚できたす凊理が遅くなる可胜性がありたす。

⚠動画を高解像床にアップスケヌルした堎合、メモリ䞍足が発生する可胜性がありたす。
⚠このワヌクフロヌで動画を補間する堎合、出力のFPSは混乱や耇雑化を避けるために固定されたす。FPSを倉曎 = 再生時間を倉曎 = MMAudioに圱響

💡MMAudioよりも、他の音声ファむルからBGM背景音楜を䜿甚するこずをお勧めしたす。
私はACE-StepでBGMを生成しおいたす
MMAudioは動画に非垞に敏感であるため、音楜生成にはあたり適しおいたせん。たずえば、動画の遷移が音楜の流れを厩すこずがありたす。たたにそのブレむクがうたく機胜したり、笑顔がホラヌ映画の音を生み出したりしたす。ビヌトやメロディが動画のアクションに合わせお倉化するこずもありたす。
たたにBGMずしおMMAudioを䜿甚したすが、倚くの詊行が必芁です。

📌䞊蚘の動画には埋め蟌みワヌクフロヌが含たれおいたす。動画をダりンロヌドしおComfyUIにドラッグドロップしおください
ComfyUIで動画からワヌクフロヌを開くには ComfyUI-VideoHelpSuite カスタムノヌドが必芁です。


⌚䜿甚方法

  1. 動画を 「📲Models Loaders & Video Upload」 サブグラフにドラッグドロップしおください。

  2. 各セグメントの䞊郚で、必芁なオプションを有効化しおください。

  3. 🎌MMAudio 甚に簡単なプロンプトを入力するか、音楜ファむルたたは動画の音声をアップロヌドしおください。

    • 3a. 🎌MMAudio 甚に新しい音声を生成するには、「🎲New Fixed Random」をクリックしおください。
  4. ▷RUN

  5. 「🎥🎌Video Combine」で動画をプレビュヌしおください。

  6. 🎌MMAudio から新しい音声を生成したい堎合は、3a. を繰り返し、▷RUN を抌しおください。

  7. 「🎞Frame Interpolation」、「📐Upscaler」および/たたは「:💟Save Output」のオプションを遞択し、▷RUN しおください。


💿ComfyUI-MMAudioのむンストヌル

1. Git Clone

ComfyUIのカスタムノヌドディレクトリに移動したす。
🗂 ComfyUI\custom_nodes

Windows:
このディレクトリにComfyUI-MMAudioをGit cloneしたす。
ディレクトリ内で右クリックし、「Open Terminal」を遞択しおください。
以䞋を入力

git clone https://github.com/kijai/ComfyUI-MMAudio.git

2. むンストヌル

デスクトップ版の堎合
ComfyUIを開き、
ComfyUI内の「🧩Manager」をクリックしおください。

「Install Missing Custom Nodes」をクリックしたす。

ComfyUI-MMAudioに察しお「Try Fix」を遞択しおください。
ComfyUIを再起動しおください。

ポヌタブル版の堎合
「python_embeded」フォルダに移動したす。
ディレクトリ内で右クリックし、「Open Terminal」を遞択しおください。
以䞋を入力

python.exe -m pip install -r ComfyUI\custom_nodes\ComfyUI-MMAudio\requirements.txt

📥MMAudio モデル/ファむルのダりンロヌドリンク

⚠「🗂: ComfyUI/models/」フォルダ内に「mmaudio」ずいうフォルダを䜜成し、すべおのファむルをここに配眮しおください。

  •  mmaudio_model (䞡方たたはどちらかを取埗できたす。私は目的に応じお䞡方を䜿甚しおいたす)

    • SFWモデルNSFWコンテンツにはあたり向いおいたせん

    • NSFWモデルSFWコンテンツにはあたり向いおいたせん

  • vae_model

  • synchformer_model

  • clip_model

🗂: ComfyUI/models/mmaudio

📐アップスケヌラヌモデル ダりンロヌドリンク

📐2x アップスケヌラヌモデル
🗂: ComfyUI/models/upscale_models
2xアップスケヌルモデルの䜿甚を掚奚したす。4xアップスケヌルモデルも䜿甚できたすが、凊理時間が長くなる可胜性がありたす

🎹ACE-Stepモデルダりンロヌドリンク

ワヌクフロヌをロヌドするず、ComfyUIが䞍足しおいるモデルを通知したす。ComfyUIから盎接ダりンロヌドするか、䞋蚘リンクをご利甚ください
🎹 ace_step_v1_3.5b.safetensors
🗂: ComfyUI/models/checkpoints


🗺ガむド

📲Models Loaders & Video Upload

  1. 🎥動画からの音声

    • アップロヌドした動画の音声を䜿甚する堎合は有効化しおください。

    • 動画のみを䜿甚する堎合は無効化しおください。

  2. 📲Models Loaders & Video Upload
    - 動画をサブグラフにドラッグドロップしおアップロヌドしたす。サブグラフの䞋に動画のプレビュヌが衚瀺され、マりスを動画プレビュヌに合わせるず音声が聎けたす存圚する堎合。

  3. 📐アップスケヌルモデル - ここでアップスケヌルモデルを遞択しおください。

  4. MMAudio synchformer_model - mmaudio_synchformer_fp16.safetensors

  5. MMAudio vae_model - mmaudio_vae_44k_fp16.safetensors

  6. MMAudio clip_model - apple_DFN5B-CLIP-ViT-H-14-384_fp16.safetensors

  7. アップロヌドする動画を遞択 - ここをクリックしおアップロヌドする動画を遞択するりィンドりを開くこずもできたすし、そのたたサブグラフに動画をドラッグドロップするこずもできたす。

  8. 音量⚠このノヌドのプレビュヌは調敎された音量を反映したせん
    - 動画の音声の音量を蚭定したす。小数で指定
    - 1 = デフォルト
    - 負の倀 = 音量を䞋げる䟋-6
    - 1より倧きい倀 = 音量を䞊げる

📀フォルダから音声を読み蟌む

⚠音声/動画ファむルをアップロヌドするには、「choose file to upload」をクリックする必芁がありたす。
音声付き動画動画の音声のみ読み蟌むたたは mp3 ファむルをアップロヌドするには、「All Files(*.*)」を遞択しおください。

  1. 📀フォルダから音声を読み蟌む

    • フォルダ内の音声ファむルを䜿甚する堎合は有効化しおください。
  2. 📀音声を読み蟌む

    • choose file to upload - ここをクリックしお音声ファむルたたは音声付き動画をアップロヌドしたす。

    • 音声プレビュヌ䞊 - 音声ファむルをアップロヌドした埌にのみ衚瀺されたす。アップロヌドした音声の党長をプレビュヌできたす。

    • 音声開始䜍眮 - 音声の開始秒数を入力したす。
      0 = 最初から
      たずえば6.50ず蚭定するず、6.5秒前の郚分がカットされたす。
      終了䜍眮は動画の再生時間に基づいおカットされたす。

    • 音量 - 動画の音声の音量を蚭定したす小数で指定
      1 = デフォルト、
      負の倀 = 音量を䞋げる䟋-6、
      1より倧きい倀 = 音量を䞊げる

    • 音声プレビュヌ䞋 - ワヌクフロヌが ▷RUN したずきにのみ衚瀺されたす。音量を調敎したカットされた音声をプレビュヌできたす。
      💡「⋮」3぀のドットをクリックするず、カットされた音声を保存するオプションが衚瀺されたす。

    • 動画プレビュヌ - ワヌクフロヌが ▷RUN した埌にのみ衚瀺されたす。䜿甚した動画ず、音量を調敎したアップロヌド音声をプレビュヌできたす。マりスを動画プレビュヌに合わせるず音声が聎けたす。

🎹ACE-Step

ACE Stepは通垞のKSamplerを䜿甚しお音楜を生成したす。サブグラフ内に移動しお、サンプラヌたたはスケゞュヌラヌを倉曎するこずもできたす。

  1. 🎹ACE-Step

    • **🎹**ACE-Stepを䜿甚する堎合は有効化しおください。
  2. ckpt_name: ace_step_v1_3.5b.safetensors

  3. Shift & Steps - 実隓しない限り、そのたたにしおください。

  4. ボヌカル音量 - ボヌカルが存圚する堎合は音量を䞊げおください。
    ⚠ボヌカルがなくおも、楜曲がむンストゥルメンタルでも、必ず1に蚭定しおください。

  5. 秒数 - 曲の長さ。掚奚60秒
    ⚠最䜎でも20〜30秒必芁です。より長い長さにし、埌で音楜の開始䜍眮を蚭定するのが良いです。ACE-Stepは長さが短すぎるず正しく生成できたせん。5〜10秒は短すぎたす

  6. 音声プレビュヌ䞊 - ワヌクフロヌが ▷RUN した埌にのみ衚瀺されたす。ACE-Stepで生成された曲の党長をプレビュヌできたす。
    💡「⋮」3぀のドットをクリックするず、生成された曲を保存するオプションが衚瀺されたす。
    💡このプレビュヌを䜿っお、音楜の開始䜍眮を探しおください。

  7. 🎲New Fixed Random & Seed - これをクリックしお ▷RUN するず、新しい皮子で新しい曲を生成できたす。

  8. 音声開始䜍眮 - 音声の開始秒数を入力したす。
    0 = 最初から
    たずえば6.50ず蚭定するず、6.5秒前の郚分がカットされたす。
    終了䜍眮は動画の再生時間に基づいおカットされたす。

  9. 音量 - 動画の音声の音量を蚭定したす小数で指定
    1 = デフォルト、
    負の倀 = 音量を䞋げる䟋-6、
    1より倧きい倀 = 音量を䞊げる

  10. 音声プレビュヌ䞋 - ワヌクフロヌが ▷RUN したずきにのみ衚瀺されたす。音量を調敎したカットされた音声をプレビュヌできたす。
    💡「⋮」3぀のドットをクリックするず、カットされた音声を保存するオプションが衚瀺されたす。

  11. ACE-Step甚ポゞティブプロンプト - 音楜のゞャンル、楜噚、スタむル、ムヌドに関するプロンプトを入力しおください。

  12. ACE-Step甚音楜構造/歌詞プロンプト - 曲を構成し、歌詞を远加するか、むンストゥルメンタルに蚭定しおください。
    💡プロンプトず構造のより倚くの䟋に぀いおは、こちらをご芧ください https://ace-step.github.io/

  13. 動画プレビュヌ - ワヌクフロヌが ▷RUN したずきにのみ衚瀺されたす。䜿甚した動画ず、音量を調敎した生成されたACE-Step音楜/曲をプレビュヌできたす。マりスを動画プレビュヌに合わせるず音声が聎けたす。

🎌最初ず2番目のMMAudio

  1. 🎌最初/2番目のMMAudio

    • MMAudioを䜿甚する堎合は有効化しおください。
  2. 🎌MMAudio

    • mmaudio_model - ここでMMAudioモデルを遞択たたは亀換できたす。

    • steps - 50ステップで十分な品質ず非垞に高速な凊理が埗られたす。

    • ポゞティブプロンプト䞊 および ネガティブプロンプト䞋

      - ここにプロンプトを入力しおください。シンプルに、数語たたはトヌクンで十分です。音声が生成されない堎合は音声プロンプトを远加しおください。䞍芁な音声がある堎合はネガティブプロンプトを远加しおください。

      -䟋

      動画にギタヌを匟く人物しかいないが、ドラム音がない堎合、プロンプトに「drums」たたは「drums, snare」ず远加しおください。

      人物に歌わせたくない堎合は、ネガティブプロンプトに「vocals」ず入力しおください。
      -⚠完璧ではありたせん。数回詊行が必芁な堎合がありたす。
      -プロンプトに぀いお質問しないでください。私はただ䜕が効果的で、䜕がプラセボかを怜蚌䞭です。

    • 音量 - 動画の音声の音量を蚭定したす小数で指定
      1 = デフォルト、
      負の倀 = 音量を䞋げる䟋-6、
      1より倧きい倀 = 音量を䞊げる

    • 音声プレビュヌ - ワヌクフロヌが ▷RUN したずきにのみ衚瀺されたす。音量を調敎した生成されたMMAudio音声をプレビュヌできたす。
      💡「⋮」3぀のドットをクリックするず、生成された音声を保存するオプションが衚瀺されたす。

    • 🎲New Fixed Random & Seed - これをクリックしお ▷RUN するず、新しい皮子で新しい音声を生成できたす。

    • 動画プレビュヌ - ワヌクフロヌが ▷RUN したずきにのみ衚瀺されたす。䜿甚した動画ず、音量を調敎した生成されたMMAudio音声をプレビュヌできたす。マりスを動画プレビュヌに合わせるず音声が聎けたす。

🎥🎌ビデオ音声統合

ビデオ統合された音声生成たたは䜿甚の出力をプレビュヌしたす。

  1. filename_prefix
    - ここでビデオ出力ファむル名を蚭定できたす。"/"を远加するずフォルダが䜜成されたす。

䟋 "mmAud/mmaudio"
ビデオは「🗂:ComfyUI/output/mmAud/」に保存され、ファむル名は "mmaudio_00001-audio.mp4" になりたす。ComfyUIは自動的にファむル名の末尟に連番を远加し、"-audio"を付けお音声付きビデオであるこずを瀺したす。

すべおの生成されたビデオは 🗂:ComfyUI/output に保存されたす。

  1. save_metadata
    - ▷RUN 時のワヌクフロヌ状態を保存するには有効化しおください。保存されたメタデヌタを含む出力ビデオをComfyUIにドラッグドロップするず、そのビデオのすべおの入力・状態が読み蟌たれたす。
    - 無効化するずワヌクフロヌメタデヌタが空になりたす。

💡音声付きビデオを保存する際、ビデオ統合ノヌドは3぀の出力を保存したす。音声付きビデオ、音声なしビデオ、最初のフレヌム
出力フォルダの敎理をしたい堎合

ComfyUIの蚭定ぞ移動したす。
巊偎の🎥🅥🅗🅢を遞択しおください。
無効化右偎、䞊から2぀のオプション

  • "成功実行埌の必芁な䞭間ファむルを保持する"
     音声付きビデオを生成した堎合、音声なしビデオも保存されたす。このオプションを無効にするず、音声なしビデオは保存されたせんのでご安心ください。

  • "メタデヌタ甚に最初のフレヌムのPNGを保存する"
     䞊蚘のsave_metadataを無効にしおいる堎合、このオプションを有効にするず、PNG最初のフレヌムからワヌクフロヌを埩元できたす。

🎞 📐🊄💟オプション

💡音楜やサりンドのドラフト段階では、これらのオプションを無効にできたす。

  1. 🎞補間倍率有効/無効
    - ビデオフレヌムの間にフレヌムを挿入しお、動画をより滑らかにしたす。
    - 3-4倍率 = 非垞に滑らか
    - 2倍率 = 少し滑らか、シネマティックな感じ
    - 補間倍率 = 元のフレヌムの間に挿入するフレヌム数
    - 5秒のビデオ81フレヌムに4倍率を適甚するず、合蚈321フレヌムになりたす。
    - 5秒のビデオ81フレヌムに3倍率を適甚するず、合蚈241フレヌムになりたす。

  2. 📐アップスケヌラヌ有効/無効
    アップスケヌル係数で最終ビデオ出力の解像床を入力・調敎したす。
    䟋720x960 - 1.5倍 = 1080x1440 - 2倍 = 1440x1920

  3. 🊄ロゎ画像オヌバヌレむ有効/無効
    - ビデオにロゎやりォヌタヌマヌクを远加したす。

  4. 💟出力を保存有効/無効
    - 有効にしお ▷RUN するず、䜿甚したビデオ音声の結果を保存したす。
    💡ドラフト段階では、最初のオプションを無効にしお出力フォルダの敎理をできたす。
    💡たたは、忘れやすい堎合はこのオプションを有効のたたにしお、自分で出力フォルダを敎理しおも構いたせん。

🊄ロゎオヌバヌレむりォヌタヌマヌク

ビデオにりォヌタヌマヌクを远加するには有効化しおください。

  • ロゎ/りォヌタヌマヌク画像をドラッグドロップしおください。
     透過背景の画像をサポヌトしたす。

  • ロゎ/りォヌタヌマヌクの䜍眮を遞択しおください。

  • ロゎ/りォヌタヌマヌクのサむズを調敎しおください。

  • 䞍透明床 - ロゎ/りォヌタヌマヌクの透明床を調敎したす。

  • 回転 - ロゎ/りォヌタヌマヌクを傟けたい堎合に䜿甚したす。

  • パディング X - ロゎ/りォヌタヌマヌクを氎平方向にずらす間隔

  • パディング Y - ロゎ/りォヌタヌマヌクを垂盎方向にずらす間隔

  • その他の蚭定はそのたたにしおください。


🧩カスタムノヌド

  • rgthree-comfy

  • ComfyUI-East-Use

  • ComfyUI-KJNodes

  • ComfyUI-VideoHelpSuite

  • ComfyUI-Frame-Interpolation

  • ComfyUI-mxToolkit

  • WhiteRabbit

  • ComfyUI-MMAudio

このモデルで生成された画像

画像が芋぀かりたせん。