Geeky Ghost AI Voice Assistant Workflow

詳細

ファイルをダウンロード

モデル説明

最新:v4.20(4.2とは混同しないでください。単に4.2を超えたくなかっただけです、すみませんlol)画像を複製するためのAny Nodeを追加。大きな変更ではありませんが、これでwav2lipのシングル画像バージョンが完成しました。つまり、wav2lip動画を作成するにはAny Nodeのおかげで1枚の画像だけで十分です。他の方法もありますが、これはテストであり、うまくいったのでなぜ使わないでしょうか。シングルイメージバージョン。

最良のバージョン - v4.2 - ワークフローにwav2lipを追加しました。誰かが動作するノードを作成していたので、これで動画を読み込み、Whisperがアシスタントの声を生成し、音声付きのアニメーションアバターが可能になりました。楽しいワークフローで、組み立てるのも楽しかったですlol。LLMプロファイルを編集し、本来の用途ではない場所にさまざまなコネクターを接続しています。このワークフロー内で良好な音声を得られるのは「Play sound (loop)」ノードだけです。パスを入力に変換し、WhisperのWAV出力をPlay soundの入力として使用する必要があります。これにより、声が再生され、聞こえるようになります。

その後、アップロードした動画と合わせてwav2lipに送信して動画を生成します。ノードは動作しますが、ForgeやAutoほど良くはありません。しかし、ノード作成者は素晴らしい仕事をしました。ここからさらに向上するしかないし、今のところ悪くないですよlol。

以前のバージョン-------------

音声をwav2lipとSadTalkerに通して楽しさを試し、以前作成したキャラクターの顔をダーウィンに使いましたlol。

さらにグループと説明ノートを追加。

テキストまたは音声を通じたAIアシスタント。

インペインティングとアウトペインティング

SVD、Cascade、AnimateDiff

スプライトシート作成ツール

.OGGオーディオファイルをトレーニングデータとして使用した音声生成(Whisper to Speech:ボーカルのみのオーディオ、3分ほどで十分ですが、例示の10分の方がより良い)

私のレイヤリンググループノード設定を追加

音声アシスタント用テストワークフロー。Rosebud AIワークフロー用にいくつかのノードを試しています。ダーウィンはカスタムパーソナリティのため、含んでいません。

Ollamaのインストールと実行が必要

Impact FramesまたはIFノードによりこれが可能になります

作業中

このモデルで生成された画像

画像が見つかりません。