Yet Another Workflow: easy t2v + i2v (Wan 2.2)

詳細

ファイルをダウンロード

モデル説明

もう一つのワークフロー:簡単なt2v + i2v

私はComfyUIのユーザーに優しいUIを目指しました。複雑さと使いやすさのバランスが重要であり、このワークフローは、何に注目すべきかを明確に示しながら、役立つ制御機能を提供することを目的としています。ComfyUIの品質やUIに関する悩みを抱えている方々にとって、これが役立つことを願っています。色分けや多数の注釈を丁寧に追加しました。注釈を必ずお読みください!役立つように心がけました。

これは私が実際に使っているワークフローであり、スキルレベルを前提としていません。いくつかのUI上の妥協とラベリングを加えることで、初心者でも簡単に操作・調整できるように設計されています。公式の例とは異なり、壊れやすくない、より洗練された体験を提供します。

このワークフローの主な目標は、テキストからビデオ(T2V)や画像からビデオ(I2V)を生成する際、複雑な設定に悩まずに、堅実な出力を得られる基盤を提供することです。デフォルトでLightx2\ningが有効になっています。(これは多様性を犠牲にして生成速度を向上させるアクセラレーターです。)

緑色のコントロールは、通常変更したい項目です。

副次的な目標は、異なるサンプラーと一貫したインターフェースでやり取りできるようにすることです。

バージョン

メインのワークフローは基本的なksamplerノードをサポートしていますが、経験を積んで試してみたい場合、Clownsharkサンプラーを有効にするトグルも含まれています。

バージョンv0.3では、クリーンアップとその他の小幅な改善に加え、TripleKSamplerを導入しました。これは新しいノードを追加し、アクセレーションLoRAを使わずに初期ノイズパターンを生成する、より高度な3サンプラー技術を可能にします。これにより、Vanilla Wanのダイナミクスをより維持した動画が作成可能になります(その代わりに時間が約15~30%かかります)。

別バージョンは継続的に更新していきます。

ComfyとWanに非常に初心者ですか? MoEバージョンの利用を検討してください。これはいくつかのノードを削除し、視覚的複雑さをやや減らして、ほぼ同じインターフェースを提供することで、慣れやすくするためのものです。これに慣れてから、より多くのオプションを持つメインバージョンに進んでください。

より優れたプロンプト準拠性が欲しいですか? WanVideoノードをサポートするバージョンも作成しました。標準バージョンに慣れるまでは、このバージョンの使用はお勧めしません。 視覚的な複雑さが増しています。これらのノードは他のシステムとはまったく異なる動作をしますが、同じインターフェースで使いやすくするための試みです。WanVideoはまったく異なる結果を生み出すため、探索する価値のある興味深い要素です。

気に入りましたか?

使用する際はリソースとしてタグ付けしてください!いいねを押してください! もちろん、広告は必要ありませんが、RunPodクレジットコードをメッセージで送ってくださったら、心より感謝します!

サポートが必要ですか?

私は人々がこのツールに慣れることをサポートするのが好きです。もし助けが必要なら、メッセージをください。詳細を丁寧に説明し、質問に答え、追加のヒントやトリック、スクリプトをお届けします。これまで数名の方々にこうしたサポートをしてきました。お金と労力を節約できます。(このサポートを利用された方は、RunPodクレジットコードをお送りいただけると幸いです。)

また、こちらの記事でも、セットアップ時間を短縮するシェルスクリプトを公開しています。 この記事はv0.3のリリースに伴い、さらに高速化された新しいセットアップスクリプトで更新されています。

全般的なアドバイス

  • 数多くの動画を作成しましょう!動画を公開しましょう!テクニカルなことにこだわらないでください!時間を賢く使ってください。好きな動画を作るよりも、動画がうまく動くかを試すことに時間をかけすぎると、すぐに燃え尽きてしまいます。私がこれらのワークフローを公開する理由はまさにそれです。

  • RunPodを利用してください。L40Sを使用してください。HearmemanのWan 2.2 テンプレートを使いましょう。RunPodをまだ使ったことがない場合は、私のリンクで登録してください。お互いに無料クレジットを獲得できます。

  • 一部のカスタムノードをインストールする必要があります。Comfyのインターフェース上部にある「Manager」ボタンをクリックし、「Install Missing Custom Nodes」をクリックしてください。それぞれのノードについて「Install」をクリックしてください(順番に推奨)。各ノードのインストールが完了するまで待ってください。すべてのノードがインストールされるまで、ComfyUIを再起動しないでください。

  • 線が気になりますか?フローティングUIの右下に、線を非表示にするボタンがあります。

  • Lightx2\ningとは何ですか? これは、Lightx2とLightning(Wan 2.2のバージョン)を指す私の短縮語です。

  • Lightx2\ningを無効にすることも簡単にできますが、その場合、はるかに遅くなりますのでご注意ください。

  • このワークフローは.safetensorsモデル用に構成されていますが、必要に応じてGGUFを使用することも可能です。

  • UIにClownsharkサンプラーが表示されて気になりますか?そのグループを削除しても、問題はありません。(サンプラー選択の紫のミュートノードも削除できます。)

コストは?

興味があるかもしれませんが、例示した動画(720x1280)の生成には約6.5分かかります。(普段は試作や実験ではこの解像度は使用しません。)一般的に、美しく見える動画は2~3分で作成可能です。私は通常、時給約$0.90で動作させています。1時間あたり9~20本の高品質動画が生成できることが多く、つまり1本あたり約$0.045~$0.10(小数点切り上げ)のコストになります(L40S使用時)。(Podの起動コストを含めると、それに1セントほど追加されます。)私の理想的な生成時間は1~2分ですが、その点ではちょっとオーバーしています。しかし、現状の技術において、このバランスが最適だと考えています。より高速なGPUを使えば理想の時間に近づけますが、そのコストは高くつくため、現在の選択が私には最も適切です。

このモデルで生成された画像

画像が見つかりません。