FAST MOCHI | Text to Video | Test bench

詳細

ファイルをダウンロード

モデル説明

MOCHI | 高速テストベンチ

このワークフローは、Mochiから可能な限り高速で動画を出力することを目的としています。

私は開発者でもプログラマーでも、問題解決者でも、Pythonの専門家でもありません。私はただ、自分が発見したことを、無料でぜひ皆さんと共有すべきだと考え、ここに共有しているだけです。そのため、何かがうまく動かない場合、私に文句を言わないでください。可能な限りサポートしますが、99%の確率で、私はGoogleを使ってあなたの問題の解決策を探すでしょう。あなたも同じことができます。

V4:

  1. 新しいノードでワークフローを更新しました。V1-2-3は既に古くなりました。旧バージョンはそのまま残しておきますが、CivitAIの仕様が不親切で、プレビューが旧バージョンのタブにしか表示されないためです。

  2. より多くの微調整と制御機能を追加

V3:

  1. 最小フレーム数を7に下げられることを発見したため、さらに制御機能を追加(この場合、CFGを下げてプロンプト強度を上げる必要あり)

    これで、10秒以内に非常に低品質な小さなプレビューを生成できるようになりました!*

  2. 49フレーム未満かつ中程度の設定では、VAEタイル処理は不要であることを発見

    これにより、タイルの重なり問題が自然に解決

  3. 私の環境(3090)で最も高速に動作する最適な組み合わせを発見:

bf16 + clip t5xxl_fp8_e4m3fn_scaled

このモデルに関するDriftjohnson氏の研究に感謝します。 彼のページをご覧ください

  1. 全体的なワークフローの整理

* UIでは、今や7フレームと13フレーム、ステップを20未満に設定できるようになっています。これらの値は、クイックプロンプティング用に意図的に追加されたものであり、最終的な結果を大まかに把握するためのものです。これらの値を増やした場合に、どのような出力になるかを確認するために使用してください。

したがって、これらの値では一貫性のある結果は期待しないでください。あくまで粗い近似値のジャムであり、適切なプロンプトを見つける、シーンを構成する、またはプロンプトの探索をできるだけ迅速に行うために有用です。

適切なプロンプトを見つけたら、ステップとフレーム数を必ず増やしてください!

V2:

  1. 自動プロンプティング用に画像読み込み機能を追加

  2. より高速なテスト用の設定を改善

*同じシードで作業する場合、Florenceのシードもロックするのを忘れずに!気づかず追加しなかったのでごめんなさい😁

*一部のノードがたまに切断・再接続され、別の場所に接続されるバグに悩まされています。これにより、画面の高さ・幅の不一致が発生する可能性があります。原因は不明です。ご報告いただけると助かります。

________________________________________________________________________________________________

これは何についてですか?

私が試した各種設定を、素早く切り替えられる使いやすいUIにまとめたものです。

スライダーにより、私が有用と感じた低解像度/高解像度設定を簡単に切り替えられます。
最低限許容できる画質で短い動画を生成でき、3090では1分30秒で作成可能です(テストやプロンプト探索用)。

もちろん、ステップ数、フレーム数、サイズなど、任意の設定を変更して構いません。

これらは、私が個人的に速度と値の互換性を重視して見つけた、最適な設定です。

このモデルはまだ比較的新しいものです。

黄色で示された「Low Res」バーの値は、クイックテストとプロンプト探索に推奨するものです。これらは、最低画質で最も速く動画を生成するための最適な設定のように見えます。これらの値より下に下げると、Mochiは実用不可能になります。このモデルの可能性を素早く探索することが重要だと考えています。上部のスライダーを黄色の「低解像度」設定に設定することで、最終出力の大まかな様子を把握できます。その後、解像度をさらに高い値へと上げてください。このアプローチは必須です。なぜなら、このモデルは重く、処理が非常に遅いため、低設定でその能力をテストすることが非常に役立ちます。

インストールについては、このガイドに従いました。

このワークフローは、以下のものを改良したバージョンです:/model/886896

このモデルで生成された画像

画像が見つかりません。