Cartoonishly Eaten - Wan2.1 14b T2V (use VACE for I2V/FLF)
詳細
ファイルをダウンロード
モデル説明
カートゥーン風に食べられた
このLoRAは、被験者や対象物が、突然巨大な口に投げ込まれ、グラフィカルではなく、噛み砕かれて消費されるという、カートゥーン風の「食べられる」概念を導入しています。
食べ手および/または食べられる対象を選択するには、VACEを使用してください。例はそれぞれのモードを順に示しています:2 x first-frame2video、first-last2video、last-frame2video、純粋なtext2video(このモードでは少し再学習されているため、推奨されません)。
生成解像度は、空間寸法で512x512程度を推奨し、推奨再生時間は45ベースフレーム(合計49フレーム、3秒)です。
t2vのトレーニングは、diffusion-pipeを用いて100エポック、フローシフト値4.5で実施されました。
image2video/flf2videoについては、kijai VACEワークフローの使用を推奨し、標準の1.0 LoRA重み、CFG 4.0–6.0、シフト 8.0–16.0 + cfg_zero_starを使用してください。(Comfyの動画メタを参照)
最も効果を発揮するのはカートゥーン風・アニメ風のキャラクターで、現実的なスタイルでは奇妙に見えることがあります。現実的な対象を使用する場合は、追加で既存のカートゥーン風リファレンスを提供することを推奨します。
既知の問題:対象物がガムのように噛まれるが、飲み込まれないことがあります。(「手で内側に押し込む」と追加することで若干軽減できます)
トリガー語は「eat style」です。最適なプロンプトは以下の通りです:
"""
eat style. 動画は[オブジェクト]から始まる。その後、巨大なカートゥーン風の手が下方から[オブジェクト]をつかみ、右側に現れた巨大な口に投げ込む。カメラは後退し、新しい[食べ手]が古い小さな[オブジェクト]を噛み砕き、完全に飲み込む様子が映される。
"""
このLoRAは初心者向けではありません。頑張ってください!
P.S. メタデータが見つからない場合は、オオカミの例ワークフローはこちら:https://gist.github.com/kabachuha/a4b5ed1b46b6d4fb5f9e91d8aae1e482
