LTX Video RTX3060 12GB VRAM

詳細

ファイルをダウンロード

モデル説明

このワークフローはStability Matrixアプリで使用するためアップロードしています。YouTube動画:

このモデルがどのように動作するのか、私は全く知識がありません。これはSDXLではなく、DIT Fluxです。現在、RAMが12GBしかないため、より良い結果をまだ示せていません。ステップ数を増やし、解像度を上げれば改善するかもしれません。

現在は28GBのRAMを所有していますが、LTXは非常に劣悪です。Geminiにプロンプトの説明を依頼してみてください。私は以下のプロンプトで試しました:
あなたのタスクは、静止した瞬間から現実的に展開しうる自然な視覚的アクションやカメラの動きを想像し、シーンの次の3秒を撮影するかのように描写することです。音、音楽、内面的な思考、会話は一切含めず、視覚的な物語にのみ焦点を当ててください。
キャラクターの視覚的なポーズ、視線、姿勢、手の位置、表情に基づいて、論理的で表現力のあるアクションやジェスチャーを推論してください。たとえば:
- キャラクターの両手が顔の近くにある場合、何かを取り除いたり、示したりする様子を想像してください。
- 2人が近くにいて向かい合っている場合、触れ合う、微笑む、または近づくなどのつながりを示すジェスチャーを想像してください。
- キャラクターが集中しているか、探しているように見える場合、上を見上げる、頭を動かす、またはフレーム外にある何かとやりとりする様子を想像してください。
これらを推論した動きを、映画撮影監督のように正確かつ明確に描写してください。常に単一の映像的段落で書きなさい。
可能な限り詳細に描写し、被写体の外見やシーン・設定の繊細な細部に注目してください。
以下の構造に従ってください:
- 最初の明確な動きやカメラの指示から始めます。
- ジェスチャー、ボディランゲージ、表情、身体的相互作用を積み重ねます。
- 環境、構図、雰囲気を詳細に描写します。
この文の後に追加のユーザー指示がある場合は、それらをプロンプト作成の参考にしてください。
例:女性は重さを後ろに移動させ、膝の軽い曲げから始まる、ゆっくりと制御された動きをとる。彼女は完全に立ち上がることなく、体を数インチだけ下げ、重さをかかとに乗せる。胴体はまっすぐに保たれ、下降中に整った姿勢を維持する。動きの最低点で、体が安定し、腰の柔らかなカーブがより明確に浮かび上がる。彼女はこの低い姿勢を一瞬保った後、滑らかに膝をつく姿勢へと移行し、膝を床に着けることで体を優雅に展開させる。カメラは中距離ショットのまま固定され、体全体の動きを捉え、彼女が身体に持つ優雅なコントロールを強調する。
それ以外の場合は、入力画像の分析にのみ集中してください。

画像を添付して送信する場合、そのアクションの実行方法と終了方法を簡潔に説明してください。それ以外の場合は、SDXLまたはFluxで対応可能な自然言語を用いて、正確かつ簡潔に記述してください。

10ステップ、CRF 18、20フレーム、シード45〜52の間で、これよりましになった。

このモデルで生成された画像

画像が見つかりません。