ChronoEdit

詳細

ファイルをダウンロード

モデル説明

GGUF

現在のところ、一部のノードが安定版にはまだ含まれていないため、ComfyUInightlyバージョンに変更する必要があります。来週までに更新される可能性があります。zipファイル内のワークフローをご参照ください。

FP16: 10GB VRAM + 64GB RAM + Diffusion Model Loader KJ + triton

これは画像編集ツールです。初期画像とテキストの指示を入力すると、その画像を変更したバージョンを出力します。しかし、このツールはWan2.1などの動画モデルの知能を借用し、運動や物理的な挙動などをより正確に処理します。内部的には編集を超短い「動画」として扱い、より現実的な結果を生み出します。これはWan動画モデルと同じテキストエンコーダーやその他のコンポーネントを共有しており、それらを基盤として構築されています

詳細情報 | 例題プロンプト

  • より賢い設定: 時間ベースの編集のための大規模な動画モデルを基盤とし、ロボットの動きや物体の掴みなどの物理的挙動をシミュレートする知能を追加。基本的な画像編集ツールを上回り、現実の動的挙動を処理できます。

  • 魅力的な機能: 静止画像をアクションのシミュレーションに変換。重力や運動などの要素を一貫して保ちます。1024x1024までの正方形または風景/ポートレートサイズを処理可能です。

  • 優れている点: ロボット計画やインタラクティブなシーンといったPhysicalAIタスクに最適。偽の世界データで学習されているため、その分野で特に優れますが、日常的な画像では若干不安定になる可能性があります。

  • 簡単なヒント: 画像に短いテキスト指示(300語以下)を組み合わせてください。例: 「ロボットがボールを現実的に拾うように変更する」。NVIDIA GPUで実行すると高速です。実際の使用ではセーフティチェックを追加してください。

  • 基本仕様: 140億パラメータ、Diffusers形式、商用利用可能なオープンライセンス。入力:画像+テキスト、出力:編集済み画像。追加の手間は一切不要です。

このモデルで生成された画像

画像が見つかりません。