PH's Archviz x AI ComfyUI Workflow (FLUX1.TOOLS + CogVideoX)

このComfyUI用ワークフローは、建築画像に対して1) 画像生成、2) インペイント、3) アウトペイント、4) 画像から動画生成のすべてのFLUX1.Toolsを統合して使用することを目的としています。他の皆さんにも役立つ可能性があります。このワークフローは、Depth生成から画像を生成（モデルローダー（セクションI）でLoRA/モデルを切り替えたり、Cannyなどにカスタマイズ可能）し、その出力をインペイントまたはアウトペイントした後、最終的にCogVideoXに送信します。ベース画像入力のいくつかの例を含んでいます。

使用方法の動画は以下でご覧いただけます：

変更履歴

v0.55_241219

CONFIGにimg2video「モード4」を追加。これにより、BASE IMAGE INPUTからVIDEO OUTPUTへの変換が可能に（画像出力をオフにすることをお勧めします）
CogVideoX CONFIGに「カメラムーブメント選択」を追加。セクションIIの事前定義されたプロンプトが、NimVideoが作成したカメラムーブメントLoRA（下記リンク）でカメラ移動を可能に
MOTION LORA STRENGTHを追加。最適値は0.6–0.8、場合によっては1.0でも動作。使用リソースに追加
IMAGE INPUTSをさらに簡素化。Reduxを除くすべてがBASE IMAGE INPUTから利用可能に

v0.5_241213

インペイントを修正。マスキングによる可視なぼやけが解消され、プレビュー/保存ノードで正しい出力が表示されるようになりました咳
IMAGE RESIZE RESOLUTIONの設定を簡素化。デフォルトを1920ピクセルに設定（アスペクト比は維持）
REDUX STRENGTHをCONFIGから簡単に調整可能に
LORA STRENGTHをCONFIGから簡単に調整可能に
動画出力用の自動アスペクト比を追加。入力に応じてランドスケープまたはポートレートを自動生成
動画出力を簡素化。プロセスノードをCOGVIDEOX OUTPUTに統合。rgthreeのFast Bypasserでワンクリックで有効/無効に
インペイントとアウトペイントの入力を統合し、スペースを節約
標準のSAVE IMAGEノードを追加（低品質/LQ：jpg 72 dpi、高品質/HQ：png 300 dpi、メタデータ/ワークフローを含む）

v0.4_241129

正しいインペイントを追加。これで、3〜4回のインペイント後も画像が破損しなくなりました
FLUX1.Reduxをこのワークフローに組み込み（ブラックノード）
画像生成用プロンプトを簡単に切り替え可能
ワークフローを最適化

v0.3_241122

初回リリース

このワークフローはVRAMリソースを多く消費します（動画で示されています）。

使用リソース

使用モデル：

チェックポイント

flux1-dev.safetensors
flux1-depth-dev.safetensors
flux1-fill-dev.safetensors
→（FP8版はhttps://huggingface.co/boricuapabより入手可能）

LoRA

flux1-depth-dev-lora.safetensors
pytorch_lora_weights.safetensors (https://huggingface.co/NimVideo/cogvideox1.5-5b-prompt-camera-motion/blob/main/pytorch_lora_weights.safetensors)

CogVideoX

CogVideoX-5b-1.5-I2V

CLIP

t5xxl_fp16.safetensors
clip_l.safetensors

VAE

ae.safetensors

使用カスタムノード：

GitHub - ltdrdata/ComfyUI-Manager
GitHub - rgthree/rgthree-comfy
GitHub - chrisgoringe/cg-image-picker
GitHub - kijai/ComfyUI-KJNodes
GitHub - kijai/ComfyUI-CogVideoXWrapper
GitHub - yolain/ComfyUI-Easy-Use

FLUXなどはBlackForestLabsからダウンロード

KijaiのCogVideoX1_5i2v（動画関連）＋ KJNodes

rgthree-comfy でより快適に

chrisgoringeのcg-image-picker でプレビュー選択

yolainのeasy-use ノード

theUpsiders Logic ノードで一部の自動処理を実現

1920x1440pxの画像と、49フレーム、1360x768pxの動画をインペイント・アウトペイントなしで生成するには、4090で約530秒かかり、VRAMは最大約23GBまで使用されます。したがって、現在のところ高リソース環境でのみ使用可能です。アップデート情報については、私のInstagramをご覧ください。

モデルタイプ	ワークフロー
ベースモデル	Flux.1 D
公開日	12/19/2024

PH's Archviz x AI ComfyUI Workflow (FLUX1.TOOLS + CogVideoX)

詳細

ファイルをダウンロード

このバージョンについて

モデル説明

このモデルで生成された画像