PH's Archviz x AI ComfyUI Workflow (FLUX1.TOOLS + CogVideoX)
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
このComfyUI用ワークフローは、建築画像に対して1) 画像生成、2) インペイント、3) アウトペイント、4) 画像から動画生成のすべてのFLUX1.Toolsを統合して使用することを目的としています。他の皆さんにも役立つ可能性があります。このワークフローは、Depth生成から画像を生成(モデルローダー(セクションI)でLoRA/モデルを切り替えたり、Cannyなどにカスタマイズ可能)し、その出力をインペイントまたはアウトペイントした後、最終的にCogVideoXに送信します。ベース画像入力のいくつかの例を含んでいます。
使用方法の動画は以下でご覧いただけます:
変更履歴
v0.55_241219
- CONFIGにimg2video「モード4」を追加。これにより、BASE IMAGE INPUTからVIDEO OUTPUTへの変換が可能に(画像出力をオフにすることをお勧めします)
- CogVideoX CONFIGに「カメラムーブメント選択」を追加。セクションIIの事前定義されたプロンプトが、NimVideoが作成したカメラムーブメントLoRA(下記リンク)でカメラ移動を可能に
- MOTION LORA STRENGTHを追加。最適値は0.6–0.8、場合によっては1.0でも動作。使用リソースに追加
- IMAGE INPUTSをさらに簡素化。Reduxを除くすべてがBASE IMAGE INPUTから利用可能に
v0.5_241213
- インペイントを修正。マスキングによる可視なぼやけが解消され、プレビュー/保存ノードで正しい出力が表示されるようになりました 咳
- IMAGE RESIZE RESOLUTIONの設定を簡素化。デフォルトを1920ピクセルに設定(アスペクト比は維持)
- REDUX STRENGTHをCONFIGから簡単に調整可能に
- LORA STRENGTHをCONFIGから簡単に調整可能に
- 動画出力用の自動アスペクト比を追加。入力に応じてランドスケープまたはポートレートを自動生成
- 動画出力を簡素化。プロセスノードをCOGVIDEOX OUTPUTに統合。rgthreeのFast Bypasserでワンクリックで有効/無効に
- インペイントとアウトペイントの入力を統合し、スペースを節約
- 標準のSAVE IMAGEノードを追加(低品質/LQ:jpg 72 dpi、高品質/HQ:png 300 dpi、メタデータ/ワークフローを含む)
v0.4_241129
- 正しいインペイントを追加。これで、3〜4回のインペイント後も画像が破損しなくなりました
- FLUX1.Reduxをこのワークフローに組み込み(ブラックノード)
- 画像生成用プロンプトを簡単に切り替え可能
- ワークフローを最適化
v0.3_241122
- 初回リリース
このワークフローはVRAMリソースを多く消費します(動画で示されています)。
使用リソース
使用モデル:
チェックポイント
- flux1-dev.safetensors
- flux1-depth-dev.safetensors
- flux1-fill-dev.safetensors
- →(FP8版はhttps://huggingface.co/boricuapabより入手可能)
LoRA
- flux1-depth-dev-lora.safetensors
- pytorch_lora_weights.safetensors (https://huggingface.co/NimVideo/cogvideox1.5-5b-prompt-camera-motion/blob/main/pytorch_lora_weights.safetensors)
CogVideoX
- CogVideoX-5b-1.5-I2V
CLIP
- t5xxl_fp16.safetensors
- clip_l.safetensors
VAE
- ae.safetensors
使用カスタムノード:
- GitHub - ltdrdata/ComfyUI-Manager
- GitHub - rgthree/rgthree-comfy
- GitHub - chrisgoringe/cg-image-picker
- GitHub - kijai/ComfyUI-KJNodes
- GitHub - kijai/ComfyUI-CogVideoXWrapper
- GitHub - yolain/ComfyUI-Easy-Use
FLUXなどはBlackForestLabsからダウンロード
KijaiのCogVideoX1_5i2v(動画関連)+ KJNodes
rgthree-comfy でより快適に
chrisgoringeのcg-image-picker でプレビュー選択
yolainのeasy-use ノード
theUpsiders Logic ノードで一部の自動処理を実現
1920x1440pxの画像と、49フレーム、1360x768pxの動画をインペイント・アウトペイントなしで生成するには、4090で約530秒かかり、VRAMは最大約23GBまで使用されます。したがって、現在のところ高リソース環境でのみ使用可能です。アップデート情報については、私のInstagramをご覧ください。
