Comfyui, Pose Creator V2 Workflow using TCD Sampler

詳細

ファイルをダウンロード

モデル説明

私の最初のポーズクリエイターと比較すると、以下が違いです:

  1. V2は1ステップのワークフローです

  2. V2は高速で、15ポーズを20分で生成します(ポーズクリエイターは40分かかりました)

  3. V2はHyper-SD LoRA + TCDサンプラーを使用(画像生成時間を短縮)

  4. サンプル画像の品質は最初のポーズクリエイターよりも良くありません(ただし、私には十分です)

TCDのGitHubページ

GitHub - JettHu/ComfyUI-TCD: ComfyUI TCD実装

Hyper-SDのGitHubページ

ByteDance/Hyper-SD at main (huggingface.co)


このワークフローは、ボーンスケルトン、ディープマップ、ラインアートファイルを1ステップで生成することを目的としています。

  1. 良いポーズの画像を持ち、ControlNetでそのポーズを再現したい場合、このモデルはあなた向けに設計されています。

  2. このワークフローは「ハンドリファイナー」プレプロセッサーを使用してポーズを再構築するように設計されており、出力ファイルはほとんどの場合、手の不具合を自動的に修正できます。(元の画像に手の不具合があっても問題ありません)

モデル内容:

  1. Pose Creator V2 ワークフロー(JSON形式)

  2. Pose Creator V2 ワークフロー(PNGファイル)

  3. 出力例 - 4ポーズ

  4. TCD LoRAとHyper-SD LoRA

  5. TCDを使用したT2Iワークフローの例(TCDを試してみてください)

ワークフロー入力:オリジナルのポーズ画像

ワークフロー出力:

  1. ポーズ例画像(私の場合、裸で無毛の女性)

  2. ボーンスケルトン画像(ControlNet OpenPose用)

  3. ディープマップ画像(ControlNet Depth用)

  4. リアリスティックなラインアート画像(ControlNet Lineart用)

  5. サンプル画像(ControlNet OpenPose + Depthで生成された例)

スイッチ付き2つのサブワークフロー:

  1. ポーズRAW画像を取得するための通常のT2I(単純なT2Iワークフロー)

  2. ポーズクリエイター(上記の5つの出力ファイルを生成)

使用方法:

「通常のT2IでポーズRAW画像を取得」ワークフローで、画像出力フォルダを指定してください。

→ そのフォルダは次のワークフローの入力フォルダになります。

「ポーズクリエイター」ワークフローで、画像入力フォルダを指定してください。

「最終処理」ワークフローで、画像出力フォルダを指定してください。

→ 例、ボーンスケルトン、ディープマップ、ラインアート、サンプル画像がすべて保存されます。

出力画像フォルダの例:

K:\SD\comfyui\Creations\RAW

K:\SD\comfyui\Creations\Pose
(私の場合、最終的な例、ボーンスケルトン、ディープマップ、ラインアート、サンプル画像はすべてPoseフォルダに保存されます)

最終出力ファイルの命名形式:(Pose_出力タイプ)、例:

Standing_example

Standing_bone_skeleton

Standing_depth_map

Standing_lineart

Standing_showcase

入出力フォルダと出力ファイル名の設定が終わったら、残るは通常のT2Iパラメータのみです。

また、TCD LoRAまたはHyper-SD LoRAをLoRAフォルダに配置すると、このワークフロー内のLoRAノードが有効になります。

すべての設定が完了したら、ワークフローを実行する準備ができています。

  1. ポーズ画像をお持ちの場合は、それらを「ポーズクリエイター」ワークフロー用に作成した入力フォルダに配置してください。

  2. スイッチで「ポーズクリエイター」を有効にしてください。

  3. 「pose」フォルダ名を変更し、「RAW」フォルダ内のファイルを変更し、「ポーズクリエイター」ワークフロー内のプロンプトを修正すれば、次回の実行の準備ができています。

注意点:

  1. 最初から画像出力フォルダを作成する必要はありません。ワークフローが自動で作成します。

  2. このワークフローはユーザーフレンドリーではありませんが、各ステップは理解しやすく、何よりご自身のニーズに合わせて簡単に変更できます。

  3. 4060ti 16GB + 80GB RAM環境では、15ポーズを約20分で処理します(最初のポーズクリエイターと比較して生成時間は50%削減)。

  4. このワークフローはボーンスケルトンファイルを.json形式で出力できません。

  5. 出力画像に手や他の解剖学的不具合が残る場合は、WebUI(A1111)のOpenPoseエディタ拡張機能をご利用ください。

  6. オリジナルポーズ画像のサイズは異なっていても構いません。たとえば、「RAW」フォルダに512768または768512の画像を配置しても、ワークフローはアスペクト比を変更せずに動作します。

  7. 「ポーズクリエイター」ワークフローでサンプル画像を生成する際は、OpenPoseのみを使用するのが最適です。2つのControlNetユニットを使用すると、被写体の衣装が不自然になる可能性があります。

このモデルで生成された画像

画像が見つかりません。