Z-Image Turbo Distill Patch for ComfyUI

詳細

ファイルをダウンロード

モデル説明

Z-Image Turbo用のLoRAを作成するのをほぼ諦めかけたところ、この珠玉のモデルに出会った。

このLoRAを提供している他の人は見つからなかった。もし見つかっていれば、そちらを紹介していたはずだ。

ここで投稿したモデルは、ComfyUIで動作するように再調整されている。

例示画像には前後比較を載せているが、これはあくまで簡易的な目安としてのものであり、実際には「クロスウォーク」の問題が「後」の画像で修正されている点を示している。この修正は生成全体に一貫して効果を発揮した。使用したLoRAは重要ではないためここでは言及していないが、パッチLoRAはその目的を果たしているようだ。

これは私が作成したものではない。なぜ必要になったのかも理解していない。しかし、このパッチがなければ、私の多くのLoRAはほぼ無用になってしまう。もしあなたが既に問題に遭遇していないとしても、おそらく他のLoRAでも同様の問題に直面するだろう。このモデルはそれらの問題を解決できる可能性がある。私は重みを1.0として使用している。詳細はモデルのページを参照のこと。

この「パッチ」がなければ、どれほど丁寧に、どれほど長く、どれほど奇妙な手法でLoRAを訓練しても、Z-Imageモデルから欠落しているように見える領域をターゲットにした際に、必ず「ボディホラー」が発生していた。

Apache 2.0ライセンス:

https://modelscope.cn/models/DiffSynth-Studio/Z-Image-Turbo-DistillPatch

更新:

コメント欄で他のユーザーから得られた有用な情報をもとに、提供されている「デディスティル」モデルと比較してテストしたところ、説明通りに動作した。ただし、以前の手法と同等の結果を得ることはできず、手法を変更するほど魅力的ではなかった。また、このモデルは学習中に使用できる可能性があり、標準モデルのアダプト版よりも価値があるかもしれないと理解したが、その使い方を実現できず、解決策を追求する意欲もそれほど高くなかった。

したがって、実質的には、このモデルはすでに内包されている「ターボ」効果を二重に重ねていることになり、これは誤りである可能性がある。私はそれが誤りである可能性を否定しない。実際にそうだったことも、より多くのテストを通じて学んだ。しかし、そのアーチファクトは頻繁に発生するわけではないため、この方法を完全に放棄する気にはなれない。前述したように、アダプトモデルから生じるボディホラーは、このパッチなしではまったく解消されない場合がある。

このモデルで生成された画像

画像が見つかりません。