(SDXL & SD 1.5) Simple pointed toe stiletto heels without ankle strap (尖头高跟鞋)
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
要求に従って訓練済み。SDXLではあまり必要ではないが、既にこの種の靴を生成できるため、先端が尖ったハイヒールの形状を一貫してよりシャープに保つことを目指している。
SDXL V1.0
基底モデル:SDXL 1.0
重み:0.5〜1.0。アニメ系チェックポイントでは、さらに高い重み(最大1.3)を必要とする場合がある。
SD 1.5
SDは、明確にネガティブプロンプトに含んでいるにもかかわらず、常にストラップ付きまたはプラットフォームヒールを生成してしまうように思われる。このシンプルなLoRAは、重みが0.4以上になると、先端が尖ったハイヒールから足首のストラップを除去する可能性がある。私がテストした限りでは、リアリスティックチェックポイントでは0.4〜0.8が適切な結果をもたらす。
SDは、ネガティブプロンプトで禁止しても、常に足首のストラップ付きハイヒールを生成してしまう。このLoRAは、ストラップを除去するだけでなく、靴の形状も微調整している。使用時は0.4〜0.8の重みが適切で、0.4から徐々に重みを上げるのがおすすめ。0.8以上にすると汎化性能が悪くなり、色も次第に黒に固定される。リアリスティック系のチェックポイントでは再現性が良好だが、アニメ系でも使用可能だが、やや歪みが出る。また、ストラップを除去するには重みを高めに設定する必要がある。
足のポーズを生成するためのヒント:
シンプルな足のポーズの場合、プロンプトとOpenPoseのみを使用すれば十分。このLoRAはそのようなポーズをそれなりにうまく生成できる。
より複雑なポーズの場合は、現在のSDでは難しく、多数の変異した手足が生成され、ハイヒールの形状も歪んでしまうことが多い。この問題に対処するには、ControlNetでエッジ検出(Canny、Softedge、Scribbleなど)を使用して、全体のポーズとハイヒールの形状を固定することが有効である。
まず、理想の足のポーズをハイヒールを履いた状態で参考画像として用意し、ControlNetに入力する。
エッジ検出として「Softedge」を選択し、画像のControlNetプレビューを作成。ハイヒールの輪郭が正しく検出されているか確認する。もし不十分であれば「Canny」に切り替える。Cannyによる輪郭はSoftedgeより明確になる。
ControlNetの重みを0.5〜1.0の間で設定。重みが低いほど背景や服の変更がしやすく、重みが高いほどポーズやハイヒールの形状の再現性が向上する。
参考画像とかけ離れた服を描きたい場合、「Scribble」を使用するとよい。出力の自由度が高まるが、他2つの手法に比べたハイヒールの形状の再現性はやや劣る。
上記3つのエッジ検出方法すべてで満足のいかない結果が出た場合、ControlNetのプレビューを手動で修正して輪郭を明確にし、不要な内容を除去することが有効。非常に簡単で、Windowsに標準搭載されているペイントソフトでも対応可能。不要な部分を黒で塗りつぶし、望む形状の輪郭を白で描くだけ。
足のポーズを描くためのテクニック:
シンプルなポーズの場合、プロンプトまたはControlNetのOpenPoseで十分。このLoRAは基本的な動きをうまく生成できる。
複雑なポーズの場合は、現在のSDではまだ実用レベルに達していない。多くの場合、複数の手足や複数の脚が生成され、ハイヒールの形状も歪んでしまう。このような問題に対処するには、ControlNetでエッジ検出(Canny、Softedge、Scribble)を用いて、全体のポーズとハイヒールの形状を制御することが推奨される。NormalやDepthも使えるが、ハイヒールのエッジ検出においては前述の3つの手法の方が優れている。
まず、望むポーズでハイヒールを履いた参考画像をControlNetに入力。
ControlNetで「Softedge」を指定し、プレビュー画像を生成。ハイヒールの輪郭が正しく検出されているか確認。検出が不完全なら「Canny」に切り替える。Cannyの輪郭はSoftedgeよりはっきりしている。
ControlNetの重みを0.5〜1.0の範囲で設定。重みが低いほど背景や服の変更が簡単になるが、重みが高いほどポーズとヒールの形状の再現性が高まる。設定後、プロンプトを入力して画像を生成。
希望する服のスタイルが参考画像と大きく異る場合は「Scribble」が有効。AIに描画の余地を多く与えるが、輪郭の再現性は他の二つに比べて劣る。
上記3つのエッジ検出法すべてで望むポーズが得られない場合は、参考画像の背景が複雑すぎる可能性が高い。この場合、手動でControlNetプレビューを修正して、不要な背景を黒で塗りつぶし、望む輪郭を白で描く。非常に簡単な作業であり、Windows付属のペイントツールでも完結可能。
テストの結果、Softedgeがハイヒールの形状検出において最も優れており、服を変更する際の汎用性も高い。したがって、エッジ検出ではまずSoftedgeを使うのが最適。
V2.1
正則化およびトレーニングデータセットを拡張
ネットワークの次元を128に設定
正則化を伴う場合、事前損失の重みをわずかに増加
V2.0
トレーニングデータセットを再設計および拡張。背景や顔など不要な要素をすべて除去したため、重みが高い場合でも、顔や背景にかかわりにくくなる。
DreamBooth用の正則化トレーニングデータセットを追加。ハイヒールのサイズと接合場所の再現性が向上した。
推奨重み:0.3〜0.9。テスト画像では0.5〜0.6を使用。
重みを低く設定した場合、多くの衣装LoRAとの併用が可能。
靴底が上を向く姿勢ではあまりうまく動作しない。これはベースモデルの問題だと考えられる。私がこのモデルを無効にした場合、同様に上手くいかないため、ベースモデルがこれらの姿勢の訓練を十分に受けていない可能性がある。















