Lab @10 : nude pantyhose, natural pantyhose, with cotton or shiny controlling
詳細
ファイルをダウンロード
モデル説明
イントロ
これは、以前の Lab 1 => 2 => 3 => 4(「おそらく黒いパンティストッキング」の問題を修正しようとした)に続く LoRA ラボです。
しかし、このシリーズにおける私の主な疑問は、「特定の LoRA の品質と効果をどのように継続的に向上させることができるのか?」 です。
以前の LoRA からディスティルした結果、現在の lab_10_4 はまあまあ受け入れられるレベルになりました(ただし、まだ完全に検証されていません。引き続きテストを進めますが、気に入った方はお気軽に試して楽しんでください)。
どのベースモデルを使いますか?
正しいベースモデルに切り替えることを忘れないでください
10-04、10-10、10-11 用:
更新
全般
LoRA ドキュメント(先に中国語 => 次に英語、必要に応じて閲覧)
LoRA documentation (Chinese first => English second, read as needed)
250425
更新をアップロード:OK 10_11、BAD 10_10、データセットと正則化セットを修正
Upload update: OK 10_11, BAD 10_10, fixed dataset & regset
トレーニングのアイデアを提供
Provide training ideas
使用方法
簡単に言うと:
ベージュのパンティストッキングを使用
「肌色感」が足りないと感じたら、やや弱めの [[イエロー パンティストッキング]] を追加(重みは調整してください)
use
beige pantyhoseand maybe somehow add [[yellow pantyhose]] can make it "a bit naturally nude" ( weight should you try around )
LoRA の重みは、0.5~0.6 くらいで十分です
lora 权重,感觉 0.5~0.6 就差不多了
for lora weight, maybe 0.5 ~ 0.6 ( the dataset is to be fixed on next round to make the color more natural )
シアーなゴールデン パンティストッキングを使用し、単独の「ゴールデン パンティストッキング」は避けてください(ゴールデン パンティストッキングのデータ画像はあまり良くなく、色が黄色すぎ、不自然です。ベンチマークからも明らかです)
sheer golden pantyhosemight be used, but never usegolden pantyhosealone! ( it's too strong, as I figure out that the dataset is not that good ... you can see from the benchmark or dataset uploaded )
最適化と発見
まず、04 => 10 => 11 のベンチマークにおける1つの比較を示します。
最初に、04 から 10 から 11 への改善を確認しましょう。
- 04:重みを増加させると、画像の構造が大幅に変化し、多くの問題点が明確に見つけられます

- 10:基本的な構造は良いままですが、悪い正則化セットが画像を乱してしまいます

- 11:示されているように、色が奇妙になっています(データセットの色の問題による)が、画像は安定しています。無意味な問題が減少しています

以下は、今回の LoRA トレーニングで行った改善点を列挙したものです。LoRA をトレーニングしたい方の参考にしてください。
1) (非常に重要)画像品質の問題は細部に存在する可能性がある
以下に2つの比較例を示します。
- 例1:全体と左側(問題あり)の衣料品のピクセルの揺らぎをよく見てください


- 例2:パンティストッキング領域を拡大した場合、左側(問題あり)の色の勾配変化


全体の画面上では大きな問題は見られないようですが、私は画像品質の向上(以下2)のために、次のような方法を以前使用していました:
最初にオリジナル画像を生成
次に img2img と adetailer で 1.5 倍に拡大
その後、プログラムでトレーニングサイズに縮小 <=== ここに問題が発生
画像品質をチェックする際、私はピクセルレベルまで拡大していなかったため、多くのノイズや色の揺らぎに気づかなかったのです。
人間の目には気づきませんが、SDモデルは十分に感知しています。
3回の比較実験の結果も以下に示します:
10_11:データセットと正則化セットを修正
10_10:データセットのみ修正、正則化セットは誤り
10_04:データセットと正則化セットとも誤り
10_04 の場合、重みを上げると画像の構成が劇的に変化し、その変化は無意味であることがわかります…
もし、あなたもプログラム(nodejs sharp 依存)で PNG 処理を行っている場合、以下を参考にしてください:
const sharpInstance = sharp(inputPath)
.resize(
width,
height,
{kernel: sharp.kernel.lanczos3}
)
.png({
quality: 100,
// 0~9 is all lossless compression, 9 is better
compressionLevel: 9,
// @note. ****** very very very important ******
palette: false
});
2) 画像品質のためのテクニック処理
- は1)の原因ではありますが、それでも私はこの方法をお勧めします:
最初、正則化用の画像を取得する際、私はトレーニングサイズで直接画像を生成し、その中から選んでいました。
しかし、後になって、高解像度設定(highres fix)または img2img で拡大することで、画像のマクロ的な品質が明らかに向上することに気づきました。特にキャラクターが小さい場合、以下のような違いが見られます(左は拡大・縮小をしないもの):


そのため、この処理の手順は以下の通りです:
プロンプトに基づいて大量の画像を生成し、その中から合理的で期待通りの画像を選択
img2img および adetailer で拡大
トレーニングサイズに縮小
3) 正則化セット(reg set)の管理
正則化セットの収集も、データセットと同様に時間がかかり、1回のトレーニングではその数がより多く、時間もさらにかかる可能性があります。
しかし、良いニュースは、高品質な正則化セットの多くは、異なるトレーニングで再利用できることです 🤩;一方で、悪いニュースは、その再利用のために管理が大変であることです 😂。
検証の結果、(少なくとも macOS および Linux 環境では)シンボリックリンク方式で、画像などのリソースもトレーニングスクリプトが正常にリソースファイルとして使用できることを確認しました。
そのため、以下の方法を推奨します:
以下の構造のフォルダーを準備:
my_reg_set/
all_images/
1girl/ ...(数百枚の画像、png + キャプション、さらに npz ファイル(潜在キャッシュ?)など)...
1boy/ ...
train_plans/
reg-my-tran-1/
1_1girl/ ...
1_1boy/ ...
AI に、パラメータとして "train:new-test, reg:1girl=200,1boy=100,..." のような形式を受け取るスクリプトを作成させる
このスクリプトは、自動的に reg-new-test を作成し、指定されたカテゴリから指定された数の画像を選択して、その reg-new-test フォルダーにシンボリックリンクを生成します
さらに、必要な正則化画像が既存カテゴリの画像数を超える場合、以下のような処理を自動で追加できます:
例えば 1girl=100 だが、在庫が24枚しかない場合、最終的に以下のように得られます:
4_1girl_full/ ...
1_1girl_rest/ ...(残りの4枚の追加画像)
このプロセスにより、作業がより快適になります。
==== 前のドキュメント ====
使用方法
トリガートークンは?(より良い理解のために)
私のデータセット(後で公開予定)では、以下のトリガートークンを使用しています:
// 色の制御用
golden pantyhose // やや黄色調
- 注意:golden pantyhose はスタイル的に**「強い」**傾向があります
beige pantyhose
// 光沢の制御用
cotton pantyhose
shiny pantyhose
実際の結果は?(LoRA のテスト中に更新し続けるかもしれません)
NOTE:データセットは主に「レッグキング」を描写しており、NSFW傾向があります
- よって、破れや透けが不適切だと感じた場合は、ネガティブプロンプト(または逆に欲しければポジティブプロンプト)で明示的に指定してください
NOTE:重み 0.6~0.8 がより良いと感じました。重みを上げすぎると、LoRA はデータセットから無関係なディテールを導入する傾向があり、時として意味がありません
v3
- 私が期待するヌードパンティストッキングに最も近い効果(かもしれない?)
pos : sheer pantyhose,[yellow pantyhose], beige pantyhose,shiny pantyhose,
neg : torn,[golden pantyhose],
v2
pos: beige pantyhose, cotton pantyhose,
v1
pos: golden pantyhose, shiny pantyhose, sheer pantyhose,
neg: (oily pantyhose),
ポジティブ/ネガティブプロンプトで試せるタグは?
beige pantyhose,
cotton pantyhose,
shiny pantyhose,
oily pantyhose, // 主にネガティブに指定、そうでないと過度に油っぽくなる
golden pantyhose, // 場合によってはネガティブに指定することを検討
< 続く >

