Lab @10 : nude pantyhose, natural pantyhose, with cotton or shiny controlling

詳細

ファイルをダウンロード

モデル説明

イントロ

これは、以前の Lab 1 => 2 => 3 => 4(「おそらく黒いパンティストッキング」の問題を修正しようとした)に続く LoRA ラボです。

しかし、このシリーズにおける私の主な疑問は、「特定の LoRA の品質と効果をどのように継続的に向上させることができるのか?」 です。

以前の LoRA からディスティルした結果、現在の lab_10_4 はまあまあ受け入れられるレベルになりました(ただし、まだ完全に検証されていません。引き続きテストを進めますが、気に入った方はお気軽に試して楽しんでください)。

どのベースモデルを使いますか?

更新

  • 全般

    • LoRA ドキュメント(先に中国語 => 次に英語、必要に応じて閲覧)

    • LoRA documentation (Chinese first => English second, read as needed)

  • 250425

    • 更新をアップロード:OK 10_11、BAD 10_10、データセットと正則化セットを修正

    • Upload update: OK 10_11, BAD 10_10, fixed dataset & regset

    • トレーニングのアイデアを提供

    • Provide training ideas

使用方法

簡単に言うと:

  • ベージュのパンティストッキングを使用

    • 「肌色感」が足りないと感じたら、やや弱めの [[イエロー パンティストッキング]] を追加(重みは調整してください)

    • use beige pantyhose and maybe somehow add [[yellow pantyhose]] can make it "a bit naturally nude" ( weight should you try around )

  • LoRA の重みは、0.5~0.6 くらいで十分です

  • lora 权重,感觉 0.5~0.6 就差不多了

  • for lora weight, maybe 0.5 ~ 0.6 ( the dataset is to be fixed on next round to make the color more natural )

  • シアーなゴールデン パンティストッキングを使用し、単独の「ゴールデン パンティストッキング」は避けてください(ゴールデン パンティストッキングのデータ画像はあまり良くなく、色が黄色すぎ、不自然です。ベンチマークからも明らかです

  • sheer golden pantyhose might be used, but never use golden pantyhose alone! ( it's too strong, as I figure out that the dataset is not that good ... you can see from the benchmark or dataset uploaded )

最適化と発見

まず、04 => 10 => 11 のベンチマークにおける1つの比較を示します。

最初に、04 から 10 から 11 への改善を確認しましょう。

  • 04:重みを増加させると、画像の構造が大幅に変化し、多くの問題点が明確に見つけられます

  • 10:基本的な構造は良いままですが、悪い正則化セットが画像を乱してしまいます

  • 11:示されているように、色が奇妙になっています(データセットの色の問題による)が、画像は安定しています。無意味な問題が減少しています

以下は、今回の LoRA トレーニングで行った改善点を列挙したものです。LoRA をトレーニングしたい方の参考にしてください。

1) (非常に重要)画像品質の問題は細部に存在する可能性がある

以下に2つの比較例を示します。

  • 例1:全体と左側(問題あり)の衣料品のピクセルの揺らぎをよく見てください

  • 例2:パンティストッキング領域を拡大した場合、左側(問題あり)の色の勾配変化

全体の画面上では大きな問題は見られないようですが、私は画像品質の向上(以下2)のために、次のような方法を以前使用していました:

  • 最初にオリジナル画像を生成

  • 次に img2img と adetailer で 1.5 倍に拡大

  • その後、プログラムでトレーニングサイズに縮小 <=== ここに問題が発生

画像品質をチェックする際、私はピクセルレベルまで拡大していなかったため、多くのノイズや色の揺らぎに気づかなかったのです。

人間の目には気づきませんが、SDモデルは十分に感知しています。

3回の比較実験の結果も以下に示します:

  • 10_11:データセットと正則化セットを修正

  • 10_10:データセットのみ修正、正則化セットは誤り

  • 10_04:データセットと正則化セットとも誤り

10_04 の場合、重みを上げると画像の構成が劇的に変化し、その変化は無意味であることがわかります…

もし、あなたもプログラム(nodejs sharp 依存)で PNG 処理を行っている場合、以下を参考にしてください:

const sharpInstance = sharp(inputPath)
    .resize(
        width,
        height,
        {kernel: sharp.kernel.lanczos3}
    )
    .png({
        quality: 100,
        // 0~9 is all lossless compression, 9 is better
        compressionLevel: 9,
        // @note. ****** very very very important ******
        palette: false
    });

2) 画像品質のためのテクニック処理

  1. は1)の原因ではありますが、それでも私はこの方法をお勧めします:

最初、正則化用の画像を取得する際、私はトレーニングサイズで直接画像を生成し、その中から選んでいました。

しかし、後になって、高解像度設定(highres fix)または img2img で拡大することで、画像のマクロ的な品質が明らかに向上することに気づきました。特にキャラクターが小さい場合、以下のような違いが見られます(左は拡大・縮小をしないもの):

そのため、この処理の手順は以下の通りです:

  • プロンプトに基づいて大量の画像を生成し、その中から合理的で期待通りの画像を選択

  • img2img および adetailer で拡大

  • トレーニングサイズに縮小

3) 正則化セット(reg set)の管理

正則化セットの収集も、データセットと同様に時間がかかり、1回のトレーニングではその数がより多く、時間もさらにかかる可能性があります。

しかし、良いニュースは、高品質な正則化セットの多くは、異なるトレーニングで再利用できることです 🤩;一方で、悪いニュースは、その再利用のために管理が大変であることです 😂。

検証の結果、(少なくとも macOS および Linux 環境では)シンボリックリンク方式で、画像などのリソースもトレーニングスクリプトが正常にリソースファイルとして使用できることを確認しました。

そのため、以下の方法を推奨します:

  • 以下の構造のフォルダーを準備:

    • my_reg_set/

      • all_images/

        • 1girl/ ...(数百枚の画像、png + キャプション、さらに npz ファイル(潜在キャッシュ?)など)...

        • 1boy/ ...

      • train_plans/

        • reg-my-tran-1/

          • 1_1girl/ ...

          • 1_1boy/ ...

  • AI に、パラメータとして "train:new-test, reg:1girl=200,1boy=100,..." のような形式を受け取るスクリプトを作成させる

    • このスクリプトは、自動的に reg-new-test を作成し、指定されたカテゴリから指定された数の画像を選択して、その reg-new-test フォルダーにシンボリックリンクを生成します

    • さらに、必要な正則化画像が既存カテゴリの画像数を超える場合、以下のような処理を自動で追加できます:

      • 例えば 1girl=100 だが、在庫が24枚しかない場合、最終的に以下のように得られます:

      • 4_1girl_full/ ...

      • 1_1girl_rest/ ...(残りの4枚の追加画像)

このプロセスにより、作業がより快適になります。

==== 前のドキュメント ====

使用方法

トリガートークンは?(より良い理解のために)

  • 私のデータセット(後で公開予定)では、以下のトリガートークンを使用しています:

    • // 色の制御用

    • golden pantyhose // やや黄色調

      • 注意:golden pantyhose はスタイル的に**「強い」**傾向があります
    • beige pantyhose

    • // 光沢の制御用

    • cotton pantyhose

    • shiny pantyhose

実際の結果は?(LoRA のテスト中に更新し続けるかもしれません)

  • NOTE:データセットは主に「レッグキング」を描写しており、NSFW傾向があります

    • よって、破れや透けが不適切だと感じた場合は、ネガティブプロンプト(または逆に欲しければポジティブプロンプト)で明示的に指定してください
  • NOTE:重み 0.6~0.8 がより良いと感じました。重みを上げすぎると、LoRA はデータセットから無関係なディテールを導入する傾向があり、時として意味がありません

v3

  • 私が期待するヌードパンティストッキングに最も近い効果(かもしれない?)
pos : sheer pantyhose,[yellow pantyhose], beige pantyhose,shiny pantyhose,

neg : torn,[golden pantyhose],

v2

pos: beige pantyhose, cotton pantyhose,

v1

pos: golden pantyhose, shiny pantyhose, sheer pantyhose,

neg: (oily pantyhose),

ポジティブ/ネガティブプロンプトで試せるタグは?

beige pantyhose,
cotton pantyhose,
shiny pantyhose,
oily pantyhose, // 主にネガティブに指定、そうでないと過度に油っぽくなる
golden pantyhose, // 場合によってはネガティブに指定することを検討

< 続く >

このモデルで生成された画像

画像が見つかりません。