facialized

詳細

ファイルをダウンロード

モデル説明

facialized:女性の顔面に向けた新しいLoRA

女性の顔面に精液がついた、写実的な画像を生成するためのLoRA。

プロンプトに <lora:facialized:1>, cum, facial を含めてください。ネガティブプロンプトに breasts on cum, body on cum を含めることをおすすめします。

このモデルは、低ステップ数と低CFG値で最も効果的に動作します。10ステップとCFG 3〜4で良好な結果を得ています。

このLoRAの改善に向けたアドバイスや支援を募集しています。 興味がある方は、この説明の最後に記載されたメールアドレスまでご連絡ください。

以下にトレーニング手法を説明します。

モデルに関する既知の問題

一部のコメントで指摘されている通り、このモデルはまだ完璧ではありません。私が見つけたいくつかの問題と、可能な回避法を以下に示します。

トレーニングデータセットに含まれるタグを、それらの問題を回避する際のヒントとして紹介します。形式は 問題のタグ [2676枚中の画像枚数] です。たとえば smiling at camera [486] は、データセット全体(2676枚)のうち486枚に smiling at camera というタグが付いていることを意味します。

キャミソールや体に付く精液

多くの生成画像では、女性の体や胴体、乳房に精液が付いている状態が描かれます。現在のところ、精液が顔以外に現れるのを完全に除去することは難しいです。

以下のタグがこの問題の回避に役立つ可能性があります。

  • cum on breasts [195]
  • cum on body [472]
  • cum on clothes [10]

眼の不具合

モデルが非対称な目や正常でない目の顔を生成する場合があります。以下のタグを使用して、そのような状態を軽減する試みができます。

  • symmetric eyes
  • same color eyes
  • bad eyes(ネガティブプロンプト)
  • strange eyes(ネガティブプロンプト)

これらはトレーニングデータに含まれていないタグですが、底にあるStable Diffusionチェックポイントが正しい顔を生成するのを助けます。

トレーニング手法の詳細

免責事項:これは私が初めて作成するLoRAであり、改善に関するご意見は常に欢迎です!以下に私の手法を詳しく説明します。改善方法についてご提案がある方は、気軽にコメントしてください。

データセット

全データセットは1つのソースから手作業で選別した2676枚の画像で構成されています。品質は極めてばらつきがありますが、ほぼすべての画像が顔面に精液がついた個別の女性を描写しています。少数の外れ値(約10枚)では2人の女性が描写されています。

画像のサイズは非常にバラバラです。以下に、10枚以上ある解像度ごとの画像数の統計を示します(全データセットでは1454個の異なる解像度があります)。

    154 3024x4032
     98 1536x2048
     96 2316x3088
     51 960x1280
     46 750x1000
     36 768x1024
     27 853x1280
     25 510x680
     25 1920x1080
     22 1080x1920
     20 1000x1333
     19 1280x960
     17 1024x768
     14 1280x1707
     14 1000x750
     13 854x1280
     13 2268x4032
     13 1200x1600
     12 2448x3264
     11 1280x1920
     11 1067x1600
     11 1024x1365
     10 600x800
     10 2000x2666

フィルタリングとタグ付け

データセットのフィルタリングには https://colab.research.google.com/github/hollowstrawberry/kohya-colab/blob/main/Dataset_Maker.ipynb を使用しました。重複画像はFiftyOne AIを使用し、類似度閾値0.985で検出しました。

タグ付けは、ローカルでstable-diffusion-uiの stable-diffusion-webui-wd14-tagger 拡張機能で実施しました。重複タグは削除され、wd14-vit-v2-gitインターオゲーターを0.35の閾値で使用しました。さらに、"facial", "cum", "1girl", "1women", "face", "sperm" のタグを追加しました。

以下は、データセット内で20枚以上に出現するタグの一覧です。これらのタグは主に自動タグ付けプロセス(上記のように)から得られたものです。

                    1girl  2676
                   1women  2676
                      cum  2676
                     face  2676
                   facial  2676
                    sperm  2676
                realistic  2631
                     lips  2192
                     solo  2160
        looking at viewer  1459
                  breasts  1262
                long hair  1085
               brown hair  1031
                     nude  1011
               black hair   997
                    smile   946
                  nipples   885
                  jewelry   883
              closed eyes   804
              blonde hair   718
               brown eyes   706
               open mouth   663
                 freckles   592
                     1boy   554
                    teeth   539
                   hetero   513
               solo focus   496
           medium breasts   496
                   tongue   494
                 earrings   486
                    penis   479
              cum on body   472
                 necklace   449
               upper body   334
               tongue out   328
               uncensored   328
            small breasts   325
                     nose   298
                  indoors   290
            large breasts   279
                blue eyes   262
                     grin   255
                     mole   253
                   blurry   253
               short hair   246
              cum on hair   242
                 piercing   234
             cum in mouth   228
               from above   227
                 cleavage   224
             closed mouth   212
                   tattoo   209
                   makeup   201
           cum on breasts   195
                 forehead   185
                underwear   177
                    shirt   171
                 portrait   171
                  sitting   165
                 erection   163
                  glasses   141
                    navel   138
               looking up   136
               black eyes   127
                    lying   126
              parted lips   124
                      bra   119
                      pov   119
                     oral   118
                 fellatio   111
                 kneeling   110
                      bed   106
               male focus   103
        blurry background    96
            multiple boys    95
           mole on breast    89
                  handjob    86
                  on back    84
                  topless    84
                     ring    83
                  bukkake    82
              nail polish    81
               green eyes    78
               pubic hair    75
                   choker    73
           one eye closed    73
                   collar    73
          nipple piercing    73
         photo background    68
                    2boys    67
                eyelashes    64
            hoop earrings    63
          male pubic hair    62
                dark skin    59
            cum on tongue    57
         multiple penises    56
               downblouse    56
                 close-up    55
               thighhighs    55
                     what    55
                twintails    53
                  panties    52
                 outdoors    52
                testicles    52
        multicolored hair    52
                 censored    52
               flat chest    49
                 red hair    48
                 barefoot    48
                   pillow    48
                 tank top    47
                 bracelet    46
                group sex    44
                   selfie    44
                      wet    43
           bare shoulders    43
                    tears    43
             clothes lift    42
               collarbone    41
                watermark    41
          completely nude    41
                     bdsm    39
                 lingerie    38
         half-closed eyes    37
                    bangs    37
               shirt lift    36
                    bound    34
                    braid    34
            hair ornament    33
              black shirt    32
                    veins    32
                  cosplay    31
           depth of field    31
                 swimsuit    31
              white shirt    31
                    pants    30
          oral invitation    30
                    denim    29
                  bondage    29
                   saliva    28
                 fishnets    28
                    leash    28
                black bra    27
                 ponytail    27
          tongue piercing    27
                      tan    27
      dark-skinned female    27
                head tilt    27
             open clothes    27
                   window    27
             ear piercing    27
           multiple girls    26
                 lipstick    26
            breasts apart    26
              artist name    26
             body writing    26
           after fellatio    25
                 tanlines    25
                    couch    25
                    skirt    25
        simple background    24
               curly hair    24
                eyeshadow    24
            nose piercing    24
                   bikini    24
              ejaculation    24
                    heart    23
                 bathroom    23
                 sleeping    23
              breasts out    22
                grey eyes    22
                    plant    22
              twin braids    22
           navel piercing    22
     black-framed eyewear    21
                  sweater    21
                   2girls    21
                    watch    21

トレーニング

LoRAのトレーニングには https://colab.research.google.com/github/hollowstrawberry/kohya-colab/blob/main/Lora_Trainer.ipynb を使用しました。トレーニングモデルは sd-v1-5-pruned-noema-fp16.safetensors を使用しました。タグは自動的にシャッフルされ、アクティベーションタグ(activation_tags を0に設定)は使用していません。

データセットのサイズのため、各画像は1回のみ(重複なし)使用しました。5エポック、バッチサイズ2で学習しました。UNetの学習率は 5e-4 に設定しました。LoRAのネットワークリンクの次元は32、ネットワークalphaは16に設定しました。

他の試みに関する補足

「良い」と感じられる画像のみを手動で選別する試みも行いました:

  • 解像度・品質が十分高いこと
  • 体に精液がついていないこと
  • 「かわいい」女性(私の好みによる)

このようにしてデータセットを1170枚に絞り込み、LoRAを再トレーニングしましたが、その結果、モデルの性能は明らかに劣化していました。むしろ、このモデルでは生成画像に精液を付けることさえ難しくなっていました。

異なるLoRAネットワーク次元とalpha次元((16, 8)(32, 16)(64, 32))を試しましたが、最も効果的なのは (32, 16) でした。

コラボレーションのお願い

このモデルのv0.2、あるいはv1の開発に協力したい方は、以下のアドレスまで、「プロジェクトに何を貢献できるか」を明記してご連絡ください。

アドレスは、角括弧内の部分を置き換え、スペースを削除してください。

[my pseudo here in civitai] [dot] dev [at] protonmail.com

このモデルで生成された画像

画像が見つかりません。