TwinkCockFlux_alpha

詳細

ファイルをダウンロード

モデル説明

TwinkCockFlux (alpha43000)

これは私が公開した3つ目の主要なLoRAです。これは、大規模言語モデル(LLM)を活用して効果的なLoRAを生成する方法を学ぶ過程の継続です。

このバージョンは43,000ステップで訓練されました。このステップ数では、LoRAが時折ペニスを生成できなかったり、ややぼやけたりすることがあります。バッチ生成を推奨します。このステップ数を超えると、LoRAは過学習し、プロンプトへの従順性が低下したり、幻視が増加したり、ペニスが美観を損なうほど過剰に描画されたりするようになりました。

このLoRAは、Flux_1.devモデルを用いてペニスを生成するための概念LoRAです。このLoRAの目標は以下の通りです:

  • 切開済みのペニスを生成する
  • 衣服と相互作用する切開済みのペニスを生成する
  • 同じ画像にカテゴリー的に異なるタグを付与することの可能性をテストする

私はこれをアルファ版と位置づけています。TwinkCockXLと同様に、多くの場合機能しますが、完璧ではありません。

このLoRAはTwinkCockXLの基本画像セットを元に訓練されましたが、以下の注目すべき追加要素があります:

  • アジア系、黒人、ラテン系の若い男性の表現を増加。また「ポストトウィンク」の年齢層の男性を追加。ただし、依然として大多数は白人のトウィンクです。このLoRAはTwinkCockXLよりもコンテキスト依存性が高く、年齢に対する感度は低いです。

    • 追加コメント: 追加のテスト結果、髪の色と照明が非白人系の生成と相互作用しているようです。黒または茶色以外の髪色は、アジア系、黒人、ラテン系のキャラクター生成を歪める可能性があります。極度の低照度は、黒人系と南アジア系の生成を混同させる可能性があります。「頭の上に薄い白い光」を追加することでこの問題を修正できるかもしれません。
  • Stable Diffusionの70タグ制限を克服するための異なるタグ付け戦略。各画像は以下の3通りでタグ付けしました:

    • Penis: ペニスの特徴(人種、勃起状態、サイズ、衣服との特別な相互作用)を記述

      • {white,black,latino,asian}; {flaccid, semi-erect, erect}, {small-sized, average-sized, large-sized}
    • Guided: 写真の主な人物(人種、体型、髪の色とスタイル、服装)を記述

    • Generalist: 写真全体の記述(写真の内容、撮影角度、撮影時刻、撮影された時代、使用したカメラ、照明と色調)

  • 「飛翔した精液(Flying Cum)」を「魔法の瞬間」の実験的コンセプトとして追加

主要なアクティベーションタグ「twinkcockFlux」はすべての画像に追加しました。以下のサブコンセプトには、補助タグ(単語タグおよび自然言語フレーズ)も追加しました:

  • "cutbetweenpantsandshirtFlux", "his penis is between his pants and shirt" — シャツと下着(ズボン、ショートパンツ、下着)を着用し、ペニスがその間から見えている男性

  • "cutcockthruflyFlux", "his dick is poking through his fly", "his penis is poking through his fly" — フライから切開済みのペニスが見えている男性

  • "cutcockthrulegholeFlux", "his penis is slipping out of his leghole", "his penis is poking out of his leghole" — 下着のレッグホールから切開済みのペニスが見えている男性(一貫性がなく、ショートパンツと明示する必要がある場合あり)

  • "cutnopantsFlux", "he is not wearing pants" — シャツを着ているがズボンを履いておらず、ペニスが見えている男性

  • "cutnoshirtFlux", "he is not wearing a shirt" — 下着を着ているがシャツを着ておらず、ペニスが見えている男性

  • "cutfullynudeFlux", "he is fully nude" — 何も着用せず、ペニスが見えている男性

  • "cutflyingcumFlux", "He is holding his erect penis and having an orgasm" および "he is holding his erect penis, he is having an orgasm, he is jerking off, he is cumming, he is masturbating" — 「魔法の瞬間」にある切開済みのペニスを持つ男性

ランダム性を望む場合は補助タグの使用は必須ではありません。特定のサブコンセプトを生成したい場合、TwinkCockXLとは異なり、Fluxは単語補助タグと自然言語フレーズの両方を追加することで、プロンプトへの従順性が高まります。補助タグ同士は互いに矛盾しないようにしてください。

cutflyingcumFluxのデータセットは他の補助コンセプトと交差タグ付けされており、明示的に指定されていなくても「予期せぬ射精」が生成されることがあります。この現象がLoRAの欠点か特徴か、私は両方の見解を抱いています。このサブコンセプトの元画像の影響で、座っている姿や自らの勃起ペニスを手で持っている状態のプロンプトはこの生成をより高確率で引き起こします。この補助コンセプトは実験的なものであり一貫性が低いため、強度1.2を推奨します。

サンプラ、スケジューリング、Clipノート:

  • 初期テストはComfy-UIとカスタムワークフローで実施しました。この投稿用のサンプル生成の後期に、ForgeUIがComfy-UIワークフローよりも一貫性の高い生成を実現していることが判明しました。これはComfy-UIワークフローのプログラミング方法に起因する可能性があります。

  • 推奨ガイドアンス範囲は2.8~3.5です。Forge UIでこの投稿の画像サンプルを生成した際、2.8はより現実的な照明とコントラストを生成しますが、ペニスがぼやける傾向があります。3.5は全体的にシャープな画像を生成しますが、高ダイナミックレンジ画像(HDRI)のように過度なコントラストになる傾向があります。

  • サンプラについては、heun、euler、ipndm、deisは類似の結果を出力し、heunとdeisが推奨されます。Comfy-UIのdpm_adaptiveは同じシードから他のサンプラとは異なる生成結果を出すことが多いため、両方または複数の生成(例:XYプロット)を推奨します。Forge UIではdpm_adaptiveは効果的ではありませんでした。

  • Betaが最も一貫性の高いサンプラでした。

  • 38~58ステップが最も一貫性が高いですが、使用するサンプラや他の設定に依存します。

  • テスト用のPerturbed Attention Guidanceは2.60~2.95に設定しました。

  • Max shiftは1.15、base shiftは0.5に設定しました。

  • ハードウェアの制約により、このLoRAの大部分のテストはflux1-dev-Q5_K_Sモデルを使用しました。

  • 元のClip-Lモデルの使用を推奨します。他の微調整されたCLIPモデルを使用すると、品質が低下し、幻視が増加し、プロンプトへの従順性が失われる傾向がありました。

その他の注意点:

  • TwinkCockXLとは異なり、TwinkCockFluxでは年齢層に特化した訓練は行っていません。

  • TwinkCockXLと同様に、このLoRAは「he is wearing a necklace」、「he is wearing airpods」、「there is sunlight across his body」、「he is wearing a baseball cap」などのコンセプトを十分に学習しており、一貫して生成できます。

  • 写真が撮影された時代(例:"shot in the 1970s"、"2020s")を追加しました。この結果、意図せずしてデジタル写真の品質が当時の時代に合わせて劣化する(例:2000年代初頭の低解像度デジタルカメラによるぼやけ)という副作用が生じました。ぼやけが発生した場合は、「shot in the 2020s」または「taken in the 2020s」と明示的に指定してください。

  • 学習開始時に入手可能だった制約により、顔や背景のマスク処理は行っていません。このLoRAは顔の生成に影響し、他のLoRAと相互作用します。

  • 学習データには女性は含まれていません。女性を指定した場合の結果については明確な予測ができませんが、おそらく生成される人物にペニスが追加される可能性が高いです。今後女性を含める予定はありません。源画像が存在しないためです。

  • ペニスが見えないお尻の画像はデータセットに含まれていません。

  • 複数の男性が写った画像が数枚含まれていますが、一貫して高品質な生成を実現するには十分な数ではありません。

  • 正則化画像を使用しましたが、その割合は非常に小さかったです。写実的を超えるスタイルの柔軟性については、広範なテストは行っていません。

このLoRAの生成には約14,800枚の画像(繰り返しと反転を含む)が1024x1024解像度でのみ使用されました。各補助コンセプトの数を均等に保つために繰り返し画像を使用しました。

@markury、@spiritparticle、@wolffur666456、およびBulge Discordサーバー(https://thebulge.xyz)のメンバーの支援、アドバイス、ベータテストに心より感謝します。

このモデルで生成された画像

画像が見つかりません。