Cartunafied

詳細

ファイルをダウンロード

モデル説明

  • 「我々は巨人の肩の上に座るドワーフのようである。私たちが彼らよりも遠く、そして多くを見ているのは、私たちの視力が優れているからでも、私たちの方が背が高いからでもない。彼らが私たちを高く持ち上げ、彼らの偉大さによって私たちの視界を広げているからである。」 - ジョン・オブ・サリスベリー

  • 本スペースの提供に感謝します。貴重なコミュニティの皆様、より高い完美を目指す人々へ。


V4 ノート:

  • 「Tuna v3」をベースに、マージドブロックウェイト(MBW)を用い、膨大な試行錯誤を重ねました。設定マニアの皆さん、申し訳ありませんが、本当に詳しく説明するのは難しいです。A1111用のSuperMerger拡張を使用しており、MBWの仕組みを学ぶには非常に推奨します。特にストレージを大量に使いすぎない点が魅力です。

  • UmiAIの開発者およびチームのモデルミキサーの協力に感謝します(以前のノートで既にリンク済み)。本マージで使用したすべてのモデルはすでにリンク済みであり、一部は更新版も含まれ、あるいは明示的な許可を得た非公開モデルが含まれています。

  • では、何が変わったのか? コンポジションは若干クールで、プロンプトへの反応性も向上しています。短いフレーズやキーワードリストの混合推奨です。特にネガティブな表現にあまり飛び込まないよう注意してください。手の描写はやや改善されています。目の特徴や顔のディテールは、ややアニメ顔ではなく、より独自のスタイルを意識した表現になっています。衣装などの内部エレメント、特に影や照明の表現がより詳細化されています。使用語彙も大幅に拡張されています。

  • 慣れていたスタイル性を維持しつつ、最小限の柔軟性の喪失で意図したバイアスを達成しました。明示的なプロンプトがない場合には、白人の肌色の女性を中心に、一部のヌード表現、そして西側と東側のアニメ・コマースの良い点を融合した濃い輪郭表現をデフォルトとして行います。


V3 ノート:

  • v3:「ああ、私の啓示よ、ついにあなたを見つけた。」 多様な肌色、圧倒的な背景描写と細部表現、信頼性の高い手の描写、洗練された性器描写。さらにプロンプトへの反応性が向上し、v2と同様のLorasの影響力を一定程度受け入れます。

  • v2:より詳細な描写が追加され、手の描画やキーワードへの反応性が改善されたが、Lorasの影響は減少し、依然として「裸の白人女性」に傾く傾向がある。

  • fp16(実質v1):シンプルで洗練されたスタイル。詳細は少なめ。Lorasなどが非常に強く影響する。基本的な線画イラストには最適で、「2.5D的」なスタイルも依然対応可能。手の描写には不向きで、白人の裸体女性に傾きやすい。


このモデルは、さまざまな割合で4~8種類の「コマーシャル風」スタイルモデルをマージし、より多様な「西洋アニメ」的スタイリングを実現しながらも、プロンプトやコンセプトへの高い反応性を確保しました。ダンボルータグを含む、あらゆるスタイルのプロンプトを利用可能。文法ミスのあるフレーズ、詩、思いつきの羅列など、思いっきり使ってください。多様なコンセプトを認識可能。シンプルに、あるいは複雑に。私にとってはそれが魅力なのです。 そして女性……私は女性が好きです。

  • 本モデルにVAEは内蔵されていません。標準のStable Diffusion VAE、Clear VAE、または私が作成したAnime VAEのいずれかをお勧めします。

  • 本モデルはソフトコアのNSFWコンテンツを生成可能ですが、ハードコアなコンセプトには苦戦する可能性があります。必要に応じてLorasを使用してください。

  • すべての画像は、Umi AIと呼ばれる高度なワイルドカード拡張機能を介してプロンプトのみで生成されました。追加の拡張機能や後処理は一切使用していません。

  • 「外見年齢」に関する懸念がある場合は、以下のモデルを強くお勧めします。
    Squeezer - Experimental
    (1つのLoRAで、ポジティブ強度で年齢を下げる、ネガティブ強度で年齢を上げる。細部や体格への影響はコンポジションより大きい)
    Age Slider
    (年齢を上下3段階に影響させるテキストインバージョンのセット。ネガティブ埋め込みも追加効果を発揮。推奨強調値でさえ、生成物のコンポジションに予測不能な変化を引き起こす可能性あり。)


本マージに使用されたモデル:


A1111用の拡張機能Model Toolkitでモデルを走らせてください。CLIP破損の修復や、モデルをfp-32またはfp-16に最適化することができます。


免責事項:
Stable Diffusionのオリジナルリリース以来のすべてのチェックポイントと同様に、このモデルも年齢関連キーワードに反応します。また、NSFWコンテンツを生成可能です。このモデルで何を行うかは、ご自身の判断です。必要に応じてネガティブプロンプトで不適切な画像を防ぐべきです。このような理由から、本モデルは成熟した観客向けとしてマークしています。


また、Tensor.Artでも利用可能です: https://tensor.art/models/612849265988992344


v2 ノート:

これは、より高品質なモデルを追加して完全に再構築されたバージョンです。LoRAなどの追加モデル修正は一切使用していません。プロンプトのみでの生成にこだわりました。本モデルの本質的な能力を示すために、ランダムなプロンプト構造でグリッドプレビューを生成しています。白人女性中心のバイアスがあり、ヌード表現も好む傾向があります。あらゆるスタイルのプロンプト(短い、長い、キーワードリスト、断片的な文章など)に完全に対応。特にNSFWに関する条件の指定は徹底的にしてください。


- UmiAIのワイルドカードシステムを使えば、メインプロンプトとネガティブプロンプトの両方でテキストのシーケンスを呼び出すことができます。アスタリスク**で囲まれた項目はネガティブプロンプトに自動配置されます。以下のプロンプト、各スタイルタイプで使用した「クオリティタグ」が、例のグリッド生成の際の元になっています。

  • <[rngfem]>: "SFW, 1Girl, Adult, ({fat|slutty|cute|muscular} <[rng_intl]>:<[W3.*]>) woman, <[rng_smol]>, (<[rng_hair_multi]>:<[W3.*]>), wearing (<[rng_colors]>:<[W3.*]>) (<[fem_outfit]> outfit:<[W3.*]>), <[rng_gem]> jewelry, <[rng_metal]> accents, glowing {iris|pupils}, <[rng_colors_ext]> eyes, (<[rng_emote]> expression:<[W3.*]>), <[qt_face]>, <[rng_dgrw]>, <[qt_25D]>, <[18+]><[negs_logos]><[negs_body]><[negs_qual]>**naked, nude, **"

  • <[rngxfem]>: "NSFW, 1Girl, Adult, [naked|nude] ({fat|slutty|cute|muscular} <[rng_intl]>:1.2) woman, <[BEWBS]>, <[rng_hair]>, wearing see-through <[rng_colors]> <[fem_outfit]> outfit, <[rng_gem]> jewelry, <[rng_metal]> accents, glowing {iris|pupils}, <[rng_colors]> eyes, <[rng_emote]> expression, <[qt_face]>, <[qt_nsfw]>, <[rng_dg]>, <[18+]>"

  • flat: "flat colors, cel shading, hard shadows, outlines, vector art**realism, photorealistic, hyperrealism, professional photography, uhd, dslr, hdr, ultra high-definition, digital single-lens reflex, high dynamic range, 8k, 3D render**"

  • ani: "depth of field, bokeh, god rays, vivid colors, cinematic hard lighting, smooth shadows"

  • 25d: "subsurface scattering, ray traced, depth of field, bokeh, god rays, vivid colors, cinematic hard lighting, realistic shadows, detailed textures**flat colors, cel shading, hard shadows, vector art, 2D, sketch, background without depth**"

  • photo: "cinematic lighting, depth of field, bokeh, realism, photorealistic, hyperrealism, professional photography, uhd, dslr, hdr**flat colors, cel shading, hard shadows, outlines, vector art, background without depth, 3D render**"


CFG Scale 20-30設定は以下の拡張機能によって有効化されています:Stable Diffusion Dynamic Thresholding (CFG Scale Fix)


本マージに使用されたモデル:



vFP16 ノート:
これは私が初めて、おそらく唯一のモデルマージ試みです。
何をしているのか全く分からないまま、チュートリアルを見ながらボタンを押しただけです。このモデルは、3~4種類の「コマーシャル風」スタイルモデルをマージし、「西洋風」のスタイルを融合しつつ、プロンプトへの非常に高い反応性を獲得しました。本当に、プロンプトガイドは不要です。アニメタグや「自然言語」的な断片的な文章もすべて反応します。ほとんどのLoRAやネガティブ埋め込みと相性良好です。手の描写や偶発的な余分な肢体の出現に関してはまだ少し苦戦していますが、それ以外は安定した出力が得られます。

このモデルで生成された画像

画像が見つかりません。