UwU_Clarity_Z-Image
詳細
ファイルをダウンロード
モデル説明
アクティブ化タグ:(下記に追加のトリガーワードを記載)
uwu_clarity <--(LoRaの方向性を助けるためのアクチベーターを含めましたが、必須ではありませんが役立つ場合があります。)
pornographic <--(gooners と coomers のために。特定のポーズには追加のLoRaペアリングが必要な場合があります。)
このLoRaについて:
これは、私のUwU_Clarity SDXLモデルから生成された画像を用いて学習された、Z-Image用の低ランク4ビットLoRaモデルです。このLoRaはVRAMへの影響を最小限に抑え、軽量で高速なモデルを目指しています。SDXLモデルのスタイルとトーンをZ-Imageに導入することを目的としており、解剖学的構造、性器、キャラクター、コンセプトを含みます。Z-Imageはリアリズムには優れていますが、創造的なプロンプトなしにはファンタジー的な画像を生成するのが難しいという欠点があります。このLoRaは、FluxやSDXLのような結果をより簡単にプロンプトできるようにその課題を解決することを目的としています。さらに、Z-Imageは元々性的な概念に対して苦手で、男性器を過剰に検閲し、恐ろしい裸体男性を生成してしまう問題があります。このLoRaは、ベースモデルが生み出すそうした異常な結果を一定程度緩和するように訓練されています。このLoRaは汎用モデルであり、特定のタスクに特化または優れているわけではありません。
特徴:
私のベースモデルと同様、このLoRaは一見して特徴的で、あるいは同じように見える男性と女性を強く生成する傾向があります。これは私の個人的な好みによるものです。そのため、同じように見えるキャラクターを避けるには、プロンプト時にユニークな名前+人種/国籍+特徴的な外見を組み合わせることを推奨します。
(例:Alexa Valencia — 肌が白く、スウェーデン系の女性。広くて流線型の鼻、豊かな唇、細長い顔、小さく真剣な目。)
免責事項:
このLoRaは完璧ではありません!Z-Image Turboに本来備わる奇妙さやデフォルトの振る舞いが依然として発生する可能性があります。テキストエンコーダーとモデル自体の特徴を完全に理解するまで、これはまだ非常に進行中の作業です。
トレーニング情報:
前述の通り、データセットは私のUwUデータセットと、Z-ImageおよびUwU_Clarity SDXLモデルを使って作成したカスタム合成データセットの混合です。SDXLモデルで一連の画像を生成し、その結果をエンコードしてZ-Imageでimg2img処理を行いました。ワークフローでは、promptgenを使用してSDXLが生成した画像にキャプションを付与し、その画像を生成するために使用したオリジナルのプロンプトをpromptgenのスタイルで追加しています。これにより、自然言語と従来のタグ付けスタイルの両方をサポートするキャプション生成方法を構築しました。(必要に応じてワークフローを提供可能です。ワークフローはマルチGPU環境で構築されていますが、単一GPUでも実行可能です。)
このLoRaは、リアリズムの度合いが異なる(アニメ、セミリアル、リアル、写真的)多様なアートスタイルを含む3,000枚の画像を用いて10,000ステップ学習されました。これにより単一のスタイルに偏るのを防ぎましたが、写真的リアリズムにおけるベースモデルの生成品質は若干低下しました。LoRaの強度が過剰に感じられる場合は、徐々に重みを下げて、ご希望の結果になるまで調整してください。(逆に強度を下げすぎると、性器が歪んだ塊状の「ミートスティック」に戻る可能性があります。)
トレーニング環境:RTX 3080(12GB VRAM)+NVIDIA QUADRO P1000(4GB)+64GB DDR4 RAM。P1000はトレーニングUIとPythonを実行し、一部のキャッシュ処理を担当し、CPUオフロードとキャッシュに依存しない形で、RTX 3080の全12GB VRAMをトレーニングに活用できるようにしています。これにより、OOMエラーを防ぎつつトレーニング速度がわずかに向上します。
追加トリガーワード:(私のUwU_XL_v3モデルから独自に採用したタグ)
illustrious, pony_sdxl, semi-real, photoreal, uwu, lustful_clarity, supremely detailed, insanely detailed, interesting composition, digital illustration, animated image, absolute realism, highres, incredible shot, No description generated, No tags generated, Featuring stylized artwork, newest, high quality, wonderful, masterpiece, best, top rated, perfect image, feministic, ideal beauty, absolute realism, professionally drawn.
ネガティブプロンプト:
(fleshy growth, ball of flesh, tumor, skin mass, lumpy genitals, abscesses, lipomas, inflammation, cyst, lumps and masses, disfigurations, skin condition, abnormal skin, 3 legs, three legs, tri-limb, elongated, saggy skin, ribbed pattern, diamond pattern, raised grooves, waffle pattern, finned, flanged, beef stick, beef jerky, meat stick, sausage, warts, pimples, ugly, disgusting, monster, creature, horrific, stretched body, stretched limbs.) + (通常のネガティブタグ)



















