Wahtastic Mix

詳細

ファイルをダウンロード

モデル説明

このモデルの最終的な目標は、すでに比較的優れた基盤であるNoobAI v-predと非常に似た体験を提供しつつ、粗さを修正することです。他の多くのマージモデルは、プロンプトへの忠実度が高い(Noobに近い)か、デフォルトの美的品質が高い(Illustriousに近い)かのいずれかの二峰性に苦しんでいます。

理想的には、この両方をモデルに統合しつつ、モデルの知識をあまり犠牲にすることなく実現できるはずです。

寄付用ETHウォレットアドレス: 0x645BebF82373865eC520d8AC2527524BfB174FF8

Wahtastic ロードマップ

  • ✅ 1536x 超解像対応

    • Illustrious 2.0+ と同様に、1536x のネイティブ生成(およびややそれ以上)を可能に
  • e6 サイズタグの影響を修正(hyper ≠ huge ≠ big)

    • 簡単に言うと、e6 タグには意味の連鎖がある:hyper_*huge_* を意味し、huge_*big_* を意味する

    • そのため、モデルは big と huge、huge と hyper を関連付けようとし、結果として big_* が時に過度に大きな身体部位を生成する原因となる

  • 自然言語キャプション生成

    • はい、CLIPは酷い

    • lodestone-rock の自然言語キャプションを使用し、ある程度の自然言語理解を再導入することを目指す

    • このアイデアは EasyFluff /XL に着想を得ている

  • 優れたスタイル知識

    • 約2万件のe6アーティスト(投稿数500~20件)

    • 約2万4千件のDanbooruアーティスト

推奨設定

最適な結果を得るため、以下の推論パラメータを推奨します:

  • サンプラー: Euler または Euler A

  • スケジューラ: Normal または Beta

  • ステップ数: 16-24

  • CFGスケール: 3-6

  • 解像度:

    • 一般的な使用: 832x1200(または合計面積が約1024x1024となる同様のアスペクト比)

    • V9.1以降: 1536x 解像度をネイティブに処理可能

このモデルで生成された画像

画像が見つかりません。