Nyan Mix

詳細

ファイルをダウンロード

モデル説明

TL;DR 以下すべての要約: "HiresFixを使用する場合はabsurd2バージョンを使用してください。HiresFixを使用しない場合は通常バージョンを使用してください。absurd2が不安定な場合はwithContrastFixバージョンを使用してください。あまりに暗くなる場合は通常バージョンを使用してください。同梱されているVAE(nai)を使用することを検討してください。CFG Fix拡張機能の使用を推奨します(ほとんどの例の画像はこれを使用して作成されています)。"

  • このミックスを使ってみたことがある方は、他の使用スタイルでの動作を気になっているため、レビューを残してください!

  • 現在、他より優れているか劣っているバージョンは存在せず、各バージョンはスタイルが異なり、また「詳細だがややごちゃごちゃする : 安定だがやや退屈」のバランスの違いがあります。各ミックスのバージョンごとの違いを例の画像で確認してください(選ばれたものではなく、バージョン間で直接比較可能な画像です)。

  • また、「How(使い方)」セクションでは、バージョン間の違いについても説明しています。

なぜ作成したのか

好奇心から、私が普段使用しているモデルを組み合わせて自分用にモデルを作成したのですが、その結果が非常に優れているため、多くの人に良い成果を共有しようと思ったのです!

YOZORAの豊かなクリスピーなディテール、Xtracolorの驚くべき半現実的な能力、AOMのアートスタイル、Counterfeitのディテールにおける独創性、MeinaMixとKorean 2.5Dの顔の表現がとても好きでした。また、uiouiouioのモデルも全体的な結果が気に入ったため、追加しました。

その結果、Nyan Mixは半現実的なスタイルで非常に色彩豊かでコントラストの高い、豊かなエフェクトをもった画像を生成できるようになりましたが、環境がたびたび抽象的になりすぎ(CFG Fixを使用しないと)、またデフォルトで非常に暗いのが特徴です("withContrastFix"バージョンを使用する場合)。

何を作成したのか

レシピは各バージョンの変更履歴に記載されています。

  • 初期テストの結果、一般用途には「normal」または「withContrastFix」バージョンを、濃い背景を持つダイナミックなシーンには「absurd2」バージョンを使うのが最適です。

  • 「absurd」バージョンは「normal」に比べてはるかに詳細ですが、「intense」バージョンは中間くらいです。特にHighres Fixと組み合わせた場合、想像以上に不安定にはならず、健在であるように見えます。しかし、さらに強調すると破綻し、他のパラメータと併用するとダメになることもあります。LORAと組み合わせると不安定になる可能性はありますが、まだテストしていません。

  • 「absurd2」バージョンは「normal」に比べて非常に暗いですが、コントラストは優れています。「withContrastFix」バージョンはその中間くらいです。

  • ページ下部のバージョンタブを切り替えることで、それぞれのバージョンを簡単に比較できます。例の画像は、各モデルの特徴を直接比較できるように作られています。

メモ: 230301バージョンはより2.5D寄り、230303バージョンは設計上より2D寄りです。

バージョン間の比較(間もなく追加例で更新予定): https://imgur.com/a/JvSQqUV

使い方

最適な構成とは限りません(より良い使い方を発見してくれると嬉しいです)。ただし、ほとんどの例の画像は以下のように生成しました:

サンプラー: DPM++ SDE Karras

Highres fix: 有効

アップスケーラー: Latent (nearest)

アップスケール倍率: 2

サンプリングステップ数: 20-50

Highresステップ数: 15-25

(一般的に20+15ステップで十分)

ノイズ除去強度: 0.6

CFG Scale: 7

Clip skip: 2

解像度: すべての解像度で問題なく動作 – 縦長(ポートレート)・横長(ランドスケープ)の両方とも優れており、低解像度ベース(200x400)でも高解像度ベース(896x1344)でも良好です。

VAE: "absurd2"バージョンに同梱されています。同ファイルはCounterfeit/OrangeMix/RefSlave等と同じものです。他のVAEは目の品質を低下させ、予期しない「色収差」のような深刻なエフェクトを引き起こす可能性があります。

重要!!!

https://github.com/mcmonkeyprojects/sd-dynamic-thresholding.git

CFG Scale: 15

CFG Fix: 有効

Mimic CFG Scale: 7

トップパーセンタイル: 95%

Mimic Scale Scheduler: Half Cosine Up

CFG Scale Scheduler: Half Cosine Up

CFG Schedulerの最小値: 3.5

Power Scheduler Value: 4

(ほとんどの例の画像はこの設定で作成されています)

代替案:

サンプラー: DPM++ 2S a Karras

Highres fix: 無効

解像度: 800×1200以上を推奨

CFG Scale: 7

サンプリングステップ数: 10-30

代替案:

サンプラー: DPM++ SDE Karras

Highres fix: 無効

解像度: 600×900以上を推奨

CFG Scale: 解像度によって8.5以下

サンプリングステップ数: 15-35

今後の計画

より高い安定性とより良い背景の実現を目指します。
次のバージョンはより2.5D寄りになります。
異なるスタイルを注入して、ここに自然に馴染むものが現れるか試してみます。

このモデルで生成された画像

画像が見つかりません。