526Mix V1.5

詳細

ファイルをダウンロード

モデル説明

更新 1.5: マジで馬鹿だな!そんなん俺の最終形態じゃないんだよ!やっと、通常のCFG値(例:7)でもうまくいかない不具合の焼け焦げ効果を完全に削除した。これで最後まで、と願いたい。さらに暗さも大幅に減らした。ランダムな超暗いプロンプトも、超彩度の高い画像も大幅に減り、モデル本来の個性はそのままに。MBWでは、Vodka v4.0Centerflex v1.0 を使用。あ、それに最近RTX 3090を入手したので、今後も楽しみな学習を何回かやってみるつもりです。

1.5更新:簡単スタート情報

  • – リアリズムや3D風画像(その他も含む)を生成する際に強く推奨されます。

  • 絵画をリクエストする際は、framed, borders, photo をネガティブプロンプトとして使うと、フルスクリーン画像が得られ、奇妙な3D風の人物も除去できます。

  • イラストをリクエストする際は、photo, realistic をネガティブプロンプトとして使用するのが好みです。

  • リアリズムを意識する際は、通常 <neg-sketch-2>, anime, render, pixar, illustration, sketch を1.2のウェイトで指定します。

  • かなり奇妙な出力が発生しがちな際は、Garbage-bin LoHa をおすすめします(ちょっとしたお遊びもOK)。

  • 例題画像(v1.5)は、512x程度の解像度から各辺数ピクセルずつ拡大し、DDIMで0.55~0.65の強さで潜在空間のアップスケーリングを実施。その後、ESRGANモデルによる拡大処理を行ったあと、画像を潜在空間に変換し、ControlNet Tileを潜在空間から潜在空間に適用(DDIM、0.2~0.4の強さ)して作成しました。

ノイズオフセットを活用し、コントラストと暗い画像の質を向上させた、Stable Diffusion 1.5カスタムモデルの個人的マージ。このモデルには、インパインティング用のモデルも含まれており、元のスタイルや細部に沿った補填が容易になります。

私はこのモデルを、「エネルギー飲料ドリンクでハイになった、ADHD気味のベースSD1.5」と考えてます。アーティストの名前は別として(そもそも使わないけどね)、1.5の汎用性をそのままに、はるかに高次元のディテールと品質を備えており、適切な設定をすれば非常に反応が良くなります。

このモデルの目指す方向は以下の通りです:

  • アート的で洗練されたスタイル
  • 使いやすく、扱いやすい
  • キャラクターや風景の創造に優れている
  • 単一のスタイルに縛られない、偏りがない
  • 多種多様な美学におけるデジタルアートと伝統的アートに特化
  • 何よりも、楽しい

ただし、露骨な性的表現やアニメ作品(特にアニメベースのエンベッディング)にはそれほど適していない点があります。それらのニーズには他にも多数のモデルが存在します。

*「アニメスタイル」とプロンプトを指定した際には、なんらかの的確なアニメ調の美学が生まれる能力は備えており、私はそれを見るのが非常に楽しいと感じます。ただし、少々不正確な対応もあり、ややデリケートな処理が必要です。もしこのモデルでアニメチックなアートを作りたい場合、「ポートレート」はネガティブプロンプトに入れないでください。また、ポジティブプロンプトに「close」や「closeup」は使わないでください。これらはアニメスタイルに多少の重みを加えても、依然として3D風に見えるように制御しがちです。

また、whosawhatsisさんのverisimilitudeについても挙げておきたいです。このモデルは、即座に壁紙クラスの写実的な画像を生成するのに非常に優れています。

さらにcorecoさんとそのseek.art MEGA v2についても称賛します。V1.3~V1.4の構成の多くはこのモデルに起因しており、Megaモデルの素晴らしいバージョンアップといえるでしょう。

例題画像はInvoke AIで生成されています。したがって、Invoke AIを使わない限り、私の画像と全く同じ再現は難しいでしょう。プロンプトの内容を参考にして、使うUIに応じて重みを調整してください(A1111 UIを使う場合は、(プラス記号)+ は1セットの括弧に相当します)。

ダウンロードすることで、creativeml-openrail-mおよびDreamlike-artのライセンスに同意したものとみなされます。

クレジット(V1.4 / V1.3.5):

このモデルで生成された画像

画像が見つかりません。