RAYMNANTS

詳細

ファイルをダウンロード

モデル説明

Ray-シリーズのモデルをご覧いただき、ありがとうございます。

2023年11月~12月にかけて、私はこのシリーズの最初のモデルであるRAYMNANTSを、約千点に及ぶ個人所有のアセット(ストリートフォトのRAWまたは編集済み画像、デジタルペインティングなど)を用いてトレーニングしました。目的は、「人間らしく見える人物」を生成し、かつ私が最も好むビジュアルスタイル(ややグレインのあるDSLR写真)を再現することでした。その後、下にリンクした別のスタイルのモデル2つを追加でトレーニングしました。

当初、これらのモデルは社内で注目されていたため、公開を見送っていましたが、最終的にプロジェクトは行き詰まり、Fluxモデルの爆発的な注目を受けたことで、SDXLが完全に時代遅れになる前に、自分の成果をコミュニティに還元しようと思いました。

皆様のインスピレーション、知識、そして夢を大切に守り続けてくれたことに、心より感謝します。

私のモデルをぜひお楽しみください~

R.

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
私の絵画的なモデルをご覧ください:RAYCTIFIER
私のスタイル化されたモデルをご覧ください:RAYBURN
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

RAYMNANTS3.0 の紹介

私の最も現実的なモデルで、RAW写真やビデオスチール風のレンダリングに最適化されていますが、それ以外の用途にも対応可能です。

このモデルは、信頼性の高い人物描写だけでなく、一定の個性とダイナミズムを備えるようにトレーニングしました。出力画像はややグレインが強く、全体的にマットな色調になります。

簡単にプロンプトを組めるように、選択的なタグスタイルのキャプションを用意しました。お気に入りいただければ幸いです。

プロンプトの書き方

  • 簡単に:
    Video still of” や “RAW DSLR Photography of” といったシンプルなメディアキーワードが効果的です。

  • サブジェクトから始め、詳細を追加してください。モデルは人種や年齢をプロンプトに含めた場合、よく反応します。ただし、60歳以上の人に対して白髪以外の髪色を指定すると、若く見える結果になる傾向があります。逆に、白髪の子供の場合はその逆が起こります。

  • 必要ない限りネガティブプロンプトは使用しないでください。一般的な画像補正用のネガティブプロンプトを多用すると、出力が平凡になります。さらに、RAYMNANTSは一般的な埋め込みなしで最も効果的に動作します。

ヒント:ポジティブプロンプトに「ugly」のようなネガティブなキーワードをそのまま使うと効果的です。例:「beautiful 20yo Czech woman」ではなく、「ugly 20yo Czech woman」としてみてください。すると、より興味深い顔立ちが得られます。A1111形式の構文「ugly|pretty」を使うと、ステップの前半で「ugly」を、後半で「pretty」に切り替えて処理します。他の単語にも試してみてください!

  1. Video still of a 35 yo Mongol woman, sad, in a room with burgundy walls.

  2. RAW DSLR photography of an old man, emaciated, wearing a worn-down tracksuit, in a street at dawn, vaporwave, soft bokeh

  3. Cinematic movie still, a raging fantasy dwarf, 50yo, muscular, long flowing beard, golden rim light, dynamic action shot, shallow depth of field

設定

  • 初期生成時は、できるだけSDXLの画像サイズ内に留めてください。(目安として、幅と高さの合計が約2000程度になるように。例:1024+1024=2048、832+1216=2048。1900~2100は問題ありません。2150以上になると潜在ブロックが繰り返される傾向があります。64の倍数がより良い結果を出します!)

  • 多様なサンプラーと組み合わせて良好な結果が出ます。私は個人的に、DPM++ 2M Karras(ステップ30、CFG 5–8)を好みますが、DEISやDDIMなどの新しいサンプラー/スケジューラーも効果的です。

  • 2倍アップスケールする際には、ノイズ除去率を0.2–0.3に設定して、さらに5〜8ステップ追加してください。アップスケーラーの選択肢は、4x_NMKD-Siax_200k、4x_foolhardy_Remacriが適しています。ポートレートには、1x_ITF_SkinDiffDetail_Lite_v1を推奨します。

既知の問題/特徴

  • 「video still」のようなメディアタイプを使用すると、彩度が低くコントラストの弱い出力になることがあります。しかし、プロンプトに「saturated」「contrasted」「vibrant」などのキーワードを追加すれば簡単に修正できます。

  • 「ugly」キーワードを使ってよりリアルな人物を生成する際、時折左右非対称の目が出ることがあります。シード全体が気に入っている場合は、「ugly」トークンの重みを下げて効果を弱めることで対応できます。

  • 瞳の形状が必ずしも丸くない、またはガラスのように見えることがあります。これは、軽いアップスケーリングや低ノイズ除去の2回目の処理で通常解決します。

  • グレインのある出力とスーパーモデルでない人物:これはまさにこのモデルが訓練された目的なので、それが得られるのは当然です。

  • このモデルは品のあるヌードも生成できますが、それ以上には対応していません。男性の下半身の解剖学的構造については、モデルの学習が不十分です。

このモデルで生成された画像

画像が見つかりません。