OpenXL Version 3.0 Cinematic Still Aesthetic Improvement

詳細

ファイルをダウンロード

モデル説明

==========================================

プロンプトの提案

映画のスチール画像生成

肯定的プロンプト:

upperbody/fullbody 実写写真の

否定的プロンプト:

アニメ、カートーン、グラフィック、テキスト、絵画、クレヨン、鉛筆、抽象、グリッチ、変形、変異、醜い、障害、ノイズ背景、最悪の品質、最悪の解剖学的構造、歪み、低品質

CFG:4

サンプラー:dpm++ 3m sde

ステップ:30

テキスト生成

肯定的プロンプト:

ぼやけた前景にテキスト "{text}" {主要被写体}

否定的プロンプト:

最悪の品質、最悪の解剖学的構造、歪み、低品質

CFG:4

サンプラー:dpm++ 3m sde

ステップ:30

==========================================

20240515 バージョン 3.0

映画のスチール画像を用いて学習、美学的な画像を手動で選定。

「中国」「伝統的な衣装」などを改善。

このバージョンで、私が目指していた影と光の効果をついに実現。

そのため、バージョンを 3.0 にジャンプ。

この学習により一部の機能が弱化:

テキスト生成能力

今後のバージョンで上記の問題を修正する可能性あり。

20240510 バージョン 2.6

このバージョンは、2パスワークフロー(pixart-sigma2openxl2.5)で生成された画像を用いて学習。

主に影と光を改善。

テキスト生成能力は以前と同レベルを維持。

バージョン 2.5 の学習で発生した「ぼんやりした立ち姿」を修正。

20240504 バージョン 2.5

クリエイティブ写真をスタイルタグとして追加。

今後のバージョンではこのタグをさらに改善。

20240502 バージョン 2.4b

テキストの精度をわずかに改善。ほとんどの場合、2.4a よりも向上。ただし、一部のケースでは 2.4a のほうが優れている。

写実的生成を調整。

テキスト生成については 2.4a の提案を参照してください。

2.4c は 2.4b の上に DPO を適用したものになる可能性あり。

20240428 バージョン 2.4a

テキスト生成に焦点を当て、テキスト生成用の推奨プロンプト:

肯定的プロンプト:

ぼやけた前景にテキスト "{text}" {主要被写体}

否定的プロンプト:

最悪の品質、最悪の解剖学的構造、歪み

CFG:3.5

サンプラー:dpm++ 3m sde

「Align Your Steps」を使用:10

「Align Your Steps」を使用しない:30

注意:バージョン 2.4a は OpenXL2.4 のアルファ版です。2.4 をベースにした複数のバージョンが登場する可能性があります。

20240425 バージョン 2.3e

影と光を改善

顔のディテールを改善

20240423 バージョン 2.3c

CLIP を 2.2 でより良い性能を発揮したバージョンに戻す

20240422 バージョン 2.3

バージョン 2.2 から生成された PAG 画像で学習。

構造、解剖学、肌の色などを改善。

テキスト生成にわずかに影響を与える可能性あり。

20240417 バージョン 2.2

主に指の生成を改善

影をわずかに改善

20240415 バージョン 2.1

肌と影を調整

解剖学的構造をわずかに改善

20240412 バージョン 2.0

SDXL ベースから完全に再学習、複数ラウンドのトレーニング

データセット:

アニメ画像、ファッション画像、フィルタリング済み PickScore データセット、4K ビデオキャプチャ、コスプレ写真、NVIDIA InTheWild データセットなど

トリガー語:

アニメアートワーク、ファッション写真、コスプレ写真、RAW フォト、コットンドール、女性、男性など

写実的な画像を生成するには、最初に「RAW PHOTO」を使用し、「Unity」や「CG」などは避けてください。

かわいい画像を生成するには、「コットンドール」を追加して形状を調整してみてください。

女性を生成するには、「1girl」ではなく「woman」を使用してください。「1girl」を使用すると、通常は少女が生成されます。

マージリスト:

SDXL DPO LoRA

OpenXLv1.4

-- Kohaku Alpha および Beta

Animagine v3 と Pony Diffusion はマージされていません。

注意:中国の女性、中国の伝統的な衣装、中国系に関連するタグは、SDXL の中国語バイアスの影響で奇妙な結果を生む可能性があります。今後のバージョンで改善予定ですが、現在は写実的な画像を生成する際はこれらのタグを使用しないでください。

20240323 バージョン 2.0 ベータ

20231229 バージョン 1.4 ユーザー好ましさ改善

2024 バージョンの前に、ついにバージョン 1.4 をリリース。

Pickapicv2 データセットから 4,000 件をフィルタリングして学習。

美しさ、写実性、瞳、影と光、構図などを改善することを目的。

旧バージョンと比較して全体的に改善。

ターボ版を使用したい場合は、より効率的なターボ LoRA や LCM LoRA を推奨します(本モデルにマージした LoRA よりも優れています)。

ご意見や画像の共有、ありがとうございます。

20231201 バージョン 1.3 ターボマージと女性顔の調整

SDXL Turbo とマージし、10 ステップで高速生成を実現。

女性の顔のディテール(影、唇、輪郭など)を調整。

OpenXL v1.3 ターボ推奨生成設定:

ステップ:10

CFG:1~5(推奨 2)

サンプラー:dpmpp_3m_sde

スケジューラ:sgm_uniform

フルバージョンの出力はターボ版と若干異なります。

ターボ版は高速生成用、フルバージョンは高品質生成用に使用することを推奨します。

20231128 バージョン 1.2 写実的な影と目の生成を改善

主に写実的な影を調整し、リアルな目の生成を改善。アニメモデルの影響を軽減。

20231127 バージョン 1.1 手とアニメスタイルを改善

バージョン 1.1 は、アニメスタイルの改善を目的として初のアニメモデルをマージしたバージョン。

マージされたチェックポイントはすべて末尾に記載。

アニメモデル以外の大きな改善点は、手の生成。

LLM を用いてキャプションを付与した手のデータセットで学習。

複数のチェックポイントを慎重に微調整・テストし、

最近の論文で提案された LECO テクノロジーを用いた LoRA とマージ。

テスト結果:

100回の手を振るテストで、70%の確率で正確に5本の指を生成。

テストプロンプト:

肯定的:

良い手、美しい女性が彼氏のために手を振っている写真

否定的:

水彩画の手、未完成の絵の手、スケッチ、抽象、アニメ

ロードマップ:

完了:

  • 手の生成 v1.1

  • アニメスタイル v1.1

  • 写実的な影 v1.2

  • 目の生成 v1.2

  • SDXL Turbo マージ v1.3

  • 女性顔の調整 v1.3

今後の開発:

  • 姿勢

  • 表情

  • 年齢層

  • 特定のアニメキャラクター

  • コスプレ衣装

  • アートスタイル

===========================================================

トレーニング方法:

最新のアップデートでは、以下のような多様なトレーニング手法を使用:

  • Meta Emu からの品質トレーニング

  • OpenAI DALL·E3 からの説明的キャプション

  • ダイレクト微調整

  • その他

トレーニングデータセットには、Nijijourney の画像は一切含まれていません。私は Niji スタイルがあまり好きではありません。

このチェックポイントは、様々なスタイルを提供できるように改良された SDXL のバージョンを目指しています。

ユーザーの指示:

アスペクト比:

SDXL 標準のアスペクト比を使用してください。SD1.5 で使用される 512512 や 512768 などのサイズは避けてください。

プロンプトスタイル:

[スタイルワード] [説明] [補助ワード]

特定のスタイルで画像を生成するには、上記のフォーマットを使用することを推奨します。

SDXL は多様なスタイルに対応できるため、主題の前にスタイルを明示することで、画像のスタイルを制御できます。

スタイルが十分に反映されない場合は、否定的プロンプトで不要なスタイルを明示してください。

例:

肯定:

写真:アニメのピカチュウが現実の世界でバスケットボールをプレイ、机の上に閉じたノートパソコン、詳細な背景

否定:

白い背景、3D レンダリング

SD1.5 でよく使われるような大規模な否定プロンプトの組み合わせは推奨しません。

否定プロンプトを有効・無効に切り替えて違いを試してみてください。

分類器無料ガイドANCE(CFG):

CFG は 2.5~5.5 を推奨。

サンプラー:

3m sde GPU を推奨。

スケジューラ:

Karras を推奨。

ステップ:

25~40

さまざまなプロンプトで試し、気に入ったら画像🖼️とフィードバック📓を共有してください。

ありがとうございます❤️。

連絡先:

[email protected]

WeChat:

fkdeai

===========================================================

マージリスト:

20231127 バージョン 1.1

Kohaku-XL beta 6.9

/model/162577?modelVersionId=203416

Kohaku-XL alpha nyan

/model/136389/kohaku-xl-alpha

SDXL Cross Style Hand Fixing Lora

/model/211577/sdxl-cross-style-hand-fixing-lora?modelVersionId=238349

このモデルで生成された画像

画像が見つかりません。