UltraReal Fine-Tune
詳細
ファイルをダウンロード
モデル説明
V4
さて、このバージョンでは何が新しくなったのでしょうか?美的感覚のレベルを上げ、年齢の多様性を強化し、アジア系の特徴への対応を改善しました。しかし——いつもそうであるように——手の描写が少し不自然になったことに気づきました。えー、すべてを完璧にすることはできませんよね。
私はこのチェックポイントを、スタイル化されたLoRAのベースとして使うことを強くお勧めします。たとえば、リアリズム増幅器、2000年代アナログコアなど、私のLoRAと組み合わせてください。もう1回バージョンをリリースするかもしれません(正直に言って、v3とv4はちょっとミスった部分があるので)。でもまずは、Flex.Alphaの微調整に取り組みます。
今回利用可能なバージョン:bf16、fp8、q8_0(pruned fp16)およびq4_k_m(pruned fp8)
P.S: このチェックポイントには私のUltraRealPhoto LoRAを使用しないでください。スタイルに极大な影響を与え、画像が過剰に処理されてしまいます。UltraReal Fine-Tuneをご利用の場合は、代わりにリアリズム増幅器をご使用ください。UltraRealPhoto LoRAは、不十分な影、光、顔を修正するために作られましたが、これらの要素はすでにこのチェックポイントに組み込まれているため、リアリズムを向上させるには増幅器を追加するだけで十分です。
V3更新(実験版)
このリリースは前進を示すものですが、まだ未完成です。主にヌード、足、下肢の解剖学的構造の改善に焦点を当てました。結果は以前より良くなっていますが、まだ目指すレベルには達していません。ただし、このバージョンでは、品質とテクスチャーの向上が顕著で、以前のバージョンと比べてより詳細で洗練された出力が得られます。
推奨設定:
CFGスケール: 3(以前のバージョンで使用していた2.5ではなく)
ステップ数: 50(安定性を向上させますが、手や指の一部でわずかな不安定さが残ります)
CFG 0.9 と 1.0 の比較: CFGを0.1、あるいは0.2まで下げると、一部のディテールが改善されることがあります(改善されない場合もありますので、試してみてください)。ただし、生成に時間がかかることがあります。
ヌードについては、まだ意図した通りに動作していませんが、この問題に積極的に取り組んでおり、次バージョンで改善する予定です。
良いお知らせとしては、V3.5用のデータセットはすでに準備できており、V2とV3の間のギャップよりも速くリリースできる見込みです。今回のバージョンから得た経験とフィードバックを活かして、次のアップデートでは大きな改善が期待できます。
いつものように、皆さんのサポートとフィードバックに心から感謝しています。このプロジェクトをさらに磨く上で、それは非常に貴重です ❤️
P.S.:Fluxを微調整するほど、他の部分の品質が低下しているように感じます。また、Flex Alphaの微調整を試してみようと考えています(プロジェクトは非常に有望です)。
v2.0 の新機能
解剖学の強化: 手、足、ポーズが大幅に改善され、より自然で正確な結果を提供します。歪んだ四肢とはおさらばです!
テクスチャーと品質の向上: 皮膚のディテールがアップグレードされ、より豊かなテクスチャーとシャープな結果を実現。ぼやけた画像はまだたまに発生しますが、以前のバージョンやLoRA単体での使用時よりもはるかに頻度が減りました。
テキストレンダリングの改善: 画像中のテキスト生成に取り組み、以前より大幅に向上しました。ただし、不自然な記号や読めない文字が現れることもあります。これはまだ作業中です。
拡張されたデータセット: より大規模で多様なデータセット(1800枚の画像)を導入し、スタイル、照明、構図のバランスを改善しました。
追加されたチェックポイントのバリエーション
異なるワークフローとの互換性を確保するため、複数のチェックポイントバリエーションを用意しました:
BF16
FP8
Quant 8(Q8)
Quant 4(Q4)
NF4
私のテストでは、Quant 8(Q8) がFP8よりもやや高品質で、リソース消費を抑えつつより細部まで表現できますが、他のバージョンも十分に良好です。ご使用の環境に最も適したバージョンをお選びください。
既知の制限事項
NSFW対応: まだこのバージョンでは弱い領域です。ただし、NSFWコンテンツに特化した軽微な微調整はすでに進行中です。
テキストレンダリング: テキスト生成は向上しましたが、奇妙な記号や不完全な単語がたまに現れることがあります。ただし、fp8ではなくt5xxl fp16を使用すると、テキストの品質が大幅に向上します。
最適な結果を得るためのヒント
サンプラー: DPM++ 2M サンプラーを使用して、滑らかで一貫性のある出力を得ましょう。
ステップ数: 過度な処理を避けて、微細なディテールを捉えるために30~50ステップを推奨します。
スケジューラ: Betaスケジューラがこのチェックポイントに最適です。
プロンプティングのヒント
最適なプロンプトのスタイルは、明確でコンマ区切りのフレーズを複雑に組み合わせることです。物語的なプロンプトを工夫することはできますが、「このクソみたいな記述が彼女のスタイルにヴィンテージ感を加えた」など、無駄な説明は結果を向上させません。簡潔で視覚的要素に集中した記述が、最高の出力を生み出します。
今後の計画
この微調整のさらなる開発にコミットしています。次回のアップデートでは以下の点に集中する予定です:
NSFW機能の拡張
ダイナミックなポーズや照明条件などのエッジケースの改善
よりシャープで正確なテキストレンダリングの向上
P.S:まだ現実的な効果が得られない場合は、私のUltraReal LoRAを追加してみてください。私には非常に効果的です。
Ultra-Realistic Flux Fine-Tune v1
これは、私のUltraReal LoRAを基盤とし、拡張されたデータセットで構築した、初めてのチェックポイント微調整実験です。目的は、アマチュア的美学とプロフェッショナルで高品質なビジュアルの間の完璧なバランスを見つけ、リアリズムを次の段階へ引き上げることです。
これはあくまで初版であり、さらなる改善の余地は十分にあります。結果は良好ですが、完璧ではありません(手や足が時々崩れることもありますが、深刻な問題ではありません。デフォルトのFluxよりはましです)。この微調整は、アマチュア的な出力にとどまらず、プロフェッショナルな画像においても輝きます。卓越したディテール、生々しい影、照明を実現し、より広範なリアリスティックな画像生成の可能性を引き出せるように設計されています。
これはあくまで進行中のプロジェクトであり、フィードバックを得て、他のユーザーがどのように創造的に活用するかを知るために共有しています。試していただければ、ご感想や結果をお聞かせください!
また、両方のバージョン:fp16(ComfyUIではe5m2と一緒に使用するのが最適)、fp8、およびQ4_0をアップロードしました。
🌟 この微調整の新機能
拡張されたデータセット: 元のLoRAのデータセットサイズのほぼ2倍。多様なスタイル、照明、構図をカバー。
向上したリアリズム: シャープなディテール、豊かなテクスチャー、自然な照明で、AI生成と現実の画像のギャップを縮小。
汎用性: カジュアルなアマチュア風スナップから、シネマティックなプロフェッショナルレンダリングまで、さまざまなクリエイティブニーズに対応。
改善された解剖学: ベースのFluxモデルと比べて、手、四肢、自然なポーズが大幅に向上。
💡 最適な結果を得るためのヒント
DPM++ 2M サンプラー を使用して、滑らかで一貫性のある出力を得ましょう。
細部を捉えるために30~50ステップを推奨します。
最適なレンダリング性能のためにBetaスケジューラを選択してください。
⚡ なぜ微調整したのか?
この微調整は、デフォルトのFluxモデルの制限を克服するために作られました。複雑なシーンを処理する能力を高め、多様なプロンプトにわたって一貫した品質を維持します。目標は単純です:無限の調整を必要とせず、超現実的な画像生成を、アクセスしやすく、信頼でき、視覚的に圧倒的に美しいものにすることです。
P.S:このモデルをさらにトレーニングし、最高の解剖学とリアリズムを持つ究極のチェックポイントを作成する予定です。このバージョンはNSFWにあまり向いていません(次バージョンで修正されます)
P.S.S:現在、ランダムに低解像度の画像が出力されることがあります(何が原因かは不明ですが、解決策を探します)。ただし、プロンプトに高解像度を含めると、この問題が軽減されるようです。




















