Reakaaka's enhancer [Lumina 2]

詳細

ファイルをダウンロード

モデル説明

Lumina 2 の強化バンドル

すべてのカバー画像は、モデルの出力(1MP解像度、アップスケールなし、手や顔のインペインティング修正なし)、さらには否定プロンプトすら使用していません。


現在対応:

約7,000枚の画像でトレーニング済み。

  • 写真、デジタルアート、アニメ画像、宇宙画像……考えられるあらゆるジャンル。近接衣装、手、複雑な周囲照明などの専門サブデータセットも多数含みます。

  • 高解像度で精細なディテールを持つ画像のみ。データセット全体の平均ピクセルは3.37MP(約1800×1800)。すべての画像は私が手作業で厳選しています。

  • Google LLMによる包括的な自然言語キャプション。

  • アニメキャラクターはまずwdタガーv3でタグ付けされ、その後Google LLMによって自然言語に洗練されています。

効果:

  • より良い背景、自然なテクスチャ、ライティング、ノイズの低減。

  • やや優れた創造性とプロンプトの忠実性。

なぜ分離されたLoRAではなく、このバンドル形式なのか?

これは数学的な問題です。AIに「画像モデルで、あまりにも多くのLoRAを重ねると何が問題になるか?数学的観点から教えて。」と尋ねてみてください。

すべてのデータとコンセプトを一括でトレーニングすれば、矛盾は生じません。

さらに、大型のデータセットは過学習を防ぎます。たとえこのモデルをアニメ専用に使う場合でも、写真からの知識はアニメにさらに詳細を追加する方法をモデルに教えることができます。これが、データセットに関して「大きいほど良い」と言われる理由です。


使用方法

強度は0.8〜1を推奨します。

データセット内のアニメ画像には、トリガー語として「Digital anime illustration.」をプレフィックスとして使用しました。こちらもお使いください。


ライセンス

このモデルはApache License 2.0のもとでリリースされています。

追加条件:このLoRAをマージしたモデルの販売・収益化は禁止されています。


更新ログ

注:バージョン番号は意味を持たず、私のトレーニングIDだけを示します。

v0.27: 効果が強化。デフォルトスタイルあり。

v0.11: NetaYume v3.5でトレーニング。完全な実行。私の全データセットを使用。デフォルトスタイルあり。

v0.8: 初版。NetaYume v3でトレーニング。テスト実行。合計トレーニングデータ約1,000枚。バイアスなし、デフォルトスタイルなし。

このモデルで生成された画像

画像が見つかりません。