BAXL | Blue Archive Flat Celluloid Style Fine-tune | 碧蓝档案赛璐璐平涂画风 [Kohaku Δ & Animagine XL v3]

詳細

ファイルをダウンロード

モデル説明

BAXLv3がリリースされました!

一般化能力に焦点を当て、大規模な忘却や過学習なしに、多数の著作権キャラクターのアートスタイルをカバーします。

test img @QR0W_

この更新で期待できること:

  • 一般化能力の向上

  • Blue Archiveスタイルへの近づき

  • 美しい光沢

  • KohakuΔに基づいたLoRA互換性の大幅改善

この更新で期待できないこと:

  • より良い解剖学的正確さ、常に良い手と足

  • 使用が簡単

  • 与えられたプロンプトへの集中(以前のバージョンと比較)

  • 複数人物/NSFW対応(これは Pony に近づくことはありません)

  • 詳細な背景

使い方:

プロンプトの論理は KohakuΔ と同じです。

1girl, <キャラクター>, <一般タグ>, <品質タグ>

否定的:

lowres, error, worst quality, low quality, jpeg artifacts, watermark, signature, username

プロンプトは清潔で整えたままにしてください。推奨プロンプト長さ:<75トークン。

推奨:

  1. CFG:4-7(高めにするとやや解剖学的正確さが向上)

  2. サンプラー:Euler A @ 25ステップ

  3. 解像度:768 - 1792(超ワイドのみ)、ステップごとに+32

  4. DanTagGen を使用

    • 温度を低めに設定(<1)

    • 禁止語:sketch, comic, flat color, .*official.*, .*boy.*, mecha, no humans, text, pixel art, speech bubble

    • タグ合計長さ:短く

  5. Hires.Fix を使用

    • アップスケーラー:DATx2

    • ノイズ除去:0.4-0.5

  6. ADetailer を使用

  7. 典型的な色を生成したい場合、色調を最初に指定してください。

違い:

ベースモデルを KohakuΔ rev1に切り替えました。

理由

  • AniXL が使用していた審美性評価は、セルロイドアートスタイルには対応しておらず、AniXL の品質/否定タグは容易すぎて、ときにクリーンで細いラインを描くのに逆効果です。また、AniXL は一部のキャラクターに対して過学習しているようです。

  • 👆正直、AniXL3.1 には同じ訓練方法をまだ適用していません。最終的な訓練設定で改善できるかもしれません。

  • 一方、KohakuΔ は未学習状態であるため、柔軟性が高く、微調整されたアートスタイルに親和性があります。

  • AniXL3.1 のようにタグをつける方法はわかりませんが、KohakuΔ のようにタグをつける方法はわかります。なぜなら、Hakubooru から同じデータセットを入手できるからです。

より良い一般化および水平構成

  • KohakuΔ rev1 は解剖学と構成に優れていません。トレーニング時間が不足しているためです(デュアル 3090 でも、それ以上を期待するのは無理です)。

  • 正則化により、この微調整は改善をもたらしました(特に水平画像)。しかし正直に言いますが、BAXLv3-Δ は非常に簡単に手や余分な脚を生成してしまいます。プロンプトに問題がある(長すぎる/意味の重複/タグの順序が不適切)ほど悪化します。

正則化/データセット更新

  • 正則化 Danbooru データセット、クラストークン=solo:

    • 1000枚以上の水平画像

      • お気に入り数 > 30

      • タグ: "1girl, solo"

    • 1000枚以上の垂直画像

      • お気に入り数 > 30

      • タグ: "1girl, solo"

      • セルロイドアートスタイルおよびBAアートスタイルの模倣者であるアーティスト

  • データセットを0068イベントのCGに更新。5th PVのスクリーンショットを含む。

訓練詳細:

  • 画像数:重複なしで574枚

  • min_bucket_reso = 256

  • max_bucket_reso = 4096

  • bucket_reso_steps = 32

  • train_batch_size = 2

  • gradient_accumulation_steps = 32

  • learning_rate = 7.5e-6(Unetのみ)

  • lr_scheduler = "constant_with_warmup"

  • lr_warmup_steps = 100

  • optimizer_type = "Lion8bit"

  • min_snr_gamma = 5

  • バッチサイズ = 2

  • mixed_precision = "fp16"

  • full_fp16 = true

  • optimizer_args = ["weight_decay=0.1", "betas=0.9,0.95"]

  • shuffle_caption = true

  • weighted_captions = false

  • keep_tokens = 0

  • caption_tag_dropout_rate = 0.1

既知の問題:

  • halo / heterochromia / .*focus.* は一部の状況で過学習しているようです。否定タグに含めることで改善できます。

  • 背景が安定しておらず、simple background, white background と入力しても不要なものが描かれてしまう傾向があります。

ライセンスおよび免責事項

  • ライセンス

    Fair AI Public License 1.0-SD

  • 免責事項

    Blue ArchiveのファンアートガイドラインJP | CN)によると、このモデルはいかなる商業利用にも使用しないでください。モデルまたはモデルのマージ版の販売、このモデルまたはそのマージ版で生成された画像の販売、またはPatreon/Fanboxなどの収益化プラットフォームにおける「有料会員限定」サービスなども含まれます。

===========XLv2 INFO===========

TL; DR:

Animagine XL V3 をベースに、Blue Archiveの公式アートを微調整データセットとして使用しています。このモデルをいかなる商業利用にも使用することは禁止されています。このモデルを使用する前に以下の免責事項をお読みください。

使い方:

  • 推奨プロンプト順序:

    • キャラクター名、1girl、他のタグ、品質タグ
  • 推奨品質タグ(他の品質タグは削除してください):

    • flat_coating clear_color highres absurdres best_quality

    • 汎用画像を生成する場合、masterpieceは使用しないでください。フラットコーティングが損なわれます。

  • 推奨否定タグ:

    • nsfw, lowres, worst quality, low quality, bad perspective, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, artist name

    • 否定プロンプトに blurry を使用しないでください

  • 推奨解像度:A3XLと同様ですが、垂直は1600x900まで、水平はより低めに制限。

    • 高解像度 = BAスタイルに近づく

    • CFG 5、Euler A、ステップ25

  • このモデルをAnimagine XL V3のように扱ってください。すべてのタグは同じ方法で動作します。

  • Animagine XL V3に基づくLoRAは正常に動作します。

  • 推奨アップスケーラー:AnimeVideo v3

  • 色調トレーニングはされていません。

  • フィードバックを歓迎します。今後の開発にご提案をお願いします。

免責事項:

Animagine XL V3 のライセンスでは、このモデルのマージ版は同じ許可条件で公開することが求められています。つまり、ユーザーが生成サービスを利用したり、生成された画像を販売することが許可されています。

しかし、Blue ArchiveのファンアートガイドラインJP | CN)によると、このモデル(BArtstyle)はいかなる商業利用にも使用しないでください。モデルまたはそのマージ版の販売、生成された画像の販売、またはPatreon/Fanboxなどの収益化プラットフォームにおける「有料会員限定」サービスも含まれます。

このモデルのライセンス変更は、Animagine XLの作者であるCagliostro Research Labの許可を得ています。改めて、彼らの理解とオープンソースコミュニティへの貢献に心より感謝いたします。許可の出典

免责声明:

根据 Animagine XL V3 的许可证,基于该模型的衍生模型应以相同授权方式公开,即允许用户使用线上生成服务,或售卖该模型生成的图片。

但根据《<蔚蓝档案>同人创作指引》 ( 日文 | 中文 ),此模型(BArtstyle)**不得用于任何形式的商业用途,**包括但不限于售卖该模型及其衍生模型自身或其生成的图片,或Patreon/Fanbox等众筹平台的“订阅会员限定”服务。

该许可证授权范围变更得到 Animagine XL 作者 Cagliostro Research Lab 的许可。

在这里再次感谢他们的理解,以及他们对于开源社区的贡献。(授权来源

===========XLv1 INFO===========

使い方:

このモデルはアルファ段階であり、ほとんど未学習の状態で、Blue Archiveのキャラクターにのみ完璧に機能します。

  • このモデルをAnimagine XL V3のように扱ってください。すべてのタグは同じ方法で動作します。

  • Animagine XL V3に基づくLoRAは正常に動作します。

  • 推奨アップスケーラー:AnimeVideo v3

  • BArtstyleDBv1 と同様に色タグで訓練されていますが、効果はそれほど高くありません。

  • フィードバックを歓迎します。今後の開発にご提案をお願いします。

訓練詳細:

AdamW8bit

1024x1024の画像200枚

バッチサイズ1で200エポック

UNET:1E-5

TE1/TE2:5E-6

15回リスタートのコサイン

===========DBv1 INFO===========

使い方:

  • 肯定的プロンプト:

    • BArtstyle LoRA と同様に、色調は引き続き機能します。また、blue themepink theme などの代表的な色を、過学習せずに元のデータに近づけることに成功しました。

    • 自然言語 + 低CFG(4.5-6)+ ダイスロール + 精選 > 「品質タグ」

    • 私のテストでは、約30%の画像は最初の見た目で十分に良くなります。類似の結果が得られない場合、プロンプトに重複または矛盾するタグがないか確認し、短縮してCFGを下げてください。

  • 否定的プロンプト:

    • 自分が何をしているのかわからない限り、絶対に長い否定プロンプトを使用しないでください!!!

    • ランダム生成には、シンプルなEasyNegativeV2で十分です。

    • このモデルが依然として过多なCounterFeitアートスタイルを含んでいると感じた場合は、否定プロンプトに glowing, 3d, painting \(medium\), photorealistic, nsfw を追加してみてください。ただし、効果は保証できません。

  • VAE: WD1-4-kl-f8-anime2-bless09.ckpt

  • サンプラー: Euler A

    • ステップ:50-100

    • はい、CHADのEuler Aは、純粋なDPMより優れています。

  • アップスケーラー: AnimeVideo v3

    • ステップ:10-15

    • ノイズ除去:0.45-0.55

ベースモデル:

  • Counterfeit V3-fp16-fix

    • 6ヶ月の待機の末、作者がCFv3のVAE修正版をリリースしました。元のバージョンには深刻なVAEバグがあり、CFv3のすべてのLoRAが壊れていました。VAEを交換しても効果がありません。使用している場合は、必ずアップデートしてください。

    • これはNAI 1.0 LoRAと互換性がある唯一のトレーニングモデルであるようです。つまり、微調整にこのモデルのみが適しています。

データセット:

  • Blue Archiveの公式アートから200枚(フリップ含む)、合計400枚。

    • BArtstyle LoRAと比較して、データセットを完全に刷新しました。

    • 取得可能な最高解像度の画像を使用し、品質向上のためにトリミングしました。

    • XnConvertで1280x1280にダウンスケール。

訓練設定:

  • オプティマイザー: AdamW8bit

  • スケジューラ: ウォームアップ付き定数

    • ウォームアップ:総ステップの10%
  • UNET LR: 1e-6

  • TE LR: 1.25-7

    • 提案:UNET LRの1/8

    • 総ステップの50%でTEトレーニングを停止。

  • エポック: 100

  • バッチサイズ: 1

  • ステップ: 40000

  • 解像度: 1280x1280

  • 所要時間: 10時間27分

このモデルで生成された画像

画像が見つかりません。