hyperfusion SDXL DoRA 600k images

詳細

モデル説明

このDoRAは、超大型のアニメキャラクター60万枚の画像で学習されました。主に胸・お尻・腹部・太もも・脂肪に焦点を当てています。このデータセットは、より大きなhyperfusionデータセットのサブセットですが、体型・サイズに関連する画像のみにフィルターされています。フルデータセットをSDXLで学習するには1年以上かかっていたでしょう、笑。

推奨事項

  • DoRA/LoRAの強度:1.0(現在、ほとんどのWebUIでDoRAは動作します)

  • 解像度:約1024px

  • サンプラー:PonyXLがサポートする任意のサンプラー

  • v10では、v9よりもLoRAの重みをさらに上げることができます。もしコンセプトが期望するほどうまく動作しない場合は、それを試してください。

hyperfusionで使用された140万個のカスタムタグを以下にアップロードしました:https://huggingface.co/datasets/thojm/hyperfusion_classified_tags_export(ご自身のデータセットへの統合用)

v10 Noob_vpred リリース 2025/07/29

  • 皆さんは私が消えたと思った?いや、ただただテキストエンコーダーを固定したままモデルを7ヶ月間学習し続けただけです。

  • この新しいDoRAは、これまでおなじみのコンセプトに加え、いつも通りいくつかの新しいコンセプトが追加されています。また、v9より20万枚多くの画像で学習されています。

  • このバージョンはNoobAI_Vpredで学習されているため、他のモデルとの互換性は保証されません。特にv_predでないモデルでは動作しない可能性が高いです。

  • テキストエンコーダーを固定したまま学習を最後にもう一度試してみたかったのです。そして、どれだけ時間がかかってもそれに固執することに決めました。今ではっきり言えますが、今後のモデルでは時間のためだけにテキストエンコーダーを含めるつもりです。動作はしますが、私の環境ではあまりにも遅すぎます。

  • 新しいタグリストを完成させるまで、v9のタグリストをそのまま使ってください。新しいコンセプトは少ないためです。

  • このバージョンはv9_sdxlよりもコンセプトの扱いが少し改善されており、勾配爆発にもより耐性があります。

v9 Pony リリース

  • このモデルは2ヶ月以上学習してきましたが、Fluxがリリースされたため、GPUを解放するために現在の進捗をリリースすることにしました。技術的には、もっと長く学習させるべきでしたが、私は根気がないし、皆さんの多くも待ちくたびれているでしょう。

  • タグはSD1用のv8リリースとほぼ同じで、blobコンテンツなどいくつかの新規追加があります。詳細は「Training Data」のtag.csvを参照してください。

  • Ponyは学習が少し難しいため、このモデルではさまざまな実験を行いました。そのため、DoRAの強度は1.0近くに保つことを推奨します。1.1を超えると大抵爆発します。(Ponyで学習するにはscale_weight_normsのような重み正則化が重要です)

  • 学習時間を合理化するため、最初は768x768の解像度で学習し、最終的に1024pxで完了させるつもりでした。しかしFluxが発生しました。それでも結果は十分に妥当です。

私は時々計画と進捗をここに掲載しています。

変更履歴記事リンク

このモデルで生成された画像

画像が見つかりません。