AlbedoBase XL
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
モデルに価値を見出した場合は、ご支援を検討してください。あなたの寄付は、すべてSDXLコミュニティの発展に役立てられます。
🙋🏼♂️ 私たちとつながる(discord) ㅤ|ㅤ 🛒 購入ㅤ |ㅤ 🌱 寄付
AlbedoBase XL (SFW&NSFW)
リファイナーは不要で、VAEは含まれています。
目標
Stable Diffusion XLは35億パラメーター(リファイナーを除く)を有し、SD v1.5版の約3.6倍です。これは単なる数字ではなく、パフォーマンスの大幅な向上をもたらす可能性のある数字であると私は信じています。
SD v1.5の全体的なパフォーマンスが、私たちのコミュニティの爆発的な貢献により想像を絶するほど向上したことに気づいてから、もう時間が経ちました。そのため、私はこのXL版においても、v1.5で実現されたパフォーマンス向上を最適に再現できるよう、AlbedoBase XLモデルの完成に取り組んでいます。
私の目標は、Civitaiに公開されているすべてのチェックポイントとLoRAのパフォーマンスを直接テストし、複数のフィルターを通過して最適と判断されたリソースのみをマージすることです。これにより、Midjourneyなどの企業が開発する画像生成AIの性能を凌駕します。
現在、AlbedoBase XL v3.1 Largeは、約200の選別されたチェックポイントと251のLoRAをマージしています。
ログ
v3.1-Large
• V3で使用した再帰的スクリプトを用いて、SDXLモデルの50以上を選別した最新バージョンをマージしました。
スペックグリッド(370.7 MB):ダウンロード


v3-mini
長くお待たせしてしまい、心よりお詫び申し上げます。
個人的な事情に加え、新しいバージョンの開発中に健康面での問題にも直面しました。この文章を書きながらも、私はまだこれらの困難に立ち向かっています。
簡潔な更新だけではなく、より詳細なメッセージを共有することで、皆さんのご理解を深めたいと考えました。
v2.0のリリース以来、私はディープラーニングを独学で研究してきました。私は正式な学位を持たず、プログラミングへの僅かな適性以外は芸術的な背景しかありません。そのため、これまで費やした時間と労力にもかかわらず、大きなブレイクスルーを達成するための数学的・科学的基盤が不足しています。それでも、この自己主導の学習と研究に没頭した経験は、私の人生におけるかけがえのない宝物でした。
最近、私は大きなブレイクスルーにつながる可能性のあるアイデアにたどり着きました。v2.0以来、数百の数式と手法を再構築し、非常に興味深く成功したアルゴリズムを開発しました。モデルのマージプロセスは、SDXL1.0とSD1.5、そして他の厳選されたモデルを基盤にし、「ANIME」「REALISM」「ARTISTIC」「NSFW」「BASE」の5つの主要カテゴリに分類して、データセットとしてアルゴリズムに投入しました。このアプローチにより、いくつかの驚異的な成果が得られました。
しかし、アルゴリズムの開発ほど困難だったのは、パフォーマンステストの段階でした。この期間中、私の身体的・精神的健康は著しく悪化し、この作業を一人で続けるのが不可能であることに気づきました。それが、このバージョンをリリースすることを決断した直接的な理由です。
そして今、待ち望まれていたAlbedoBaseXL V3 Miniのリリースをお知らせできることを、心から嬉しく思います。このモデルは規模が小さいマージですが、特定の分野に限定されず、さまざまな分野で驚異的な性能を発揮します。SDXL1.0の新基盤モデルとして機能する可能性があります。(参考までに、私のマージアルゴリズムは「線形マージ」ではなく、本質的には新しいファインチューニングモデルと見なすことができます。)

このモデルは、既存のAlbedoBaseモデルと併せて、あらゆる面で以前のバージョンを上回る汎用性を有しています。(NSFWコンテンツは過度ではありませんが、v2.1のような以前のバージョンと比較して、より広範な表現を可能にしています。将来的には専用のNSFWマージモデルをリリースする予定です。)
また、最近多くの共有モデルが、マージや外部商業利用を禁止するライセンスを採用し始めたことに気づきました。これは非常に残念であり、私がマージに使用できる優れたモデルの一部を排除することにつながりました。
私は、高品質なモデル(多大な時間と労力の結晶)をマージに利用できるよう、無料ライセンスを提供してくれたモデル開発者たちに、心からの感謝を申し上げます。
もう少しで戻ってきます。
ANIME、REALISM、ARTISTIC、2.5D、3D、NSFWなど、幅広い分野での性能検証を、皆さんのご協力をお待ちしています。
モデル開発者として、私たちが植えるのは種にすぎません。最終的に、それらを育て、花と実を結ばせるのは、あなた方、ユーザーとアーティストたちです。
いつもありがとうございます。
ご支援として少額の金銭的寄付をご検討いただける方は、以下のリンクをご利用ください。現在、私は職に就けず、将来の生活について不安を抱えています。
スペックグリッド(380.5 MB):ダウンロード


v2.1
新しいマージアルゴリズムと式を用いて、v0.1からv2.0を再マージ・調整しました。

スペックグリッド(424.5 MB):ダウンロード

v2.0
AlbedoBase XL Preの開発に協力してくれた皆様、心より感謝申し上げます。皆さんがいなければ、リリースはさらに遅れていたでしょう。本当にありがとうございます!

既存のAlbedoBase XLモデルを1つに収束させるためのカスタムスクリプトを作成しました。独自の式に基づき、すべてのU-NETおよびCLIPブロックの行と列の重みを精密に整列しました。
画像生成時にバグ(何も生成されない)に遭遇した場合、CLIP SKIPを2に変更するか、プロンプトを少し変更してください!CLIPが認識できないプロンプトの組み合わせが存在する可能性があります。その場合、語順を変更したり、別の単語を使用したり、最も簡単な方法としてCLIP SKIPを変更してください。今後、v1.3のようにこれらの問題を段階的に解決していきます。
スペックグリッド(403.5 MB):ダウンロード
v1.3
モデルのランダム性に伴う品質を示すため、サンプリング用のすべてのショーケース画像についてシード値を固定し、「9」に設定して即時生成を行いました。
特にこのバージョンでは、ネガティブプロンプトの影響が非常に大きいため、ネガティブプロンプト欄を空にすると、より良い品質が得られる可能性が高いです。
スペックグリッド(438.7 MB):ダウンロード

ご覧の通り、ステップ数が増えると、すべてのサンプラーで利用可能になり、品質も向上します。
以下で説明する私が開発・マージしたLoRAの効果により、タグ(単語リスト)形式のプロンプトよりも文形式のプロンプトを使用することが、品質の向上に直結します。
45のチェックポイントと7つのLoRAをマージしました。その後、v0.4とv0.3を順次、0〜5%未満の割合でマージし、古くなってしまった希釈されたマージモデルを再活性化しました。
7つのLoRAのうち1つは私が作成したものです。これは、GPT4-Vを用いて合計174枚の高品質な写真のキャプションを分析・アノテートしたものです。このLoRAをマージした結果、驚異的に鮮明な画像と、プロンプトに対する圧倒的に優れた理解力が実現しました。

- 私の自作LoRAは、Ko-fiのCreativeレベル以上の支援者にのみ提供しています。
_
v1.2_
- 最新の22のチェックポイントをマージしました。
スペックグリッド(565.6 MB):ダウンロード
v1.1
安定化しました。
より詳細になりました。
上級ユーザーだと感じる方は、v1.0をお勧めします。v1.0が適切な設定を見つければ、はるかに鮮やかな作品を生成できます。
スペックグリッド(349.7 MB):ダウンロード
v1.0
106のLoRAをマージしました。
19のチェックポイントをマージしました。
モデルは選択した設定によって異なる結果を生み出すため、使用前に必ずスペックグリッドを確認してください。
- 特定のネガティブプロンプトを使用することで、対称性のない目やピクセル化された画像の問題を解決できることがわかりました。スペックグリッドはCPUやGPUのデバイスによって異なる場合がありますので、あくまで一般的な参考としてご利用ください。品質を向上させるために、いくつかのネガティブプロンプトを試してみてください(例:斜視)。マージされたLoRAの数が増えるほど、すべての設定を均等に満足させるのは難しくなります。しかし、v1.0では、適切な設定で多様な面で驚異的な品質の作品を生成できるというこの利点に注目してください。今後、より安定したバージョンを提供します。
ショーケースや他のユーザーの検索結果から、役立つ設定値を見つけることができます。
いつも通り、最高の結果を得るにはネガティブプロンプトを空にすることをお勧めします。
このv1.0の開発には多大な労力を費やしたため、少し休憩を取ります。モデルをお楽しみいただき、マージした場合は、Civitaiに無料で共有してください。それにより、私たち全員でモデルをさらに改善できます。
スペックグリッド(479.4 MB):ダウンロード
v0.4
132のLoRAをマージしました。
4のチェックポイントをマージしました。
スペックグリッド:ダウンロード
v0.3
すべてのサンプラーで改善されました。
生き生きとしたリアリズムを実現しました。
安定化しました。
スペックグリッド:ダウンロード
v0.2
クリアさとディテールが大幅に向上しました。
手と足の再現が改善されました。
美的要素が大幅に向上:構図、抽象化、流れ、光と色など。
v0.1
SDXL1.0モデルに対して適切なファインチューニングを施し、Civitaiで公開されている40以上の高品質モデルを丁寧かつ意図的にマージしました。
テストでは、最小限のプロンプトトークンで最大の品質を確保することに重点を置いており、多数のトークンを使用した場合の品質向上の程度は確認されていません。(各自でテストを行い、結果を共有してください)
通常、リアリズムとアニメーションの中間点で最も美しい結果が得られます。
しかし、適切なプロンプトを使用すれば、表現できないものはほとんどありません。(私は、他のモデルを上回るマージ用の基盤モデルとして、このv0.1に豊かな価値があると断言します。ただし、現在はv0.1であることをご理解ください)




















