saratoga/サラトガ/萨拉托加 (Azur Lane)
詳細
ファイルをダウンロード
モデル説明
- このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!
- 関連するトリガー単語は参考用であり、場合によって調整が必要な場合があります。
- 埋め込みモデルの推奨ウェイトは1です。これにより更高精度が得られます。より一般的な汎化が必要な場合は、0.5に下げることができます。
- LoRAモデルの推奨ウェイトは0.85です。汚染の兆候がある場合は、0.5に下げることを検討してください。
- プレビュー画像は、いくつかの固定テストプロンプトと、クラスタリングによって導出された複数のプロンプトを使用して生成されました。ランダムシードが使用されており、選択的かつ意図的な画像の抽出は行っていません。表示されたものが、そのまま出力されます。
- 衣装用の特別なトレーニングは行っていません。衣装に対応するプロンプトについては、提供されたプレビュー投稿を参照してください。
このモデルの使用方法
このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、saratoga_azurlane.ptとsaratoga_azurlane.safetensorsの両方をダウンロードし、saratoga_azurlane.ptをテクスチャ反転埋め込みとして、saratoga_azurlane.safetensorsをLoRAとして同時に使用してください。
このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、saratoga_azurlane.ptとsaratoga_azurlane.safetensorsの両方をダウンロードし、saratoga_azurlane.ptをテクスチャ反転埋め込みとして、同時にsaratoga_azurlane.safetensorsをLoRAとして使用してください。
このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、saratoga_azurlane.ptとsaratoga_azurlane.safetensorsの両方をダウンロードし、saratoga_azurlane.ptをテクスチャ反転埋め込みとして、同時にsaratoga_azurlane.safetensorsをLoRAとして使用してください。
このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、saratoga_azurlane.ptとsaratoga_azurlane.safetensorsの両方をダウンロードし、saratoga_azurlane.ptをテクスチャ反転埋め込みとして、同時にsaratoga_azurlane.safetensorsをLoRAとして使用してください。
トリガー語はsaratoga_azurlaneであり、推奨タグはbest quality, masterpiece, highres, solo, {saratoga_azurlane:1.15}, pink_hair, purple_eyes, ahoge, blush, smile, twintails, ribbon, bangs, bow, long_hair, hairband, open_mouth, hair_ribbon, breasts, hair_between_eyes, hair_bowです。
このモデルのトレーニング方法
このモデルは、HCP-Diffusion を使用してトレーニングされています。自動トレーニングフレームワークは、DeepGHS Team によって維持されています。
なぜ一部のプレビュー画像がSaratoga Azurlaneのように見えないのか
プレビュー画像に使用されたすべてのプロンプトテキスト(画像をクリックすると確認できます)は、トレーニングデータセットから抽出された特徴情報を基に、クラスタリングアルゴリズムによって自動生成されています。画像生成に使用されたシードもランダムに生成されており、画像の選択や修正は一切行っていません。そのため、このような問題が発生する可能性があります。
実際の使用においては、私たちの内部テストによると、このように問題が生じるモデルの多くは、プレビュー画像よりも実際の使用時により良い結果を出力します。あなたが行う必要があるのは、使用しているタグを調整することだけです。
このモデルが過学習または過小学習しているように感じますが、どうすればよいですか?
当モデルはHugging Faceリポジトリ - CyberHarem/saratoga_azurlane_ に公開されており、すべてのステップのモデルが保存されています。また、トレーニングデータセットはHugging Faceデータセット - CyberHarem/saratogaazurlane にも公開しており、参考になる可能性があります。
なぜより良い画像だけを選んで使用しないのですか?
当モデルのデータ収集からトレーニング、プレビュー画像の生成、公開に至るまでの全プロセスは、人間の介入なしに100%自動化されています。これは私たちのチームが行った興味深い実験であり、この目的のためにデータフィルタリング、自動トレーニング、自動公開を含む一連のソフトウェア基盤を開発しました。そのため、可能であれば、より多くのフィードバックや提案をいただけると大変ありがたいです。これらは私たちにとって非常に貴重です。
なぜ望むキャラクターの衣装が正確に生成できないのですか?
現在のトレーニングデータは、さまざまな画像サイトから収集しており、完全自動化パイプラインでは、キャラクターがどの公式画像を持っているかを正確に予測することが困難です。そのため、衣装の生成はトレーニングデータセットのラベルを基にクラスタリングを行い、可能な限り最適な再現を目指しています。この課題は今後も対処・最適化を続けていきますが、完全に解決することは難しいままです。衣装の再現精度は、手動でトレーニングされたモデルと同等のレベルには到達しにくいでしょう。
実際、このモデルの最大の強みは、キャラクター自身の内在的特性の再現力と、より大規模なデータセットによる比較的優れた汎化能力にあります。そのため、このモデルは衣装の変更、ポーズの変更、そしてもちろんキャラクターのNSFW画像の生成といったタスクに非常に適しています!😉
以下のグループの方々には、このモデルの利用をお勧めしません。ご容赦ください:
- キャラクターの元のデザインに、些細なことでも一切の逸脱を許容できない方。
- キャラクターの衣装再現に高度な正確性が求められる使用シーンに直面している方。
- Stable Diffusionアルゴリズムに基づくAI生成画像の可能性のあるランダム性を受け入れられない方。
- LoRAによるキャラクターモデルの完全自動トレーニングプロセスに不快感を覚える方、あるいはキャラクターモデルのトレーニングは手動操作のみで行わなければキャラクターを不敬にあたると考える方。
- 生成された画像内容が自身の価値観に反すると感じる方。
