tashkent/タシュケント/塔什干 (Azur Lane)
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
- このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!
- 関連するトリガーワードは参考用であり、状況によって調整が必要な場合があります。
- エンベディングモデルの推奨ウェイトは1です。これにより高忠実度が得られます。より一般的な汎化が必要な場合は、0.5に下げることができます。
- LoRAモデルの推奨ウェイトは0.85です。汚染の兆候が見られる場合は、0.5に下げることを検討してください。
- プレビュー画像は、いくつかの固定テストプロンプトと、クラスタリング手法で抽出したデータセットの特徴から導出した複数のプロンプトを使用して生成されました。ランダムなシードが使用されており、選択的なピックアップは行っていません。表示されたものがそのまま得られる結果です。
- 衣装のための特別なトレーニングは行っていません。提供されているプレビュー投稿を確認することで、衣装に対応するプロンプトを確認できます。
このモデルの使用方法
このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、tashkent_azurlane.ptとtashkent_azurlane.safetensorsの両方をダウンロードし、tashkent_azurlane.ptをテクスチャ反転埋め込みとして、tashkent_azurlane.safetensorsをLoRAとして同時に使用してください。
このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、tashkent_azurlane.ptとtashkent_azurlane.safetensorsの両方をダウンロードし、tashkent_azurlane.ptをテクスチャ反転埋め込みとして、tashkent_azurlane.safetensorsをLoRAとして同時に使用してください。
このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、tashkent_azurlane.ptとtashkent_azurlane.safetensorsの両方をダウンロードし、tashkent_azurlane.ptをテクスチャ反転埋め込みとして、tashkent_azurlane.safetensorsをLoRAとして同時に使用してください。
このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、tashkent_azurlane.ptとtashkent_azurlane.safetensorsの両方をダウンロードし、tashkent_azurlane.ptをテクスチャ反転埋め込みとして、tashkent_azurlane.safetensorsをLoRAとして同時に使用してください。
トリガーワードは tashkent_azurlane であり、推奨タグは best quality, masterpiece, highres, solo, {tashkent_azurlane:1.15}, long_hair, purple_hair, blue_eyes, blush, bangs, animal_ears, very_long_hair, fake_animal_ears, ribbon, hair_ribbon, hair_ornament です。
このモデルのトレーニング方法
このモデルは HCP-Diffusion を使用してトレーニングされています。自動トレーニングフレームワークは DeepGHS Team によって維持されています。
一部のプレビュー画像がTashkent Azurlaneのように見えない理由
プレビュー画像に使用されたすべてのプロンプトテキスト(画像をクリックすると確認できます)は、トレーニングデータセットから抽出した特徴情報を基にしたクラスタリングアルゴリズムによって自動生成されています。画像生成時に使用されるシードもランダムに生成されており、画像には選択や修正は一切加えられていません。そのため、このような問題が発生する可能性があります。
実際の運用では、内部テストに基づくと、このような問題を抱えるモデルの多くは、プレビュー画像で見られるよりも実際の使用時に優れたパフォーマンスを発揮します。必要なのは、使用しているタグの調整だけです。
このモデルが過学習または不足学習しているように感じますが、どうすればよいですか?
当モデルは huggingfaceリポジトリ - CyberHarem/tashkent_azurlane_ に公開されており、すべてのステップのモデルが保存されています。また、トレーニングデータセットは huggingfaceデータセット - CyberHarem/tashkentazurlane にも公開しており、参考になるかもしれません。
なぜより良い画像だけを使用しないのですか?
このモデルのデータ収集からトレーニング、プレビュー画像の生成、公開に至るまで、すべてのプロセスは人間の介入なしに100%自動化されています。これは私たちのチームが行った興味深い実験であり、この目的のためにデータフィルタリング、自動トレーニング、自動公開を含む一連のソフトウェア基盤を開発しています。そのため、可能であれば、フィードバックや提案をぜひお寄せください。これらは私たちにとって非常に貴重です。
望ましいキャラクターの衣装が正確に生成できない理由
現在のトレーニングデータは、さまざまな画像サイトから取得されており、完全に自動化されたパイプラインでは、キャラクターがどの公式画像を持つのかを正確に予測することが困難です。したがって、衣装の生成は、トレーニングデータセットのラベルを基にしたクラスタリングによって、可能な限り最適な再現を試みています。この問題を継続的に改善し、最適化を図っていきますが、完全に解決することは難しい課題です。衣装の再現精度は、手動でトレーニングされたモデルのレベルには達しない可能性が高いです。
実際、このモデルの最大の強みは、キャラクター自体の本質的特徴の再現と、より大きなデータセットによる比較的優れた汎化能力にあります。そのため、このモデルは、衣装の変更、キャラクターのポーズ調整、そしてもちろん、キャラクターのNSFW画像の生成に最適です!😉
以下のグループに対しては、このモデルの使用をお勧めせず、お詫び申し上げます:
- キャラクターのデザインに、些細な差異であっても許容できない方。
- キャラクターの衣装の再現精度に高い要件がある方。
- Stable Diffusionアルゴリズムに基づくAI生成画像の潜在的なランダム性を受け入れられない方。
- LoRAを使用したキャラクターモデルの完全自動化トレーニングプロセスに不快感を覚える方、あるいはキャラクターモデルのトレーニングは手動で行わなければキャラクターを冒涜するという考えをお持ちの方。
- 生成された画像コンテンツが自身の価値観に反すると感じる方。

