patchouli_knowledge/パチュリー・ノーレッジ/파츄리널릿지 (Touhou)

詳細

ファイルをダウンロード

モデル説明

  • このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!
  • 関連するトリガー語は参考用です。場合によっては調整が必要な場合があります。
  • 埋め込みモデルの推奨ウェイトは1です。これにより高忠実度が得られます。より一般的な汎化が必要な場合は、0.5に下げることができます。
  • LoRAモデルの推奨ウェイトは0.85です。汚染の兆候が見られる場合は、0.5に下げることを検討してください。
  • プレビュー画像は、いくつかの固定テストプロンプトと、クラスタリングデータセットの特徴から導出された複数のプロンプトを使用して生成されました。ランダムなシードが使用されており、選択的な取り扱いは行っていません。表示されたものが得られるものです。
  • 衣装用の特別なトレーニングは行っていません。衣装に対応するプロンプトについては、提供されたプレビューポストをご確認ください。

このモデルの使用方法

このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、patchouli_knowledge_touhou.ptpatchouli_knowledge_touhou.safetensorsの両方をダウンロードし、patchouli_knowledge_touhou.ptをテクスチャ反転埋め込みとして、同時にpatchouli_knowledge_touhou.safetensorsをLoRAとして使用してください

このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、patchouli_knowledge_touhou.ptpatchouli_knowledge_touhou.safetensorsの両方をダウンロードし、patchouli_knowledge_touhou.ptをテクスチャ反転埋め込みとして、同時にpatchouli_knowledge_touhou.safetensorsをLoRAとして使用してください。

このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、patchouli_knowledge_touhou.ptpatchouli_knowledge_touhou.safetensorsの両方をダウンロードし、patchouli_knowledge_touhou.ptをテクスチャ反転埋め込みとして、同時にpatchouli_knowledge_touhou.safetensorsをLoRAとして使用してください。

このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、patchouli_knowledge_touhou.ptpatchouli_knowledge_touhou.safetensorsの両方をダウンロードし、patchouli_knowledge_touhou.ptをテクスチャ反転埋め込みとして、同時にpatchouli_knowledge_touhou.safetensorsをLoRAとして使用してください。

トリガー語はpatchouli_knowledge_touhouで、推奨タグはbest quality, masterpiece, highres, solo, {patchouli_knowledge_touhou:1.15}, long_hair, purple_hair, crescent, purple_eyes, ribbon, hat, bow, bangs, mob_cap, hat_ornament, crescent_hat_ornament, hair_bow, red_bow, blue_bow, upper_body, book, red_ribbon, capelet, hat_ribbon, striped, very_long_hairです。

このモデルのトレーニング方法

このモデルはHCP-Diffusionを用いてトレーニングされています。自動トレーニングフレームワークはDeepGHSチームが維持しています。

一部のプレビュー画像がパチウリ・ノーリッジ・トウホウのように見えない理由

プレビュー画像で使用されたすべてのプロンプトテキスト(画像をクリックすることで確認できます)は、トレーニングデータセットから抽出された特徴情報に基づいてクラスタリングアルゴリズムによって自動生成されています。画像生成時に使用されたシードもランダムに生成されており、画像には選別や修正は一切行っていません。その結果、上記のような問題が発生する可能性があります。

実際の運用では、私たちの内部テストによると、このような問題を抱えるモデルの多くは、プレビュー画像で見られる以上のパフォーマンスを実際の使用で発揮します。必要なのは、使用しているタグの調整だけです

このモデルが過学習または不足学習しているように感じますが、どうすればよいですか?

当モデルはHugging Faceリポジトリ - CyberHarem/patchouli_knowledge_touhouに公開されており、すべてのステップのモデルが保存されています。また、トレーニングデータセットもHugging Faceデータセット - CyberHarem/patchouli_knowledge_touhouに公開しており、参考になる可能性があります。

なぜより選別された画像だけを使用しないのですか?

当モデルのデータ収集からトレーニング、プレビュー画像の生成、公開に至るまでの全プロセスは人間の介入なしに100%自動化されています。これは私たちのチームが行った興味深い実験であり、そのためデータフィルタリング、自動トレーニング、自動公開を含む一連のソフトウェアインフラを構築しました。したがって、可能であれば、より多くのフィードバックや提案をお待ちしています。これらは私たちにとって非常に貴重です。

期待されるキャラクターの衣装を正確に生成できないのはなぜですか?

現在のトレーニングデータは様々な画像サイトから取得しており、完全な自動化パイプラインでは、キャラクターがどの公式画像を持っているかを正確に予測することが困難です。そのため、衣装の生成はトレーニングデータセットのラベルに基づいてクラスタリングを行い、可能な限り最良の再現を試みています。この問題は引き続き対処し、最適化を試みますが、完全に解決するのは難しい課題です。衣装の再現精度は、手動でトレーニングされたモデルのレベルに達することは難しいでしょう。

実際、このモデルの最大の強みは、キャラクター自体の内在的特徴の再現と、より広大なデータセットによる比較的高い汎化能力です。したがって、このモデルは衣装の変更、キャラクターのポーズ設定、そしてもちろんキャラクターのNSFW画像生成などに適しています!😉

以下のグループについては、このモデルの使用をお勧めせず、お詫び申し上げます:

  1. キャラクターのデザインのわずかな違いにも耐えられない方。
  2. キャラクターの衣装再現に高い精度が求められる使用シーンに直面している方。
  3. Stable Diffusionアルゴリズムに基づくAI生成画像の可能性のあるランダム性を受け入れられない方。
  4. LoRAによるキャラクターモデルの完全自動トレーニングプロセスに不快感を覚える方、またはキャラクターモデルのトレーニングは手動で行わなければキャラクターに対する不敬であると信じる方。
  5. 生成された画像の内容が自身の価値観に反すると感じる方。

このモデルで生成された画像

画像が見つかりません。