Ruby (Oshi no Ko)

詳細

ファイルをダウンロード

モデル説明

  • このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!
  • 関連するトリガーワードは参考用であり、場合によって調整が必要になることがあります
  • エンベディングモデルの推奨ウェイトは1です。これはより高い忠実度を提供します。より一般的な汎化が必要な場合は、0.5に下げることができます。
  • LoRAモデルの推奨ウェイトは0.85です。汚染の兆候がある場合は、0.5に下げることを検討してください。

このモデルの使用方法

このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、ruby_oshinoko.ptruby_oshinoko.safetensorsの両方をダウンロードし、ruby_oshinoko.ptをテクスチャ反転エンベディングとして、ruby_oshinoko.safetensorsをLoRAとして同時に使用してください

このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、ruby_oshinoko.ptruby_oshinoko.safetensorsの両方をダウンロードし、ruby_oshinoko.ptをテクスチャ反転エンベディングとして、同時にruby_oshinoko.safetensorsをLoRAとして使用してください。

このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、ruby_oshinoko.ptruby_oshinoko.safetensorsの両方をダウンロードし、ruby_oshinoko.ptをテクスチャ反転エンベディングとして、同時にruby_oshinoko.safetensorsをLoRAとして使用してください。

このモデルには2つのファイルがあります。両方を一緒に使用する必要があります!!!。この場合、ruby_oshinoko.ptruby_oshinoko.safetensorsの両方をダウンロードし、ruby_oshinoko.ptをテクスチャ反転エンベディングとして、同時にruby_oshinoko.safetensorsをLoRAとして使用してください。

トリガーワードはruby_oshinoko、推奨タグはbest quality, masterpiece, highres, solo, {ruby_oshinoko:1.15}, blonde_hair, bangs, long_hair, blush, closed_mouth, smile, closed_eyesです。

このモデルのトレーニング方法

このモデルはHCP-Diffusionを用いてトレーニングされています。また、自動トレーニングフレームワークはDeepGHSチームによって維持されています。

一部のプレビュー画像がRuby Oshinokoに似ていない理由

プレビュー画像(画像をクリックすると表示される)で使用されたすべてのプロンプトテキストは、トレーニングデータセットから抽出した特徴情報に基づいてクラスタリングアルゴリズムによって自動生成されています。画像生成に使用されたシードもランダムに生成されており、画像は一切選択や編集を行っていません。そのため、このような問題が発生する可能性があります。

実際の使用では、私たちの内部テストによれば、このような問題を抱えるモデルの多くは、プレビュー画像で見られるより実際の使用において優れた性能を発揮します。あなたが行う必要があるのは、使用しているタグを調整することだけです

このモデルがオーバーフィッティングまたはアンダーフィッティングしているように感じますが、どうすればよいですか?

当モデルはHugging Faceリポジトリ - CyberHarem/ruby_oshinoko_に公開されており、すべてのステップのモデルが保存されています。また、トレーニングデータセットはHugging Faceデータセット - CyberHarem/rubyoshinokoに公開しており、これがあなたにとって役立つ可能性があります。

なぜより選別された画像だけを使わないのですか?

当モデルのデータ収集からトレーニング、プレビュー画像生成、公開に至るまでのプロセスは、人間の介入なしに100%自動化されています。これは私たちのチームが行った興味深い実験であり、その目的のためにデータフィルタリング、自動トレーニング、自動公開を含む一連のソフトウェアインフラを構築しました。したがって、可能であれば、より多くのフィードバックや提案をお願いします。これらは私たちにとって非常に貴重です。

期待するキャラクターの衣装が正確に生成できないのはなぜですか?

現在のトレーニングデータはさまざまな画像サイトから取得されており、完全な自動パイプラインでは、キャラクターがどの公式画像を所有しているかを正確に予測するのは困難です。したがって、衣装の生成は、トレーニングデータセットのラベルに基づくクラスタリングを用いて、可能な限り最適な再現を目指しています。この問題は引き続き改善・最適化を試みますが、完全に解決するのは困難です。衣装の再現精度は、手動でトレーニングされたモデルのレベルには達しない可能性が高いです。

実際、このモデルの最大の強みは、キャラクター自体の内在的特徴の再現と、より大きなデータセットによる比較的優れた汎化能力にあります。そのため、このモデルは衣装の変更、キャラクターのポージング、もちろんキャラクターのNSFW画像の生成などに適しています!😉

以下のグループには、このモデルの使用を推奨せず、お詫び申し上げます:

  1. 最小限の差異であっても、元のキャラクター設計からの逸脱を許容できない方。
  2. キャラクター衣装の再現精度に高い要求があるシーンで使用する方。
  3. Stable Diffusionアルゴリズムに基づくAI生成画像の潜在的なランダム性を受け入れられない方。
  4. LoRAを用いたキャラクターモデルの完全自動トレーニングプロセスに不快感を抱く方、またはキャラクターモデルのトレーニングは手動で行わなければキャラクターへの不敬になると考える方。
  5. 生成された画像コンテンツが自身の価値観に反する、と感じる方。

このモデルで生成された画像

画像が見つかりません。