DoRA (49.11 MB): v04 Dora
学習データ (134.41 MB): ComfyUI_workflow+onetrainer_Dora_backup_data
● 40万枚の画像からDoraを学習しました。
● 目標は、全体的なタグ認識力と品質を向上させるDoraを作成することです。
v03から33エポック、26万ステップ追加で学習を継続しました。
● コンセプトの強化がさらに進みました。
一部のタグでは、キャラクターやコンセプトの再現性が改善されている可能性があります。
ただし、完全な再現性を求める場合は、他のLoRAと組み合わせてご利用ください。
● v03と同様、やや過学習気味です。Doraの重みを約0.5に下げると、ベースモデルのスタイルやテクスチャとのバランスが良くなり、より自然な結果が得られることがあります。
● また、多くのネガティブプロンプト、高いタグ重み、または高いCFG値は時折アーティファクトを引き起こす可能性があるため、これらの設定を見直すことをお勧めします。特にリアリスティックなモデルでは、これらの要因がビジュアルアーティファクトの発生確率を大幅に高めます。
● また、v03–v02の早期エポックの方が、場合によってはより柔軟で使いやすい場合もあるため、最適なバランスを見つけるために試してみる価値があります。
● 512pxでの生成が最も安定していますが、kohya_deep_shrinkを使用して768x1152pxなどの高解像度で生成すると、より印象的な画像が出ることがあります。少しアーティファクトが入る可能性もありますが、ぜひお試しください。
以下の説明は、以前のバージョンと同様です。
● Doraまたはタグの重みを1以上に上げると、不安定になる可能性があります。
しかし、1111やForgeのようなツールではタグ重みが正規化されるため、上げても問題が生じないことがあります。ComfyUIでも同様の正規化機能を持つカスタムプロンプトノードがあると考えられます。
重みを1に設定してもスタイルの影響が強すぎたり、ビジュアルアーティファクトが発生する場合は、Doraの重みを下げてみてください。
サンプル画像には多くの不完全さが含まれています。これは大量のデータを学習した結果としての妥協です。
● データセットの内容
コンセプト強化:24万枚
美学強化:13万枚
フィギュア+リアリスティック:3万枚
● このDoraにはトリガータグは含まれていません。目的は、元のモデルの制限を加えず、一般概念の強化です。
● 多くのコンセプトを均等に学習するように意図しました。単独では効果は弱いため、関連タグを複数使用することが必要になる場合があります。
キャラクターが長い緑色の髪を持っている場合は、そのタグを必ず含めてください。NSFWタグについても同様です。
● 特定のコンセプトを強化したい場合は、単一コンセプトLoRAの追加を推奨します。
● 「検閲、モザイク、バー検閲、テキスト」などの表現が現れることがあります。これは私のデータセットにこれらが含まれているためです。無修正画像も含まれていますが、多くの画像に検閲が施されています。これらを演出やアクセントとして楽しむか、ネガティブプロンプトに追加することを検討してください。「uncensored」をプロンプトに加えるのも良いでしょう(ただし、必ずしも問題が解決するとは限りません)。
● NovelAI_v1で学習したため、その派生モデルで動作します。ただし、特定のコンセプトやスタイルへの過学習により、一部のモデルでは概念の忘却が発生することがあります。NovelAIで効果があっても、他のモデルでは弱くなる可能性があります。
● ネガティブプロンプトには注意してください。
「worst quality, low quality:1.4」などの用語は高品質な画像を生み出しやすいですが、多様性を制限する可能性があります。
「slime girl」などの特殊タグが効かない場合、ネガティブプロンプトの強度が高すぎる可能性があります。
● 短いプロンプトでは背景が単調になり、スタイルがリアリスティックに傾きやすくなります。
その場合、背景タグを追加し、服や髪型などの詳細を尽可能多く含めて、生成したい画像をより明確に定義してください。
● 一般タグとキャラクタータグのみを学習しました。
作品タイトルは特に学習していませんが、一部のキャラクターネームにタイトルが含まれているため、偶然強化されることがあります。
ただし、キャラクターや作品が学習の中心ではなかったため、十分に学習されていない可能性があります。そのため、過度な期待はしないでください。キャラクターには単一コンセプトLoRAを使用するのがより効果的です。
● このLoRAは512px用に設計されています。高解像度で使用すると、時折歪みが発生することがあります。高解像度修復やi2iアップスケーリング時にDoraを無効にすると、よりクリアで歪みの少ない画像が得られることがあります。
● 参考として、私が使用したOneTrainerの設定も共有します。
これはU-Netのみの学習です。Clip Skip 2で学習しました。OneTrainerでは1に設定しています。ComfyUIのワークフローも併せて共有しておきます。