XL realistic fursuit

詳細

ファイルをダウンロード

モデル説明

これは非常に汎用性の高い獸装LoRAであり、3つの一般的な獸装スタイル(kemono fursuit、realistic fursuit、toony fursuit)を学習しています。後方ビューまたは頭部のみを描画できます。汎用性を高め、元のモデルの効果を改善するため、その他の多くの側面についても学習が行われました。ダウンロード時に小さいファイルはpromptの例です。

このLoRAはRatatoskrを基に学習されています。なぜならこのモデルは複数のスタイルをサポートしているからです。しかし、V8THL以降、このモデルは明らかに過学習し、色が異常で受け入れがたい状態になっています。したがって、より良い色と背景構造の表現が必要な場合は、このバージョンの使用をお勧めします。

元のモデルの効果を改善するため、このモデルはアニメスタイル、厚塗りスタイル、128pxピクセルスタイル、シンプルな描画スタイル、仮想と現実の融合などにも学習され、柴犬の表示効果の改善も試みられました。

しかし、具体的な概念に割り当てられる画像は多くなく、いくつかの概念はわずか数枚の画像でしか学習されておらず、複数回試行する必要があるかもしれません。多様性の高い学習は過学習の現象を改善するのに役立ち、学習対象外の概念に対してもより良い汎用性をもたらす可能性があります。

また、キャラクター「猫十三」(cat13)、ori、三宝(sanbao)、净饭(jingfan)についても併せて学習しましたが、使用された画像は多くありません。これは概念の干渉がモデルの汎用性に不意に悪影響を与えるのを防ぐためであり、キャラクター専用の学習方法は使用していません。したがって、これはキャラクター専用に訓練されたモデルではなく、特徴学習が不十分で効果が劣ります。

LoRAの強度は0.6から試すことをお勧めします。たとえ低く設定しても効果があります。一部の概念は0.85のように高く設定する必要があるかもしれません。1に設定すると画像品質が著しく低下します。一方、一部の明確な概念特徴は、低めの設定が必要です。

展开查看更多说明 (Machine translation ,Click "Show More" look more instructions)

これは非常に汎用性の高い獸装LoRAであり、3つの一般的な獸装スタイル(kemono fursuit、realistic fursuit、toony fursuit)を学習しています。後方ビューまたは頭部のみを描画できます。汎用性を高め、元のモデルの効果を改善するため、その他の多くの側面についても学習が行われました。ダウンロード時に小さいファイルはpromptの例です。

このLoRAはRatatoskrを基に学習されています。なぜならこのモデルは複数のスタイルをサポートしているからです。しかし、V8THL以降、このモデルは明らかに過学習し、色が異常で受け入れがたい状態になっています。したがって、より良い色と背景構造の表現が必要な場合は、このバージョンの使用をお勧めします。

元のモデルの効果を改善するため、このモデルはアニメスタイル、厚塗りスタイル、128pxピクセルスタイル、シンプルな描画スタイル、仮想と現実の融合などにも学習され、柴犬の表示効果の改善も試みられました。

しかし、具体的な概念に割り当てられる画像は多くなく、いくつかの概念はわずか数枚の画像でしか学習されておらず、複数回試行する必要があるかもしれません。多様性の高い学習は過学習の現象を改善するのに役立ち、学習対象外の概念に対してもより良い汎用性をもたらす可能性があります。

また、キャラクター「猫十三」(cat13)、ori、三宝(sanbao)、净饭(jingfan)についても併せて学習しましたが、使用された画像は多くありません。これは概念の干渉がモデルの汎用性に不意に悪影響を与えるのを防ぐためであり、キャラクター専用の学習方法は使用していません。したがって、これはキャラクター専用に訓練されたモデルではなく、特徴学習が不十分で効果が劣ります。

LoRAの強度は0.6から試すことをお勧めします。たとえ低く設定しても効果があります。一部の概念は0.85のように高く設定する必要があるかもしれません。1に設定すると画像品質が著しく低下します。一方、一部の明確な概念特徴は、低めの設定が必要です。

表示画像:

多視点学習(Multi-view training was carried out)

後方ビューは学習画像が少なく、ベースモデルの影響を強く受けます。

(しかし、後方ビューが学習されていない場合、描画されません。)

頭部のみの学習(fursuit head)が行われました。

fursuit head training was carried out

その他の概念学習 Other concept training

キャラクター「猫13」および汎用性テスト

基本プロンプト(注意:yuguo):

yuguo,digital drawing,anthro cat,red and gold hat,blue eyes,brown fur,

wearing red and blue outfit,kemono furry,

汎用性テスト(LoRAは元のモデルの汎用性を妨げることがあるため、この実験を実施)

Generalization ability test (lora may interfere with the generalization ability of the original model, so this experiment is conducted)

既知の問題:

  • ベースモデルRatatoskrに学習上の問題があり、表示効果が自然でリアルではありません。LoRAは一部の過度な滑らかさや過剰な明るさの問題を改善できますが、効果は依然として不十分です。

    • 不要な照明が発生し、非常に暗いシーンを描画できません。高CFGでより黒く描画できますが、不自然に見えます。低CFGまたはCFGスケーリングで自然な表示を得られますが、品質が低下します。

    • 純黒画像のリペイントで改善できます。

  • 手の描画品質が悪い。LoRAは手の描画品質を低下させる可能性があり、これはfursuitが手と爪を持ち、隠蔽関係がより抽象的であるためです。

  • データセットが均衡していない。一部の概念は過学習しているため、明るすぎる部分はLoRAの影響です。また、構造品質が低下しており、たとえば刀の描画が難しい場合があります。

    • CLIPの強度を下げることで改善できる場合がありますが、新しい概念はCLIPの強度に依存しており、強度を下げすぎると機能しなくなります。強度が低すぎると、一部の画像が崩壊する可能性があります。
  • fursuitの概念で青が多すぎる。ときに制御不能に青が現れます。

  • 色と模様が複雑なため、色の汚染が発生することがあり、ストライプの制御が難しい場合があります。奇妙な毛色やテクスチャの分布について、どのように説明すべきかわかりません。

  • kemonoスタイルは種族に対して非敏感であり、ラベル付けしても種族を区別するのが難しいため、龍には時々自分でhornを記述する必要があります。

  • 全身画像はややぼやけることがあり、十分な毛のディテールを得るには大きなサイズが必要です。

  • 内側の毛の色(白以外の腹部の色など)を指定するのが難しい場合があります。これはデータが少なく、ベースモデル自体も対応が難しいためです。この問題は0610以降改善されています。

    • 特別にラベル付けを試みましたが、手動で塗りつぶすことをお勧めし、画像から画像の方法で解決してください。

モデルの違い:

1006

照明を改善しようとしました。一部の学習データの彩度と明るさを強制的に下げ、暗い環境の画像を追加して学習しました。

水と相互作用する画像を追加;美学を改善する画像を追加;半獸装の改善に向けた画像を追加;一部のテストでは前バージョンよりもディテール表現が悪くなりました。

082x

  • V8THLは14.1より色彩表現が優れていますが、Ponyほどではないかもしれません。より暗い背景を得られますが、前景は依然として明るすぎます。

  • PonyはPony realisimを基に試行しましたが、複数スタイルの表現は不良です。しかし、夜間と色彩の表現は14.1より優れ、より自然になる可能性があります。否定的なプロンプトでリアリズムを指定することで、アニメなどの非リアリスティックスタイルを導入できます。

  • 14.1は最新のRatatoskr14.1を基にしていますが、ベースモデルは色彩と夜間の表現が劣っています。LoRAはこの傾向をさらに悪化させる可能性があります。しかし、LoRAをV8THLに使用することもでき、視覚的な体験は14.1より良いです。

さらに多くの画像で学習し、より正確で詳細な記述を試みました。

腹部の色を改善し、水中での効果を向上させました。

いくつかのdoge画像を追加しました。

キーチェーン、厚塗り、シンプルな描画などのスタイルの効果を改善しました。

より高い解像度と美学的品質の画像を導入しました。

oriと三相奇譚のキャラクターを少量学習しました。

しかし、以前と比べて学習ラウンドは14から10に減らされており、学習が不足している可能性があります。

0419

高品質なピクセル画像を一括入れ替えましたが、学習がやや不足していました。標準LoRAを使用。色彩表現は0312より依然として良くありません。問題はベースモデルにある可能性があります。

0412x:

厚塗りなどの色彩表現が良くない。lycorisのloconを使用。使用したピクセル画像の品質が低く、画像が雑然としている。一部の概念は過剰適合、一部は不足適合。

0312:

学習内容は比較的限られていましたが、「三頭六臂」の概念を学習しました。しかし、この概念の効果が悪かったため、その後廃止しました。厚塗りなどの非リアリスティックな色彩面では良好な表現を示しました。Ratatoskr - V8 [THL]を基にしています。

Model difference:

1006

An attempt was made to improve the lighting. The saturation and brightness of some training data were forcibly reduced, and a batch of dark environment images were added for training

Add more interactive images with water; Add more images to improve aesthetics; Add more images to improve the half-beast costume; In some tests, the detail performance was worse than that of the previous version

082x

  • The V8THL has better color performance than the 14.1, but perhaps not as good as the pony. You can get a darker background, but the foreground is still too bright.

  • Pony, based on Pony realisim as an attempt, performed poorly in multiple styles. However, the night and color performance are better than 14.1 and might be more natural. By filling in realistic prompts in a negative way, some non-realistic styles can be introduced, such as anime

  • 14.1 is based on the latest Ratatoskr14.1, but please note that the bottom mold has issues with poor color and night performance. lora seems likely to make this phenomenon even more severe. But you can find that lora can also be used on V8THL, and the visual experience is better than 14.1.

Add more image training and try some more precise and detailed descriptions

Try to improve the color of your belly and enhance the effect in water

Some doge pictures have been added

Improve the effects of some styles such as key chains, thick coating, and simple painting

Introduce images with more resolutions and higher aesthetic quality

Add ori and the threefoldrecital Tale character, with only a small amount of training

However, compared to before, the training has now been reduced from 14 rounds to 10 rounds, which might be insufficient

0419:

I replaced a batch of high-quality pixel images, but some of the training was insufficient ; Use standard lora; The color performance is still not as good as that of 0312. The problem might lie in the base mold

0412x:

The color representation is not good; Use lycoris' locon ;The quality of the pixel images used is not high, and the images appear messy ;Some concepts are overfitting, while others are underfitting

0312:

The training content was relatively limited, but the concept of three heads and six arms was trained. However, the effect of this concept was not good, so it was abandoned later. ; It performs well in terms of color in non-realistic aspects such as thick coating ; Based on Ratatoskr  - V8 [THL]

このモデルで生成された画像

画像が見つかりません。