Tongues And Ahegao
詳細
ファイルをダウンロード
モデル説明
ここまで3週間、約100回の試行を重ねてこのLoRAを作成した結果、ようやく少し満足のいくバージョンを得ることができました。919枚の画像で学習しました。まだ改善の余地はたくさんありますが、良い結果を出すことができます。
サンプル画像はすべて生出力(txt2img + Hires.fix)です。一部の例では、UnrealisticDream, BadDream(Lykon 氏作)のエンベッディングを使用しました。すべての例は、RealisticVisionV51(SG_161222 氏作)で作成しました。CFGスケール7で十分な結果が得られます。
主なキーワード:
- 舌を出す(749枚のトレーニング画像)
- アヘ顔(407枚のトレーニング画像)
- 唾を流す(99枚のトレーニング画像)
- 濡れた舌を出す(77枚のトレーニング画像)
- 口を大きく開く(44枚のトレーニング画像)
制限事項:
- カメラから離れた被写体ではあまりうまく動作しません
- 鼻のピアスにバイアスがかかっています(多くのトレーニング画像に含まれているため)
- 「アヘ顔」を使用すると動物の耳にバイアスがかかる傾向があります
- キーワード「口を大きく開く」は時々恐ろしい出力になることがあります
- 「舌を横に出す」や「唇をなめる」といったキーワードは機能しません(トレーニング画像が不足しているため)
- 男性には効かない可能性があります(検証していません)
改善すべき点はまだたくさんあります。私は多くの中程度の品質(一部は低品質)の画像を使用しましたが、高品質な画像を見つけるのは難しいです。また、RTX 3060 Tiの性能の限界で、512x512より大きなサイズでの学習ができませんでした。これが品質向上に貢献したかもしれません。SDXL版を作りたいですが、必要なハードウェアが高額で手が出せません、笑。
注意:サンプル画像のプロンプトには間違ったLoRA名が記載されています。元の名前はTongues_V62-000012でしたが、後にTonguesAndAhegaoV1に変更しました。
フィードバックをどうぞよろしくお願いします!









