Tongues And Ahegao

詳細

ファイルをダウンロード

モデル説明

ここまで3週間、約100回の試行を重ねてこのLoRAを作成した結果、ようやく少し満足のいくバージョンを得ることができました。919枚の画像で学習しました。まだ改善の余地はたくさんありますが、良い結果を出すことができます。

サンプル画像はすべて生出力(txt2img + Hires.fix)です。一部の例では、UnrealisticDream, BadDreamLykon 氏作)のエンベッディングを使用しました。すべての例は、RealisticVisionV51SG_161222 氏作)で作成しました。CFGスケール7で十分な結果が得られます。

主なキーワード:

  • 舌を出す(749枚のトレーニング画像)
  • アヘ顔(407枚のトレーニング画像)
  • 唾を流す(99枚のトレーニング画像)
  • 濡れた舌を出す(77枚のトレーニング画像)
  • 口を大きく開く(44枚のトレーニング画像)

制限事項:

  • カメラから離れた被写体ではあまりうまく動作しません
  • 鼻のピアスにバイアスがかかっています(多くのトレーニング画像に含まれているため)
  • 「アヘ顔」を使用すると動物の耳にバイアスがかかる傾向があります
  • キーワード「口を大きく開く」は時々恐ろしい出力になることがあります
  • 「舌を横に出す」や「唇をなめる」といったキーワードは機能しません(トレーニング画像が不足しているため)
  • 男性には効かない可能性があります(検証していません)

改善すべき点はまだたくさんあります。私は多くの中程度の品質(一部は低品質)の画像を使用しましたが、高品質な画像を見つけるのは難しいです。また、RTX 3060 Tiの性能の限界で、512x512より大きなサイズでの学習ができませんでした。これが品質向上に貢献したかもしれません。SDXL版を作りたいですが、必要なハードウェアが高額で手が出せません、笑。

注意:サンプル画像のプロンプトには間違ったLoRA名が記載されています。元の名前はTongues_V62-000012でしたが、後にTonguesAndAhegaoV1に変更しました。

フィードバックをどうぞよろしくお願いします!

このモデルで生成された画像

画像が見つかりません。