Voicemod protogen + protogen furry

詳細

ファイルをダウンロード

モデル説明

Voicemod Protogenは、Automatic1111 webui用のDreamBooth拡張機能を使って訓練されたモデルです。このモデルは、Voicemod Protogenの画像5枚と、一般的なProtogenの画像10枚の合計15枚で訓練されています。単純にタグ付けすることで、Protogenに適用できる概念をより多く学習させようとしています。

以前、このキャラクターの画像5枚だけで試みましたが、Protogenに共通する特徴についての知識が不足し、訓練データそのものに似た画像が生成されるようになりました。そこで、さらに10枚の画像を追加したところ、非常に良好な結果が得られました!

これは私が初めて公開するLoRAです。しばらくLoRAを試行錯誤した結果、これなら公開できると考えました。

訓練

このLoRAはAutomatic1111 webui用のDreamBooth拡張機能で訓練されました。合計15枚のProtogen画像を使用し、そのうち5枚はVoicemod Protogenのものです。画像にはDeepBooruを使用してキャプションを自動生成し、アンダースコアをスペースに置き換え、より具体的な情報を追加し、誤ったタグは削除しました。

75枚の分類器画像を生成した後、LoRAを2時間程度学習させました。

ベースモデルとして、AbyssOrangeMix3とAnything v4.5を50%ずつミックスしたモデルを使用しましたが、このLoRAはほとんどのモデルで問題なく動作するはずです。

使い方:

主なトリガー語: "voicemod protogen"

追加のトリガー語: "striped thighhighs"(縞模様のハイヒール)、"striped arm warmers"(縞模様の腕ウォーマー)、"[color] visor"([色]のヘルメット)、"multicolored fur"/"multicolored hair"(多色の毛髪/多色の髪)、"[facial expression] expression"([表情]の表情)

否定プロンプトに推奨する項目: "text"(テキスト)、"speech bubble"(吹き出し)、"watermark"(水印)

知られている制限:

  • 3DのProtogenを生成できない。学習データはほぼすべて2Dであるため、このキャラクターが2Dに固定されてしまい、通常3Dを生成するモデル上で使用すると、結果的に2Dで生成される可能性が高い。

  • ヘルメットの色を変更すると、Protogenのメインテーマカラーも変化し、一貫性が失われる可能性があります。

備考

このモデルは異なるProtogenの生成が可能です。ただし、「voicemod protogen」と明示する必要があることに注意してください。「protogen」とだけ記述すると、場合によってはヘルメットの処理に問題が生じるため、代わりに「voicemod protogen」と正確に指定し、変更したい他の詳細も明記してください。

このモデルで生成された画像

画像が見つかりません。