Voicemod protogen + protogen furry
詳細
ファイルをダウンロード
このバージョンについて
モデル説明
Voicemod Protogenは、Automatic1111 webui用のDreamBooth拡張機能を使って訓練されたモデルです。このモデルは、Voicemod Protogenの画像5枚と、一般的なProtogenの画像10枚の合計15枚で訓練されています。単純にタグ付けすることで、Protogenに適用できる概念をより多く学習させようとしています。
以前、このキャラクターの画像5枚だけで試みましたが、Protogenに共通する特徴についての知識が不足し、訓練データそのものに似た画像が生成されるようになりました。そこで、さらに10枚の画像を追加したところ、非常に良好な結果が得られました!
これは私が初めて公開するLoRAです。しばらくLoRAを試行錯誤した結果、これなら公開できると考えました。
訓練
このLoRAはAutomatic1111 webui用のDreamBooth拡張機能で訓練されました。合計15枚のProtogen画像を使用し、そのうち5枚はVoicemod Protogenのものです。画像にはDeepBooruを使用してキャプションを自動生成し、アンダースコアをスペースに置き換え、より具体的な情報を追加し、誤ったタグは削除しました。
75枚の分類器画像を生成した後、LoRAを2時間程度学習させました。
ベースモデルとして、AbyssOrangeMix3とAnything v4.5を50%ずつミックスしたモデルを使用しましたが、このLoRAはほとんどのモデルで問題なく動作するはずです。
使い方:
主なトリガー語: "voicemod protogen"
追加のトリガー語: "striped thighhighs"(縞模様のハイヒール)、"striped arm warmers"(縞模様の腕ウォーマー)、"[color] visor"([色]のヘルメット)、"multicolored fur"/"multicolored hair"(多色の毛髪/多色の髪)、"[facial expression] expression"([表情]の表情)
否定プロンプトに推奨する項目: "text"(テキスト)、"speech bubble"(吹き出し)、"watermark"(水印)
知られている制限:
3DのProtogenを生成できない。学習データはほぼすべて2Dであるため、このキャラクターが2Dに固定されてしまい、通常3Dを生成するモデル上で使用すると、結果的に2Dで生成される可能性が高い。
ヘルメットの色を変更すると、Protogenのメインテーマカラーも変化し、一貫性が失われる可能性があります。
備考
このモデルは異なるProtogenの生成が可能です。ただし、「voicemod protogen」と明示する必要があることに注意してください。「protogen」とだけ記述すると、場合によってはヘルメットの処理に問題が生じるため、代わりに「voicemod protogen」と正確に指定し、変更したい他の詳細も明記してください。





