( Love Live! Nijigasaki ) Ousaka Shizuku F.1 Dev LoRA
詳細
ファイルをダウンロード
モデル説明
Ousaka Shizuku F.1 D LoRA モデル
トレーニングデータセットは、このキャラクターを含む一部のカード画像から取得しています。
何らかの理由により、公式カード画像ほどの品質には到達できませんでしたが、以下のプロンプトを厳密に従うことで、基本的な特徴は十分に再現できます:
<lora:ousaka-shizuku:1>, ousaka shizuku, 1girl, solo, blue eyes, brown hair, long hair, etc.
または、私が提供したプレビュー画像のプロンプトをご覧ください。
ヒント:今後、主要なトリガー単語のみを保持し、基本的な顔の特徴タグを削除する予定です。これにより、「ousaka shizuku」というトリガー単語だけで正しいキャラクターを生成できるようになるかもしれません。
私のsvdquantを使用したワークフローでは、<lora:ousaka-shizuku:1>を入力せずに、トリガー単語のみでLoRAを使用できます。(ただし、stable-diffusion-webuiをご使用の場合は、この段落を無視してください。)
svdquantでのテストでは、重み値を1.25ではなく1で使用しても品質は十分良好でした。(この結論を考慮してください。)
Florence-2モデルを使用してタグ付けしていないため、自然言語プロンプトではなく**DeepBooru(Danbooru)**のワードを使用してください。
ベースモデルは明らかにFLUX.1 Devであるため、他のF.1モデルを使用するのは適していないと思います。
(私はまだここでの初心者です。)
使用方法
トリガー語+正しい特徴記述語を使用することで、キャラクターを正しく生成できます(今後、簡易版をリリースする予定です。その際には基本的な特徴記述語を削除し、トリガー語のみでキャラクターの特徴を再現できるようにする予定です):
<lora:ousaka-shizuku:1>, ousaka shizuku, 1girl, solo, blue eyes, brown hair, long hair, etc.
自然言語の記述ではなく、DeepBooruの語句をプロンプトとして使用してください。なぜなら、私は面倒くさくてFlorence-2モデルを使ってタグ付けしなかったからです(当たり前ですが)。
ベースモデルは引き続きFLUX.1 Devです。また間違えないでください(再度)。
私のワークフローでのテスト結果
以前の「重み1.25が必要」という結論は覆されました。私のsvdquantテストでは、LoRAは別個のsvdquantノードで読み込まれており、Clip Textにlora:ousaka-shizuku:1を入力する必要はありません。
ただし、上記のワークフローを使用していない場合、またはLoRAを「Load LoRA」のような別ノードで読み込んでいない場合(例:従来のstable-diffusion-webui-forgeなど)、この点は無視してください。ただし、重みはまず1に下げてみてください。
トレーニングパラメータの一部
私のノートパソコンの性能が限られているため、現在の手法は総トレーニングステップ数(Total Steps < 1k)をなるべく減らして効率を高めることにしています。しかし、ハードウェア環境に恵まれた他の人々と比べると、やはり遅すぎます(涙)。
普段全く時間が取れないのもあり…すみません。このサイトに参加してすでに1年以上経ちますが、AIGC分野ではまだまだ初心者です。





