[Qwen] Liquid Lemons | 90s - 2000s Stock Photography
詳細
ファイルをダウンロード
モデル説明
「liquid lemons」 🍋 📷
~ 推奨設定およびトレーニングパラメータは下記をご覧ください! ~
このLoRAは、1990年代後半から2000年代のストックフォトグラフィーを学習させたQwen-Imageスタイルのモデルです。当時CDに同梱され、広告などでよく見られたような写真です。トリガーワードは不要ですが、写真に関連するキーワード(例:「a photograph of... ...浅い被写界深度、自然光...」)を用いると、スタイルがより明確に現れます。このモデルはすべてリアルなデータ(合成データは含まない)でトレーニングされており、人物を一切含まないよう配慮してあります。これはキャラクターや他のLoRAとの互換性を最大限に高めるためです。効果は非常に強いため、キャラクターロラを使用する場合は、強度を1.00以下(0.40〜0.50程度がおすすめ)に下げてください。ご使用いただいた際、感想をお聞かせください。 :)
推奨設定
強度 ... 0.40 - 1.20
ステップ数 ... 20 - 50(またはそれ以上)
CFG ... 3.0 - 5.0
サンプラー/スケジューラ ... 任意ですが、res_2s/bong_tangent(RES4LYF)がおすすめです。
このモデルおよびQwen全般は、詳細なキャプションと高解像度、高いステップ数で最も良好な結果を出します(res_2sを使用している場合はステップ数を減らしてください)。例およびComfyUIワークフローについては、ショーケースをご覧ください。Qwenは全体的にプロンプト、キーワード、およびプロンプト内のキーワードの順序に非常に依存しています。スタイルがすぐに現れない場合は、プロンプトを並べ替えて、Qwenをデフォルトスタイルに戻す可能性のあるキーワードを弱めたり排除したりすることを試してみてください。または強度を上げてみてください。
ワークフローで使用したカスタムノード:
Rgthree (https://github.com/rgthree/rgthree-comfy)
オプション:ポストプロセッシングノード (https://github.com/EllangoK/ComfyUI-post-processing-nodes)
トレーニングパラメータ
オープンソースの精神で、ガートキーピングは嫌いなので、私が使用した設定を以下に記します~
ツール ... Diffusion-pipe
学習率(LR) ... 0.0003
次元(Rank) ... 8
ステップ数 ... 2640
エポック数 ... 80
スケジューラ ... AdamW8Bit
合計画像数:134枚、繰り返し:1回
トレーニング解像度 ... 1024













