[Qwen] Liquid Lemons | 90s - 2000s Stock Photography

詳細

モデル説明

「liquid lemons」 🍋 📷

~ 推奨設定およびトレーニングパラメータは下記をご覧ください! ~

このLoRAは、1990年代後半から2000年代のストックフォトグラフィーを学習させたQwen-Imageスタイルのモデルです。当時CDに同梱され、広告などでよく見られたような写真です。トリガーワードは不要ですが、写真に関連するキーワード(例:「a photograph of... ...浅い被写界深度、自然光...」)を用いると、スタイルがより明確に現れます。このモデルはすべてリアルなデータ(合成データは含まない)でトレーニングされており、人物を一切含まないよう配慮してあります。これはキャラクターや他のLoRAとの互換性を最大限に高めるためです。効果は非常に強いため、キャラクターロラを使用する場合は、強度を1.00以下(0.40〜0.50程度がおすすめ)に下げてください。ご使用いただいた際、感想をお聞かせください。 :)

推奨設定

強度 ... 0.40 - 1.20

ステップ数 ... 20 - 50(またはそれ以上)

CFG ... 3.0 - 5.0

サンプラー/スケジューラ ... 任意ですが、res_2s/bong_tangent(RES4LYF)がおすすめです。

このモデルおよびQwen全般は、詳細なキャプションと高解像度、高いステップ数で最も良好な結果を出します(res_2sを使用している場合はステップ数を減らしてください)。例およびComfyUIワークフローについては、ショーケースをご覧ください。Qwenは全体的にプロンプト、キーワード、およびプロンプト内のキーワードの順序に非常に依存しています。スタイルがすぐに現れない場合は、プロンプトを並べ替えて、Qwenをデフォルトスタイルに戻す可能性のあるキーワードを弱めたり排除したりすることを試してみてください。または強度を上げてみてください。

ワークフローで使用したカスタムノード:

トレーニングパラメータ

オープンソースの精神で、ガートキーピングは嫌いなので、私が使用した設定を以下に記します~

ツール ... Diffusion-pipe

学習率(LR) ... 0.0003

次元(Rank) ... 8

ステップ数 ... 2640

エポック数 ... 80

スケジューラ ... AdamW8Bit

合計画像数:134枚、繰り返し:1回

トレーニング解像度 ... 1024

このモデルで生成された画像

画像が見つかりません。