Starry Night
詳細
ファイルをダウンロード
モデル説明
この概念実証用LoRAは、1枚の画像によるFlux LoRAトレーニングに基づいています。この手法の詳細については、詳細なFluxトレーニングガイド:データセットの準備をご覧ください。このLoRAは、ビンセント・ファン・ゴッホの『星月夜』の高解像度画像1枚のみを使用してトレーニングされました。この1枚の画像を、さまざまな方法で切り抜き、反転、回転してデータセットを構築しました。
バージョン1.0
バージョン1.0はキャプションなし(トリガーのみ)でトレーニングされました。「starry_night1」というトリガー語をLoRAと同時にフル強度(1)で使用してください。この概念実証としては非常に良い結果が得られ、わずか390ステップでトレーニングが完了しました。データセットの多様性が限られているため、キャプションなしのLoRAの多くと同様に、複雑なプロンプトに対する一般化能力は低いですが、シンプルな指示では素晴らしい画像を生成します。
トレーニング設定はすべてメタデータに含めており、データセットもダウンロード可能ですが、要約すると以下の通りです:
30枚の画像(すべて『星月夜』の切り抜き)、x2回繰り返し、1024解像度でトレーニング、バッチサイズ2
LoRAは13エポック目、約390ステップで収束しました。
学習率は0.0006、AdamW8bit(weight_decay=0.01、eps=1e-08、betas=(0.9, 0.999))を使用し、スケジューラにはcosine_with_restartsを採用しました。












