Mosaic Art

詳細

ファイルをダウンロード

モデル説明

これはモザイクアートの画像で訓練されたDreambooth対応 Stable Diffusionモデルです。

全体のデータセットは46枚の画像で構成されており、訓練はrunwayml 1.5およびnew VAEを用いて行われました。トレーニングにはEveryDreamを使用し、画像に対して完全なキャプションを付与し、メインコンセプト以外の繰り返し出現する語はほぼ使用していません。そのため、追加の正則化は必要ありませんでした。e0〜e11のエポックのうち、過学習を防ぎつつ最も良いスタイル表現が得られたe8が最適な選択とされました。初期保存(prior preservation)の結果も良好でした。学習率1e-6で、合計9エポック、1エポックあたり40回の繰り返しを実施しました。

トークン「Mosaic Art」を用いることで、スタイルとして新しく学習されたこのコンセプトが適用されます。

推奨されるサンプリング方法は、20ステップ、CFG Scale 7.5で k_Euler_a または DPM++ 2M Karras です。

このモデルで生成された画像

画像が見つかりません。