Paintings from Carl Spitzweg

詳細

ファイルをダウンロード

モデル説明

バージョン2.0の更新:

絵画には非常に異なる筆致スタイルが含まれていたため、それを3つのグループに分類しました:ビーダーマイアーの「写実的」スタイル、後の「印象派的」スタイル、そしてその「中間的」スタイルです。それぞれを別々にトレーニングし、その後3つのLoRAを統合しようとしましたが、失敗しました。3つのスタイルを同時に引き出すことは不可能だったのです。そのため、3つのLoRAをすべて公開することにしました。ショーケース用の画像は、同じプロンプトを使用して作成し、筆致スタイルのキーワードのみを変更しています。お好みのスタイルを選んでください——筆致の違いがいかに大きく影響するか、興味深いでしょう。v1.0のバージョンが「中間的」スタイルに近いのは当然で、これはトレーニングに使用されたfp4精度の影響を受けている可能性があります(画像の明るい部分や暗い部分に見えるグリッドパターン)。


私は、19世紀のドイツの画家カール・スピッツェーグのスタイルで画像を作成するという、直感的なアイデアを思いつきました。しかし、Fluxは「ブラックフォレストラボス」と名乗っているにもかかわらず、そのスタイルを認識していませんでした。絵画の収集とタグ付けを半分まで進めた頃、他の誰かがすでにLoRAを作成していることに気づきました。しかし、そのLoRAで得られた結果が奇妙だったため、私は継続しました——建物は非常にスピッツェーグ風でしたが、人物はそうではなかったのです。

スピッツェーグはビーダーマイアーのスタイルで描画を始め、後に印象派へと移行しました。私は、人物が活動している肖像画と風景画が混在した194点の絵画データセットを手に入れました。彼の作品には、日常的な状況を描きながらも当時の社会規範と一致しない、強い社会的批評の傾向があります。大量のあくびをする修道士や、見張りをせず何でもしてしまう兵士たちが登場します。

すべての絵画を集めた後、年代による劣化の影響で、現在の作品よりもはるかに明るく、明るい雰囲気の作品だったことに気づきました。また、価格が3万~15万ユーロと高価であるため、修復に多大な労力を費やす可能性は低いと考えられました。さらに多くの画像がアナログフィルムで撮影されており、フィルム自体も劣化しているように見えました。つまり、私が行ったのは、作品が新しく仕上がった当時の姿に復元することでした。

テスト実行の結果、75エポックでトレーニングしたLoRAが、スタイルに最もよく合致していることがわかりました。プロンプトは「The image is a painting from Carl Spitzweg of 」で始め、末尾にLoRAタグ <lora:CarlSpitzweg-75:1> を追加します。ガイドance値は低く(1に)保ってください。そうでないと、スタイルから逸脱してしまいます。

このモデルで生成された画像

画像が見つかりません。