Flux.1 D - Creepy Stuff
詳細
ファイルをダウンロード
モデル説明
おそらくこのままのところ、Fluxの最後のモデルになるでしょう。何か面白いものが出てこない限り。理由はさまざまですが、最も大きな理由は、SDXLやPonyモデルのランダム性をmissしていることです。あれが一番楽しかったからです。音楽を聴きながら、歌詞を分解して何が起こるか見ていく…というスタイルは、Fluxではあまりできません。また、画像を生成するのに必要なリソースと時間が、今のところあまりにも多すぎます。いくつかのLoRAを追加してCFGを高く設定すると、RAM使用量と生成時間が急上昇します。Fluxで1枚の画像を生成する間に、SDXLでHigh-Res Fixを適用して10枚のバッチを生成できてしまうのです。今後もたまに使いますが、メインにはしません。
Fluxを始めた動機は、単なる好奇心と壁に頭をぶつけることでした。Fluxには多くの利点がありますが、より深く調べた結果、私が望むような挙動や期待する動作を実現するための戦いは、私が勝てるものではないとわかりました。柔軟性に欠け、LoRAやランダムシードを使っても特定の画像やスタイルにdefaultsしてしまう、コンセプトのブレンド(場合によっては悪くないことも)がある、一部のプラグインが動作しない(非対応またはForge内のGradioバージョンの問題)、カメラアングルに関する知識が限られている、現実的な画像でもアニメ調で不自然に見えることがある、ノイズ・グレイン・霞みなどの制限が多すぎる、などです。
一方で、Fluxが優れているのは、スタイルの表現力、綺麗な画像、劣悪な学習画像でも有用なものに変える力、大半で良好な解剖学的構造、色彩とコントラスト、一貫性、テキストエンコーダーなどです。
このモデルはデフォルトのFluxモデルではなく、こちらで訓練されています。何か異なることをするのでしょうか?わかりません。同じLoRAを両バージョンで並列にトレーニングして比較したかったのですが、結局あまり気にならなかったのでやりませんでした。ただ、このLoRAをサイト内のジェネレーターで使うのは、あまりお勧めしません。おそらくバズを無駄にするだけです。
現時点では、このようなLoRAがいくつかあります(特にハロウィン用)。もちろん、それらのほうがより優れていると思います。投稿されている画像がどれも似ているように見えるかもしれませんが、実際にはさまざまなスタイルやテーマの画像を使っています。中にはホラーとは無関係なものさえあります。あくまで、今のハロウィン関連の素材をメインに使って、いくつかの理論や直感を試しただけです。
よい運を!
PS:以前のギャラリーにある一部の画像は、ほぼ同じLoRAを使って、Kohyaの設定とステップ数を変えて作成しました。















