Flux.1 D - Soothing Atmosphere

詳細

ファイルをダウンロード

モデル説明

V.2.0

画像をさらに追加し、ステップ数を増やしました。

強度を低めに設定することをお勧めします。そうでないと、何らかの理由ですべてが触手怪物になってしまいます。

FluxのPro版をリリースしてほしいと心から願っています。このディスティルされたバージョンは制御が難しく、柔軟性にも制限があるからです。いくつかのプロンプトを試していると、必ず特定の画像、またはモデルが得意として学習したイメージ(映画的、写真的、特定の動物や人物など)に帰着し、Flux特有の「無機質な」外観(シネマティック、写真、特定の動物や人物など)になってしまいます。

また、現在公開されているフルチェックポイントのいずれも、実際には動作しないと強く疑っています。ほぼすべてを試しましたが、常に異常な解剖学的構造や著しいバイアスに陥ってしまいます。ネガティブプロンプトやプロンプトの重み付けでは修正できないほどです。Fluxはこれらの機能を使用していないからです。たとえば、服を着た人物を要求しても、常に裸の状態で生成されてしまいます。これがあまりにも頻繁に発生するため、SDXLでも同様の効果があったのかどうか疑わしいです。私はネガティブプロンプトをそれほど頻繁に使っていませんでしたが、以前は避けたい要素をある程度排除するのに十分でした。

奇妙なことに、スタイル(例:アニメ)でトレーニングされた、またはLoRA化されたすべてのチェックポイントは、リアルな画像に対しても非常にうまく動作します。私はほとんどすべての画像でこれを使用しています(ここでは、説明用に基本的なFP8チェックポイントを使用しています)… とても混乱します。


これはSDXL用に計画していたデータセットでトレーニングしましたが、満足のいく結果を得られませんでした。現在はわずか数枚の画像(基本的なキャプション付き)を用いて、800ステップのみでトレーニングしました。後で自然言語に変更する予定です。

最も頻繁に使用された単語は、大気的陰鬱静か癒し穏やか神秘的... そして多様(キャプションのない画像… まあ、これもキャプションです。Kohyaは.txtファイルが存在しない場合、フォルダ名を自動的にキャプションとして選択するので、それを忘れていました:D)

  • 並び:最初の2枚はLoRAあり/LoRAなし、その後は逆順

  • 今は、場合によって影響が異なる

Flux LoRAをいくつか作成し、試行錯誤を重ねた結果、非常に驚異的な成果を得ました。わずか100〜200ステップでさえ、概念を習得し、ベース強度1に対する高低の強度設定は常に大きな影響を及ぼします。しかし、常にいくつかの要素が残り、トレーニングに使用された画像の特定の部分(例:黄色い服だけを抽出したいが、その他は一切使わない)だけを選び取るように感じられます。

これまでに約30のLoRAを作成しました(すべてテスト目的)。わずか数枚の画像でこれほどまでに多様な結果が得られることに驚愕しています。

単なる偶然かもしれない。谁知道呢。

このモデルで生成された画像

画像が見つかりません。